サンプリング生成に基づく複数逆翻訳を用いたニューラル機械翻訳

今村賢治, 藤田篤, 隅田英一郎 - 人工知能学会論文誌, 2020 - jstage.jst.go.jp
今村賢治, 藤田篤, 隅田英一郎
人工知能学会論文誌, 2020jstage.jst.go.jp
目的言語の単言語コーパスを利用する一つの方法は, RNN 言語モデルを構築し,
デコーダーモデルの一部として組み込む方法である [Gülçehere 15]. 同様な方法として,
目的言語の言語モデルもマルチタスク学習で同時に構築する方法もある [Domhan 17]. どちらも,
デコーダーの強化を行うもので, NMT の改造を必要とする. 目的言語の単言語コーパスを利用する
もう一つの方法は, 疑似対訳文を生成して学習する方法である.[Sennrich 16a] の方法は,
単言語コーパスを逆翻訳し, 疑似対訳文を生成して学習する. 本稿の提案方式は …
目的言語の単言語コーパスを利用する一つの方法は, RNN 言語モデルを構築し, デコーダーモデルの一部として組み込む方法である [Gülçehere 15]. 同様な方法として, 目的言語の言語モデルもマルチタスク学習で同時に構築する方法もある [Domhan 17]. どちらも, デコーダーの強化を行うもので, NMT の改造を必要とする. 目的言語の単言語コーパスを利用するもう一つの方法は, 疑似対訳文を生成して学習する方法である.[Sennrich 16a] の方法は, 単言語コーパスを逆翻訳し, 疑似対訳文を生成して学習する. 本稿の提案方式は, この方法の拡張である.[Currey 17] は, 目的言語を原言語にコピーして疑似対訳文を生成した. この方法は, 固有表現などは逆翻訳しなくても同一単語を使用すればよいという特徴を利用している. しかし, この方法は, 文字体系が異なる言語対 (例えば日英など) では明らかにメリットはない. 逆翻訳法の発展形態には, 疑似原文の生成にサンプリングを用いる方法 [Imamura 18a, Edunov 18], 最尤翻訳結果にノイズを加える方法 [Edunov 18] が提案されている. 本稿は [Imamura 18a] の方法を発展させたものである.[Edunov 18] は,[Imamura 18a] の方法を再提案するとともに, サンプリング対象を確率上位の語に限定する
jstage.jst.go.jp
Showing the best result for this search. See all results