大域的な並べ替えによるサブ言語翻訳の高精度化

富士秀, 内山将夫, 隅田英一郎, 松本裕治 - 自然言語処理, 2017 - jstage.jst.go.jp
富士秀, 内山将夫, 隅田英一郎, 松本裕治
自然言語処理, 2017jstage.jst.go.jp
抄録 法律文書や技術文書等の専門文書に対する機械翻訳では, 翻訳対象のサブ言語に特有の
大域的な文構造を適切に捉えて翻訳することが高品質な訳文を得る上で必要不可欠である.
本論文では, 文内の長距離な並べ替えに焦点を当てることによって, 大域的な並べ替えを行うための
手法を提案する. 提案する大域的並べ替え手法では, アノテートされていない平文学習データを対象
として, 構文解析を行うことなく大域的な並べ替えモデルを学習する. そして, 大域的な並べ替えを
従来型の構文解析による並べ替えと併用することによって, 高精度な並べ替えを実現する …
抄録
法律文書や技術文書等の専門文書に対する機械翻訳では, 翻訳対象のサブ言語に特有の大域的な文構造を適切に捉えて翻訳することが高品質な訳文を得る上で必要不可欠である. 本論文では, 文内の長距離な並べ替えに焦点を当てることによって, 大域的な並べ替えを行うための手法を提案する. 提案する大域的並べ替え手法では, アノテートされていない平文学習データを対象として, 構文解析を行うことなく大域的な並べ替えモデルを学習する. そして, 大域的な並べ替えを従来型の構文解析による並べ替えと併用することによって, 高精度な並べ替えを実現する. 公開特許公報英文抄録 (Patent Abstracts of Japan, PAJ) のサブ言語を対象とした日英翻訳および英日翻訳の評価実験を行ったところ, 両言語方向において, 大域的な並べ替えと構文に基づく並べ替えを組み合わせることによって翻訳品質向上が達成できることがわかった.
jstage.jst.go.jp