誤り分析に基づく日本語事実性解析の課題抽出

成田和弥, 水野淳太, 上岡裕大, 菅野美和, 乾健太郎 - 自然言語処理, 2015 - jstage.jst.go.jp
成田和弥, 水野淳太, 上岡裕大, 菅野美和, 乾健太郎
自然言語処理, 2015jstage.jst.go.jp
抄録 事実性は, 文中の事象の成否について, 著者や登場人物の判断を表す情報である.
事実性解析には, 機能表現や, 文節境界を越えて事実性に影響を与える語とそのスコープなどの 4
種類の問題が含まれており, 性能の向上が容易ではない. 本研究では, 事実性解析の課題分析を
行うために, 機能表現のみを用いたルールベースの事実性解析器を構築し, 1,533 文に含まれる
3,734 事象に適用した結果の誤りを分析した. このとき全ての事象表現について,
付随する機能表現に対して人手で意味ラベルを付与した. その結果, 主事象の事実性解析について …
抄録
事実性は, 文中の事象の成否について, 著者や登場人物の判断を表す情報である. 事実性解析には, 機能表現や, 文節境界を越えて事実性に影響を与える語とそのスコープなどの 4 種類の問題が含まれており, 性能の向上が容易ではない. 本研究では, 事実性解析の課題分析を行うために, 機能表現のみを用いたルールベースの事実性解析器を構築し, 1,533 文に含まれる 3,734 事象に適用した結果の誤りを分析した. このとき全ての事象表現について, 付随する機能表現に対して人手で意味ラベルを付与した. その結果, 主事象の事実性解析については, 機能表現の意味ラベルが正しく解析できれば, 現在の意味ラベルの体系と本研究で用いた単純な規則だけでも, 90% に近い正解率が得られることがわかった. 従属事象の事実性解析では, 後続する述語やスコープといった従属事象特有の誤りが多く見られた. それらの要素についてさらなる分析を行い, 今後の事実性解析の指針を示した.
jstage.jst.go.jp
Showing the best result for this search. See all results