ダウンロード
対訳文章を読めるようなHTMLページを含むデータ.なお,これらのHTMLページには元データへのリンクがありますが,それらのリンクは切れていたり,データ作成当初とは異なるページである場合があることを御了承ください.(データを作成したのが2007年なので)
align-070215.zip
(44.2 MB)
align-070215.tar.gz
(42.8 MB)
行対応のとれた日英ファイル(上記データには含まれない):
Sample: (
日本語ファイル
/
英語ファイル
)
Download:
para.zip
(6.2 MB)
日本語テキストは ChaSenにより分割した.
統計量:
日本語:160ファイル, 117983行, 2388273形態素
英語:160ファイル, 117983行, 1406675単語
ホーム