日英対訳文対応付けデータ 内山 将夫 mutiyama@nict.go.jp * データの説明 index.html * 主要ディレクトリの説明 org オリジナルの日本語文と英語文 *e.txt 英語作品 *j.txt 日本語作品 manual-alignment 手作業で対応付けた対訳データ *.alm 対訳文 *.alb 文献情報 *_alb.txt *.alb へのリンク alml 対訳データをXML風形式に変換したもの corrected-alml almlを修正したもの (配布データにおいては alml に統合済みのため同梱していない) * 注意 manual-alignment => alml の変換プログラムは不完全であり,そのた めに文対応が正しくとれていないものがたまにある. これに対処するための原理的な方法は,manual-alignment/の下のデー タについて,日本語か英語かどうかのマークアップを完全にすること である.あるいは,もっと良いプログラムを書くという方法もある. とりあえず,corrected-alml に修正ファイルを入れておき,それを alml に置き換えることにする.alml には,置き換えたものを置く. * 著作権について オリジナルの各作品の著作権は,それぞれの作品の著作権に従います. その他のものについては * Creative Commons Attribution-ShareAlike 3.0 Unported に従い,それらの著作権は情報通信研究機構多言語翻訳研究室が保持し ます.なお,オリジナルの作品が二次配布を禁止している場合には,そ こからの派生物(対訳データなど)も二次配布することを禁止します. また,オリジナルの作品が営利目的の利用を禁止している場合には,派 生物の営利目的の利用も禁止します. -- 第1版:2003年5月21日 修正:2004年5月10日 修正:2004年10月19日 修正:2005年2月4日 修正:2005年5月11日 修正:2012年2月14日