NICT-EDRシンポジウムの詳細案内
表記のシンポジウムにつきまして、プログラムの詳細などが決まりましたので、
ご案内させていただきます。
すでに参加申し込みくださいました方々も新たに懇親会の案内が付加されていま
すので、その部分もお申し込みいただける場合はお手数でも追加でお知らせくださ
いますようお願いいたします。
これからお申し込みの場合は、下記内容をご検討の上、よろしくお願いいたします。
独立行政法人 情報通信研究機構 (NICT)
知識創成コミュニケーション研究センター
自然言語グループ 井佐原均
1. 日時 2007年4月4日(水曜日)
2. 概要
2.1 シンポジウム(10:00-17:50 受付 9:30から)
@会場:キャンパス・イノベーションセンター(CIC) 1階 国際会議室
東京都港区芝浦3-3-6 <交通>JR山手線・田町駅下車芝浦方面1分
http://cic-hp.zam.go.jp/tokyo/access.php
http://www.zam.go.jp/e00/images/e0000906.jpg
A会費:1000円(予稿集相当)
2.2 懇親会(18:15-20:15)
@会場:同じ国際会議室にて
A会費:5000円
※ 料理予約の都合上、事前申し込みをお願いします。
料金は当日シンポジウム受付時にご一緒にお願いします。
3. 参加申し込みについて
会場の席数や予稿集の印刷部数の関係上、なるべくお早めにお申し込みいただけ
ると助かります(受付名簿作成上、3月28日までにお申し込みいただければと思いま
す。会場に余裕がある場合はそれ以降でも当日でも申し受けます)。
以下の形式にてお願いします。
電子メールアドレス: edr_info@jsa.co.jp
お名前:
ご所属:
E-mail:
TEL :
( ) EDR利用契約関係者の場合は左欄に○を入れてください。
参加内容に○を付けてください。
( )シンポジウムのみに参加します。
( )シンポジウム、懇親会ともに参加します。
4.2 プログラム詳細
【NICTおよびEDR電子化辞書に関して】[10:10-10:50]
1. EDR電子化辞書の現状とNICTの自然言語処理研究
井佐原均(NICT)
EDR電子化辞書の利用状況、改良状況などについて報告する。また、NICTにおける自
然言語処理研究と言語資源の開発について述べる。
【デモ紹介】
2. 文解析システム向け概念体系とEDR概念体系の比較および単語のリンク
[10:50-11:05]
植田禎子*, 大久保佳子, 小林正博(JSA)
著者らが開発している言語解析システムでは、独自の意味分類体系を構築して解析
に利用している。今回、その言語解析で使用されている意味分類体系とEDR概念体系
を照合した。
さらに、二つの体系を重ね合わせることで、それぞれの体系に結び付
けられている単語のリンクを試みた。これにより、当システムの言語解析の結果に、
EDRの概念識別子を付与することができるようになった。リンク作業において、発生
した問題点と、付与結果を提示する。
3. 日本語学習支援システム開発とEDR辞書 [11:05-11:20]
仁科喜久子*, 吉橋健治, 傅亮(東京工業大学)
EDR辞書を利用した日本語学習読解支援システム「あすなろ」と日本語作文支援シス
テム「なつめ」についてデモンストレーションを行う。
「あすなろ」は日本語学習者が日本語文を理解するためのシステムである。入力
された日本語文をChaSenで形態素解析した結果の形態素、さらにEDR辞書がもつ複合
要素に対応する形態素があれば、それを英語で意味表示する。
また「なつめ」では、学習者が日本語作文をするために参照できる共起表現およ
び例文を示すに当たって英語での意味表示にEDR辞書を用いている。
【研究発表】
【EDR電子化辞書の拡張研究】
4. 概念説明を用いたEDR概念体系の誤り検出 [13:15-13:45]
山本英子*, 井佐原均(NICT)
EDR電子化辞書に登録されている概念には概念識別子とともに、その概念の意味を説
明する「概念説明」が付与されている。本研究では、EDR電子化辞書を改良するため
に、概念説明を用いて概念体系の誤りを検出することを試みた。
具体的には、同じクラスにある概念の概念説明の末尾を比較することで、そのクラスに適していない
概念を検出する。概念体系の改良のため、このような概念に対し、概念説明を半自
動で修正する方法、また概念を再配置する方法を提案する。実験では、概念「人間
」の下位にある概念のうち、「〜で捉えた人間」といったパターンに当てはまる概
念説明を持つ概念の直下に配置されている下位概念について調査し、誤りを検出す
る。その結果を分析し、提案手法の適用可能性を評価する。
5. EDR日英辞書の中国語への拡張 [13:45-14:15]
張玉潔 1*, 馬青 1,2, 井佐原均 1 (1: NICT, 2:龍谷大学)
日中機械翻訳システム開発の一環として、日中翻訳辞書を構築している。本稿は、
EDR日英辞書からEDR日英中辞書への中国語化プロジェクトを紹介する。
具体的には
、翻訳対象、翻訳基準、中国語訳語に付与する情報および作業の補助ツールについ
て述べる。現段階では、頻度の高い日本語単語(JUMANの日本語単語リストと重なる
部分)を含め、約10万個のレコードが中国語化された。
6. 共起辞書から結合価辞書へ [14:15-14:45]
荻野孝野 1*, 小林正博 1, 井佐原均 2 (1:JSA, 2:NICT)
著者らは、EDR共起辞書とEDRコーパスを用いて、動詞概念の異なりで約12,400概念
、延べで約155,000概念、「表記+読み」を1単位として数えて約9,400見出しの動
詞について、係り受け関係を抽出し、例文型の結合価データからなる「日本語動詞
の結合価」を作成した。
さらにこれを発展させて、現在、結合価の体言部分をEDR
概念体系の中間ノードで汎化することと、意味的役割を付加することを行っている
。意味的役割の付加として、EDR概念記述でゆれのみられる関係子を統一化していく
作業を行っている。これは、EDR電子化辞書を出発点として、動詞にかかる結合価情
報を意味的役割まで広げ、昨今、研究が進みつつあるWEBからの事象間概念関係など
の分析にも有用なデータとなることを目指すものである。
7. 文法抽出を目的としたEDRコーパスへの構文情報の付与 [14:45-15:15]
野呂智哉 1*, 橋本泰一 1, 徳永健伸 1, 田中穂積 2
(1:東京工業大学大学院情報理工学研究科, 2:中京大学情報理工学部)
構文解析のための大規模文脈自由文法を開発する手法として、Penn Treebankコー
パスのような構文木(句構造)付きコーパスから自動抽出する手法がある。英語等で
は、この手法により抽出した文法を利用して様々な研究が進められているが、日本
語では構文木付きコーパスがなく、文法開発が困難であった。
EDRコーパスには構文情報として句のまとまりを表す括弧付けが行われているが
、文法抽出には各まとまりに対して非終端記号を付与する必要がある。EDRコーパ
ス中の各括弧付けに対して適当な非終端記号を付与すれば大規模日本語文法を開発
することができるが、その文法で構文解析を行うと多数の解析結果(曖昧性)を作り
出すという問題もある。そこで我々は、抽出した文法による曖昧性を抑えることを
考慮しながら、EDRコーパスに対して構文情報の付与を行った。
【EDR電子化辞書の利用研究】
8. 意味解析が開く自然語処理の世界 [15:45-16:15]
原田実 (青山学院大学)
これまでの自然言語処理は、形態素解析、係り受け解析までが実用域に達している。
今回我々が開発したSAGEによって(辞書にEDRを使用)、意味解析が実用域に達し、
自動要約、質問応答、内容検索、文分類、テキストマイングなどが意味や語の役割
をベースにした高度なものに進化する。そのいくつかを紹介する。
9. EDRコーパスを用いた深層格選好に基づく照応解析手法 [16:15-16:45]
渋木英潔 1*, 荒木健治 2, 桃内佳雄 3, 栃内香次 4
(1:北海学園大学ハイテク・リサーチ・センター, 2:北海道大学大学院情報科学研
究科, 3:北海学園大学工学部 , 4:北海学園大学経営学部)
深層格選好に基づく照応解析手法を紹介する。
本手法は単文における深層格推測手
法を照応解析に応用したものである。深層格選好に基づく推測では、ある名詞があ
る動詞に格支配される際に担う深層格の傾向を手がかりに推測するため、名詞-動
詞間の表記上の単語距離や助詞などの文法語の情報を必要とせずに推測することが
可能である。したがって、本手法は、文章中の単語をキーワードスポッティング的
に認識し、深層格選好により推測することで文の単位にとらわれずに照応解析を試
みるものである。深層格選好はEDRコーパスのタグから自動的に確率として学習さ
れる。しかしながら、深層格選好のみでは一意に候補を絞り込むことが困難である
ため、推測時の話題性の強さを活性値として表現し利用することで絞り込みを行っ
ている。
10. 適合的汎化に基づく情報検索システムの実験的研究 [16:45-17:15]
吉岡真治*, 原口誠 (北海道大学大学院情報科学研究科)
情報検索システムを利用する検索者にとって、適切なキーワードを選択することは
必ずしも容易なことではない。この問題に対し、本研究では、検索者にも理解しや
すい概念階層の抽象化による検索語拡張を、(疑似)関連文書として与えられたユー
ザの検索意図を考慮しながら行う適合的汎化という考え方を提案している。
また、
この考え方に基づいた情報検索システムを、EDR電子化辞書の概念階層データを利
用して構築している。
本発表では、汎化概念の関連文書における網羅性に注目し、
検索に役に立つと考えられる汎化概念を明示化するインタフェースの作成について
報告する。また、この網羅性に注目することにより、検索意図をより明確に表現す
るBoolean検索式の構築の支援とWeb 検索への応用についても述べる。
11. EDR電子化辞書の概念体系を用いた創造的デザイン研究 [17:15-17:45]
田浦俊春1,2*, 永井由香里2 (1:神戸大学, 2:北陸先端大学院大学)
創造性に関する研究では、思考空間によって生じる変化が大きな創造性を生むとし
ている。しかし、実際のデザイン行為において、思考空間のどのような特徴が創造
性に影響を与えているのかは明らかにはなっていない。まして、思考空間をどのよ
うに観測してよいか、その方法も確立していない。
本研究では,デザイン行為中に考えたことをデザイナーにそのまま声に出して発
話させ、それを記録し、記録された単語(名詞)間の距離を、EDR辞書を用いて算
出することで、思考空間を定量化することを試みた。その結果、思考空間の拡張の
程度と創造性には強い相関のあること、および、創造性に有効な思考空間の拡張に
は、概念間の関係として最近注目されている主題的関連が関係していることが明ら
かになり、創造的デザインの支援のために有益な知見を得ることができた。