Group.pl________________________ユーザコマンド______________________Group.pl_
【名前】
Group.pl − 語彙 ・ 文法知識登録
【形式】
Group.pl
【機能説明】
Group.pl コマンドは、 標準入力から語彙 ・ 文法知識の同一語管理環境を
作成するための前準備のコマンドで、 基礎知識である EDR 日本語単語辞書から
同一語判定情報を抽出し出力する。
基礎知識を同一語ごとにグループ化する仕様は、 「読み」、 「品詞」、 そし
て「概念」が同一のものを同一語と判定することとしている。 但し、「読み」
に関しては 「長音記号」や「ッ」の有無など同じ語でもかなり異なる表現があ
る。 そこで、 本コマンドによって 「読み」 を縮退させ出力する。
入力は、 EDR 日本語単語辞書。
出力は、入力データに概念識別子、品詞、縮退した読みなどを付与したもの。
この出力データをソートしたものを GTable.pl に入力し、 同一語ごとのグルー
プ分けが済むことになる。そして、最後に、InitGROUP コマンドによって、その
グループ分けされたデータから同一語知識環境を構築することになる。
【使用例】
% cat /CDROM/JWD.DIC | Group.pl > /tmp/,jwd.g
【環境】
Group.pl は、 Perl スクリプトであり、 「/usr/local/bin/jperl」 に
Perl の実行形があるものとしている。
【関連項目】
GTable.pl : 基礎知識のグループ化コマンド (グループ分け)
Last change: 1998 年 1 月 9 日