Toshinobu OGISO
ogiso****@ogiso*****
2010年 10月 27日 (水) 11:21:02 JST
(重複して受け取られた場合はご容赦ください) 国立国語研究所の小木曽と申します。 私どもは、UniDicをもとにした歴史的な資料を対象とした形態素解析辞書を開 発してきましたが、このたび新たに「中古和文UniDic」ver.0.5を公開しました。 中古和文UniDicは日本語形態素解析辞書UniDicをもとにして平安時代の仮名文 学作品をはじめとする和文系の資料(いわゆる古文)を解析できるようにした 形態素解析辞書です。「短単位」や「見出しの階層構造」などのUniDicの特長 をそのまま引き継いでいます。見出し語や品詞体系は、他のUniDic(現代語用 のUniDic,近代文語UniDic)と互換性があります。 校訂され仮名遣いなどもよく整備された本文であれば、96〜98%程度の精度で 解析できています。 中古和文UniDicは次のページから無償でダウンロードできます。 http://www2.ninjal.ac.jp/lrc/index.php?UniDic%2F%C3%E6%B8%C5%CF%C2%CA%B8UniDic (http://bit.ly/avNQWY) 形態素解析システム「和布蕪(MeCab)」で利用できるUTF-8版の辞書を公開し ています。また、簡単に利用できるようにまとめたWindows用のパッケージを 用意しています。 ぜひお試しください。 -- 人間文化研究機構国立国語研究所 言語資源研究系 小木曽 智信 (おぎそ としのぶ)