Toshinobu OGISO
ogiso****@ogiso*****
2012年 12月 21日 (金) 00:36:21 JST
工藤様 小木曽です。 > UniDicのOSSでの公開、ありがとうございます。研究者のみならず、企業でも自由に使える辞書ができたことをとてもうれしく思います。 ライセンス関連の面倒がなくなりましたので、ぜひ、多くの方にお使いいただきたいと思います。 広く応用されてUniDicベースの言語資源やツールが増えることを期待しています。 # UniDic版のGoogle日本語n-gramなんていうのがいつか実現したら嬉しいです。 > 一つ提案がございます。今のUniDicのパラメータはBCCWJコーパスから学習されていると思いますが、学習データをBCCWJコーパスから生成・抽出するためのスクリプトなどがあれば、それも同パッケージに含めていただけるとモデルの再現性という意味で喜ばれるのではないかと思います。いかがでしょうか。 ご提案ありがとうございます。 公開中のUniDicはBCCWJ以外のコーパスも利用していますのでそのまま再現はできませんが、BCCWJだけでも精度は出ると思います。 BCCWJの利用価値も高めることにつながると思いますので、前向きに検討したいと思います。 今後ともどうぞよろしくお願いします。 -- 小木曽 智信 (おぎそ としのぶ) ogiso****@ogiso*****