[prime-dev: 191] Re: 交ぜ書き辞書のサポート

Back to archive index

Hiroyuki Komatsu komat****@taiya*****
2004年 1月 28日 (水) 15:35:41 JST


At Wed, 28 Jan 2004 14:41:08 +0900,
akira yamada wrote:
> たとえば、「陰陽師」のようなのだと
> 正確には「陰」=「おん」、「陽」=「みょう」ではないでしょうが、
> 「おん陽師」や「おんみょう師」などから「陰陽師」を求められるといいな
> と思うのはなんとなく分かってもらえると思います。

はい。僕もそこまでやれたらいいなと思っています。


> 一文字ごとに辞書引きしてみたところですと、
> せっけい→設計のように「っ」が入る語、
> めんどう→面倒、ぜんぱん→全般のようににごる語、
> 時計、暢気など、陰陽師と同じようなケースが
> うまくないようです。
> 
> # めちゃくちゃおおざっぱなスクリプトを書いて調べたもので、
> # ノイズがかなり入ってしまっていますが、
> # スクリプトと結果を以下に置いておきます。
> # http://arika.org/tmp/t1.rb prime-dictをgdbmにする
> # http://arika.org/tmp/t3.rb 辞書引きする
> # http://arika.org/tmp/t3.txt 結果

拝見しました。27,000語に失敗していますね。結構多い数ですね。

うーん、個別に辞書に登録していくだけでなく、新しいアルゴリズムも
考えた方がよさそうかなあ…。

--
                                                            小松弘幸
                                                -----------------------
                                                   http://taiyaki.org/

> 愛憎後知恵

これ、どういう意味ですか? (^^;




Prime-dev メーリングリストの案内
Back to archive index