morit****@razil*****
morit****@razil*****
2005年 8月 17日 (水) 05:45:34 JST
sennaのSJISサポートを強化しました。(revision 35) 従来はEUCでしか全角/半角,大文字/小文字の正規化が使用できなかったのですが、 SJISでもこれが指定可能となりました。 (sen_index_create()の第3引数にSEN_INDEX_NORMALIZEを指定します。) なお、SJISインデックスを作成する場合は、mecabのmake時に、 ./configure --with-charset=sjis を指定するなどして、SJISで辞書を作成する必要があります。 (http://chasen.org/~taku/software/mecab/ 参照) また、mysql + sennaでSJISインデックスを作成する場合は、 /var/senna/senna.conf という名前のテキストファイルを作り、 DEFAULT_ENCODING sjis と書いておく必要があります。 (http://qwik.jp/senna/9.html 参照) -- morita