Naoya Murakami
visio****@gmail*****
2014年 4月 11日 (金) 12:48:20 JST
村上です。連投ですいません。 通勤中にささっと書いたので、ちょっとミスがあったので、訂正、補足しておきます。 ただし、アルファベットをバイグラムし、且つ、前方一致検索は、結構早い段階で検索速度 > が劣化し始めるはずです。(おそらくデータサイズが10GiBぐらいで数秒〜10秒とかになるかも。) > アルファベットをバイグラムにして検索性能が劣化するのは、英語文章等、アルファベットが主体の 場合ぐらいです。 日本語文章でたまにアルファベットがでてくるような場合であれば、さほど影響はないでしょう。 このあたりは、利用される環境、用途に応じて、検討すればいいと思います。 巷のある程度の規模で全文検索を使っているサービスは、検索クエリが二文字以上、 > または、三文字以内という制約を設けているところも多いと思います。 > × 三文字以内 ⇒ ○三文字以上 >勝手に答えてまずいことなんかなにもありません! >開発者じゃなくても知らない人がいたら知っている人が助ける場に >なってすばらしいと思います!これからも知っていることだったら >ぜひ回答してください! いろいろ親切に教えていただいたので、それで得た知識はできるだけ共有させて いただいて、Mroonga(Groonga)の普及に協力したいと思っています。 以上、よろしくお願いします。