hamada
bungu****@leo*****
2004年 12月 9日 (木) 09:42:16 JST
こんにちわ。 On Wed, 8 Dec 2004 18:33:01 +0900 "secondbrain" <oscml****@secon*****> wrote: > 実は、GETAは連想検索用に別途インデックスファイル(のようなもの)を作成する必要があり、 > そのための管理画面側の機能として、makewam.phpというものがあります。 > また、geta_workというディレクトリにPERLスクリプトやらSHELLスクリプトやらを > まとめているので、そのあたりも必要になります。 当方概ねnamazuのイメージで見てたんですが、これはそんなに間違ってないイメー ジだったみたいですね。 インデックスを別途作るなら、(現行のスクリプトに要らん手を加えなくて済む ので)むしろ手間がかかりません。有り難いです(^_^) > ただ、「似た」という部分の判定は、あくまで同一文書内での単語同士の出現頻度 > に依存しますので、別途判定基準となるシソーラスがあるわけではないのが > ミソです。(要するに商品情報の内容だけが判断要素となっているのです。) あ、「単語の出現頻度」で判定してるんですか! 実は当方、連想検索フォームに(沢山打ち込むのがめんどくさいので:^^;)「単 語」を入れてみたところ「その単語」が含まれる商品しか引っかからないような 気がする→「??」とか思ってたんですが、頻度判定ということなら納得です。 つまり、連想検索は「文章」つーか「単語群」検索で真価を発揮するということ で、検索フォームよりも(長めの)商品説明文で「自動クロスセール」をさせる ような用途にこそ向いているってな感じなんですね。 う〜む、面白そう。 > 少し時間に余裕ができたら、GETAの部分だけのパッケージを > 作ってみたいと思います。 う〜む。作業量やタイミング(業種上、これからしばらく忙しい)をみるに、現 在のKoshoten.net2をHackして必要部分を移植するか、上記パッケージのリリース を待つか、結構びみょーな感じかもしれません(^_^;) GETA自体は汎用の「エンジン」ですから、作り込む必要があるのはosCと連係す る部分+αだけで良いハズ→たぶんその気でやりゃあできなくはない作業だと思 うんですが、車輪を2度も3度も発明するのも馬鹿らしいし。 > 特に書籍は書名だけではわからない関連性があり、 > 古書店の方々はそのあたりのノウハウを十分に持っているので、 > 上手く機能すれば、とても面白い効果が得られるのではないかと思っています。 ノウハウ…要りそうですねぇ(^_^;) 「単語群の分布」がミソということは、判定材料となる「(入力)データの文章 表現」(同じ事象を表現するのに同じ単語を使うような)にも気を遣う必要があ るってことですしねぇ。う〜む。 > もしご利用いただけましたら、 > ご感想をいただければ幸いです。 とりあえず、パッケージは頂いてまいりました(^_^) テスト&中身解析は今週 末を予定してます。 はまだ