[fess-user 567] 単一ページのクローリング

Back to archive index

Norihito Yamakawa nyama****@gmail*****
2012年 5月 16日 (水) 10:44:07 JST


こんにちは、山川と申します。

最近Fessを利用し始めさせて頂いていて、
便利に使っています。ありがとうございます。
Office文書やPDFも検索できるのは凄いです!
lucene-gosen利用設定の方が利用者には評判良いみたいなので、それで利用しています。

本題なのですが、
Fessを利用する場合に、Webなりファイルなりのクローリング設定をした後、
クローリング対象のファイルのどれかが更新された!
でもファイルが一個しか更新されていないのに全体クローリングをもう一回やるのはコスト的に微妙!
というときに、更新された分だけの検索インデクスを更新するのに、何か良い方法はないでしょうか?

FessのSolrスキーマだけ使って Solrj なりのSolrのAPIで直接登録するような形で
登録部分を別に作ってしまった方が良いのでしょうか?
(でも、FessXpathTransformerはデータ整形の統一のため共用したいです。。)

いまのところ、クロウラのコマンドラインインターフェースのほうで
ID指定でクロウラ設定毎にクローリングができるみたいなので、
それを利用させて頂くかな、、というのも考えておりますが、
何か良い方法があればご助言頂けると幸いです。

(あとnamazuを機械的に置き換えてFessにJSONでやりとりするためだけの検索CGIインターフェースを
 作ったんですが、そういうのって需要ありますでしょうか。。)




Fess-user メーリングリストの案内
Back to archive index