[fess-user 21] Re: 検索されない PDF があります。

Back to archive index

Shinsuke Sugaya shins****@yahoo*****
2009年 11月 27日 (金) 21:26:33 JST


菅谷です。

確認ポイントとしては、対象クロールセッションにおいて
fess.out でその PDF がクロールされているかを確認して
いただくと良いかと思います。

> 「何かエラーが出ているような気がします」のスレッドで対処してい
> ただいた修正で直る可能性はありますか?

その状況ですと、クロールスレッドが終了したと思われるので、
クロール自体が正常終了していない気がします。ですので、
直る可能性はあるかと思います。

あと、1.2系のスナップショットはまだ大胆に開発しているので
上記のようなことに遭遇する可能性はあるかと思います。一方
1.1系のスナップショットは必要最小限の変更にしているので、
安定していると思います。一応、今までいただいた情報の修正は
1.1系に反映してあると思います (2つあると修正が手間なので
早く1.2系にしたいところですが…)

shinsuke


2009年11月27日19:38 Masayuki Shibata <mshib****@shima*****>:
> 柴田@亀岡市です。
>
> 以前「PDF 内の文字列検索」のスレッドで報告していたのと多分同じ
> 現象なのだと思いますが、絶対クロール範囲にあるはずの PDF でヒ
> ットしていないものがあります。
>
> この PDF は以前はヒットしていたもので、何度かスナップショット
> をいただいているごとにインデックスを1から作り直しているのです
> が、今回作成したインデックスから漏れたようです。
>
> 以前も1からインデックス作り直したら直ったので、これも作り直し
> たら直りそうですが、どこかの時点で何らかの原因で作り損ねて、そ
> れ以降ヒットしないものができてしまうなら、それはちょっと問題か
> と思います。
>
> 一回は失敗してスルーするけど、次にインデックス作成時に拾えるな
> らよいのですが、どうもそういうこともなさそうな雰囲気です。
>
> 以前はヒットしていたので、PDF を作るのに使ったツールの差という
> のでもありません (Acrobat 5 の Distiller で作った純正 PDF で発
> 生してますし)。
>
> 検索対象の PDF が多いので気づいただけで PDF に限定されない現象
> かも知れませんが...
>
> 「何かエラーが出ているような気がします」のスレッドで対処してい
> ただいた修正で直る可能性はありますか?
>
> 何か調査した方がよいものがありましたらお知らせください。
>
> ----------
> Shibata, Masayuki
> Manager, Software Development
> Shimadzu Corporation
> Analytical Measuring Instruments Division
> Research & Development Department
> Telephone:  075-823-1441 Japan
> Facsimile:  075-823-1365 Japan
> E-mail: mshib****@shima*****
>
> _______________________________________________
> Fess-user mailing list
> Fess-****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>




Fess-user メーリングリストの案内
Back to archive index