Shinsuke Sugaya
shins****@yahoo*****
2013年 7月 31日 (水) 13:42:27 JST
菅谷です。 標準ではPDFからテキストが抽出できるかどうかは Apache のPDFBoxに依存しています。ですので、 PDFBoxで取得できていないのだと思われます。 対策としては、pdf2txtのコマンド呼び出しに変えるとかで、 PDFBox以外の方法で試してみるとかかと思います。 もし、ネット上とかからその問題のPDFが取得できるようで あれば、PDFBox等で何とかなるものかどうかを 確認することも可能です。 よろしくお願いいたします。 shinsuke 2013年7月30日 13:45 兼安勉 <kaney****@skyco*****>: > はじめまして。兼安と申します。 > > PDFファイルのみを配置しているフォルダを > 「ファイルシステムクロールの設定」 > でクロールさせました。 > > その後、検索したのですが、一部のPDFファイルについて > PDFファイルの内容を表示する部分だけが文字化けしております。 > (以下、文字化けの一部) > > === > ???????? 2013? 5? ????????? ???? ???? ?? ???? 2012/09/08 0.0.1... ??????? > === > > このような場合、どのような対応すべきかご教示いただければと思います。 > この情報だけでは分かりずらいかと思いますが、 > その際はどこの情報を記載すべきでしょうか? > > > > _______________________________________________ > Fess-user mailing list > Fess-****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/fess-user >