[fess-user 768] Re: 文字化けについて

Back to archive index

Shinsuke Sugaya shins****@yahoo*****
2013年 7月 31日 (水) 13:42:27 JST


菅谷です。

標準ではPDFからテキストが抽出できるかどうかは
Apache のPDFBoxに依存しています。ですので、
PDFBoxで取得できていないのだと思われます。

対策としては、pdf2txtのコマンド呼び出しに変えるとかで、
PDFBox以外の方法で試してみるとかかと思います。
もし、ネット上とかからその問題のPDFが取得できるようで
あれば、PDFBox等で何とかなるものかどうかを
確認することも可能です。

よろしくお願いいたします。

shinsuke


2013年7月30日 13:45 兼安勉 <kaney****@skyco*****>:
> はじめまして。兼安と申します。
>
> PDFファイルのみを配置しているフォルダを
> 「ファイルシステムクロールの設定」
> でクロールさせました。
>
> その後、検索したのですが、一部のPDFファイルについて
> PDFファイルの内容を表示する部分だけが文字化けしております。
> (以下、文字化けの一部)
>
> ===
> ???????? 2013? 5? ????????? ???? ???? ?? ???? 2012/09/08 0.0.1... ???????
> ===
>
> このような場合、どのような対応すべきかご教示いただければと思います。
> この情報だけでは分かりずらいかと思いますが、
> その際はどこの情報を記載すべきでしょうか?
>
>
>
> _______________________________________________
> Fess-user mailing list
> Fess-****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>




Fess-user メーリングリストの案内
Back to archive index