Re: 文字化けについて (fess-user 768) - Fess

菅谷です。

標準ではPDFからテキストが抽出できるかどうかは
Apache のPDFBoxに依存しています。ですので、
PDFBoxで取得できていないのだと思われます。

対策としては、pdf2txtのコマンド呼び出しに変えるとかで、
PDFBox以外の方法で試してみるとかかと思います。
もし、ネット上とかからその問題のPDFが取得できるようで
あれば、PDFBox等で何とかなるものかどうかを
確認することも可能です。

よろしくお願いいたします。

shinsuke


2013年7月30日 13:45 兼安勉 <kaney****@skyco*****>:
> はじめまして。兼安と申します。
>
> PDFファイルのみを配置しているフォルダを
> 「ファイルシステムクロールの設定」
> でクロールさせました。
>
> その後、検索したのですが、一部のPDFファイルについて
> PDFファイルの内容を表示する部分だけが文字化けしております。
> （以下、文字化けの一部）
>
> ===
> ???????? 2013? 5? ????????? ???? ???? ?? ???? 2012/09/08 0.0.1... ???????
> ===
>
> このような場合、どのような対応すべきかご教示いただければと思います。
> この情報だけでは分かりずらいかと思いますが、
> その際はどこの情報を記載すべきでしょうか？
>
>
>
> _______________________________________________
> Fess-user mailing list
> Fess-****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>

[fess-user 768] Re: 文字化けについて