[fess-user 349] Re: ファイルシステムクロール時のrtfドキュメントの文字化けについて

Back to archive index

Shinsuke Sugaya shins****@yahoo*****
2010年 10月 10日 (日) 10:47:19 JST


菅谷です。

だいぶ時間が経過してしまいましたが、Apache Tikaに
対してパッチを送りましたので、それが適用されれば
Fess 4.0 では最新のTikaを利用することで本件の対応と
したいと思います(取り込まれなければ独自に修正します)。
ですので、Fess 4.0 では修正されている予定です。
よろしくお願いいたします。

shinsuke


2010年8月10日10:16 Shinsuke Sugaya <shins****@yahoo*****>:
> 菅谷です。
>
> 情報をありがとうございます。
> Shift_JIS で扱われているためと思われます。
> 対策を検討したいと思います。
>
> shinsuke
>
>
> 2010年8月9日23:30  <lvisd****@gmail*****>:
>> お世話になります。
>> 加納です。
>>
>> rtfドキュメントに対して、
>> ファイルシステムクロールしたところ、
>> "digest"が文字化けするようです。
>>
>> 【solr admin検索結果】
>>
>> 「Microsoft Word 97-2003 文書」
>> <str name="cache">test TEST テスト てすと</str>
>> <str name="digest">...test TEST テスト てすと</str>
>> <str name="mimetype">application/msword</str>
>> <str name="site">c:\docs\rtf\test.doc</str>
>>
>> ⇒OK
>>
>> 「Word 97-2003 & 6.0/95 -RTF (*.doc)」
>> <str name="cache">test TEST ƒ e ƒ X ƒ g ‚ Ä ‚ · ‚ Æ</str>
>> <str name="digest">...test TEST ƒ e ƒ X ƒ g ‚ Ä ‚ · ‚ Æ</str>
>> <str name="mimetype">application/msword</str>
>> <str name="site">c:\docs\rtf\test_rtf.doc</str>
>>
>> ⇒NG
>>
>> 「リッチ テキスト形式 (RTF) 文書」
>> <str name="cache">test TEST ƒ e ƒ X ƒ g ‚ Ä ‚ · ‚ Æ</str>
>> <str name="digest">...test TEST ƒ e ƒ X ƒ g ‚ Ä ‚ · ‚ Æ</str>
>> <str name="mimetype">application/rtf</str>
>> <str name="site">c:\docs\rtf\test.rtf</str>
>>
>> ⇒NG
>>
>> 【利用環境】
>> OS:WindowsXP-SP3
>> Java:1.6.0_20
>> fess:3.1.1/3.1.3(SNAPSHOT)
>> MS-WORD:2002/2003
>>
>> 以下のサイトで紹介されているように、
>> Wordから出力されるRTFの文字列が、
>> Unicode化されていないのが原因でしょうか?
>>
>> 【参考】
>> <http://a-gamyl.hp.infoseek.co.jp/Java/RTFio/RTFio_java.html>
>>
>> 以上、よろしくお願い致します。
>> _______________________________________________
>> Fess-user mailing list
>> Fess-****@lists*****
>> http://lists.sourceforge.jp/mailman/listinfo/fess-user
>>
>>
>



Fess-user メーリングリストの案内
Back to archive index