Shinsuke Sugaya
shins****@yahoo*****
2010年 10月 10日 (日) 10:47:19 JST
菅谷です。 だいぶ時間が経過してしまいましたが、Apache Tikaに 対してパッチを送りましたので、それが適用されれば Fess 4.0 では最新のTikaを利用することで本件の対応と したいと思います(取り込まれなければ独自に修正します)。 ですので、Fess 4.0 では修正されている予定です。 よろしくお願いいたします。 shinsuke 2010年8月10日10:16 Shinsuke Sugaya <shins****@yahoo*****>: > 菅谷です。 > > 情報をありがとうございます。 > Shift_JIS で扱われているためと思われます。 > 対策を検討したいと思います。 > > shinsuke > > > 2010年8月9日23:30 <lvisd****@gmail*****>: >> お世話になります。 >> 加納です。 >> >> rtfドキュメントに対して、 >> ファイルシステムクロールしたところ、 >> "digest"が文字化けするようです。 >> >> 【solr admin検索結果】 >> >> 「Microsoft Word 97-2003 文書」 >> <str name="cache">test TEST テスト てすと</str> >> <str name="digest">...test TEST テスト てすと</str> >> <str name="mimetype">application/msword</str> >> <str name="site">c:\docs\rtf\test.doc</str> >> >> ⇒OK >> >> 「Word 97-2003 & 6.0/95 -RTF (*.doc)」 >> <str name="cache">test TEST ƒ e ƒ X ƒ g ‚ Ä ‚ · ‚ Æ</str> >> <str name="digest">...test TEST ƒ e ƒ X ƒ g ‚ Ä ‚ · ‚ Æ</str> >> <str name="mimetype">application/msword</str> >> <str name="site">c:\docs\rtf\test_rtf.doc</str> >> >> ⇒NG >> >> 「リッチ テキスト形式 (RTF) 文書」 >> <str name="cache">test TEST ƒ e ƒ X ƒ g ‚ Ä ‚ · ‚ Æ</str> >> <str name="digest">...test TEST ƒ e ƒ X ƒ g ‚ Ä ‚ · ‚ Æ</str> >> <str name="mimetype">application/rtf</str> >> <str name="site">c:\docs\rtf\test.rtf</str> >> >> ⇒NG >> >> 【利用環境】 >> OS:WindowsXP-SP3 >> Java:1.6.0_20 >> fess:3.1.1/3.1.3(SNAPSHOT) >> MS-WORD:2002/2003 >> >> 以下のサイトで紹介されているように、 >> Wordから出力されるRTFの文字列が、 >> Unicode化されていないのが原因でしょうか? >> >> 【参考】 >> <http://a-gamyl.hp.infoseek.co.jp/Java/RTFio/RTFio_java.html> >> >> 以上、よろしくお願い致します。 >> _______________________________________________ >> Fess-user mailing list >> Fess-****@lists***** >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> >> >