From takakiku810 @ gmail.com Tue Aug 3 16:37:55 2010 From: takakiku810 @ gmail.com (Takahiro Kikumoto) Date: Tue, 3 Aug 2010 16:37:55 +0900 Subject: [fess-user 317] =?iso-2022-jp?b?UGFyc2VFeGNlcHRpb24bJEIkLEgvQDgkNyReJDkhIxsoQg==?= Message-ID: お世話になります。きくもとです。 クエリとして aaa! aaa[ aaa^ のように ![]^ の記号を与えると(!は末尾の場合)、以下のように Lucene で 例外が発生しました。 org.apache.solr.common.SolrException: org.apache.lucene.queryParser.ParseException: Cannot parse '(title:aaa! OR content:aaa!) AND type:"pc"': Encountered " "OR "" at line 1, column 12. 対処・回避方法が思いつかないので、なにかアドバイスをいただけるなら お願いできますでしょうか? 利用環境は CentOS5.2 Java 1.6.0_19-b04 fess 3.1.2 です。 よろしくお願いします。 From shinsuke @ yahoo.co.jp Wed Aug 4 10:07:45 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Wed, 4 Aug 2010 10:07:45 +0900 Subject: [fess-user 318] Re: =?iso-2022-jp?b?UGFyc2VFeGNlcHRpb24bJEIkLEgvQDgkNyReJDkbKEI=?= =?iso-2022-jp?b?GyRCISMbKEI=?= In-Reply-To: References: Message-ID: 菅谷です。 ご指摘いただきありがとうございます。 修正しますので、少々お待ちください。 shinsuke 2010年8月3日16:37 Takahiro Kikumoto : > お世話になります。きくもとです。 > > クエリとして > aaa! > aaa[ > aaa^ > のように ![]^ の記号を与えると(!は末尾の場合)、以下のように Lucene で > 例外が発生しました。 > > org.apache.solr.common.SolrException: > org.apache.lucene.queryParser.ParseException: Cannot parse > '(title:aaa! OR content:aaa!) AND type:"pc"': Encountered " "OR > "" at line 1, column 12. > > 対処・回避方法が思いつかないので、なにかアドバイスをいただけるなら > お願いできますでしょうか? > > 利用環境は > CentOS5.2 > Java 1.6.0_19-b04 > fess 3.1.2 > です。 > > よろしくお願いします。 > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From yskjd735 @ ybb.ne.jp Wed Aug 4 13:54:36 2010 From: yskjd735 @ ybb.ne.jp (yskjd735 @ ybb.ne.jp) Date: Wed, 4 Aug 2010 13:54:36 +0900 (JST) Subject: [fess-user 319] =?iso-2022-jp?b?GyRCST01LSRmJGwkTjghOnckSyREJCQkRhsoQg==?= In-Reply-To: Message-ID: <931395.54873.qm@web200016.mail.kks.yahoo.co.jp> 菅谷様 お世話になっております。高橋です。 毎回質問で恐縮ですが、社内情報システム部から以下の質問が来ました。 ≪質問≫ 例えば同じ製品名だが 1.「ab」 2.「ab/c」 3.「Asitakuru butuzou/c」 のように表記ゆれなどは、吸収できるのでしょうか。 例えば類義語が定義できるなど。 Googleの「もしかして」のようなといった感じです。 個人的には、ステミングあたりなのかなと思っていますが。。 見当違いでしたらすみません。 お忙しいなか恐縮ですが、ご確認のほどよろしくお願い致します。 From shinsuke @ yahoo.co.jp Wed Aug 4 15:11:48 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Wed, 4 Aug 2010 15:11:48 +0900 Subject: [fess-user 320] Re: =?iso-2022-jp?b?GyRCST01LSRmJGwkTjghOnckSyREJCQkRhsoQg==?= In-Reply-To: <931395.54873.qm@web200016.mail.kks.yahoo.co.jp> References: <931395.54873.qm@web200016.mail.kks.yahoo.co.jp> Message-ID: 菅谷です。 類義語は Solr の機能で実現しています。 solr/core1/conf/synonyms.txt を編集して solr/core1/conf/schema.xml の のコメントアウトを外します。ただし、index_synonyms.txtと なっていますので、synonyms.txt に変更してください。 たとえば、記述する内容的には、 ab,ab/c,Asitakuru butuzou/c としておくと、インデックス的には ab として 検索されると思います。 よろしくお願いいたします。 shinsuke 2010年8月4日13:54 : > 菅谷様 > > お世話になっております。高橋です。 > > 毎回質問で恐縮ですが、社内情報システム部から以下の質問が来ました。 > > ≪質問≫ > 例えば同じ製品名だが > 1.「ab」 > 2.「ab/c」 > 3.「Asitakuru butuzou/c」 > のように表記ゆれなどは、吸収できるのでしょうか。 > > 例えば類義語が定義できるなど。 > Googleの「もしかして」のようなといった感じです。 > > > 個人的には、ステミングあたりなのかなと思っていますが。。 > 見当違いでしたらすみません。 > > お忙しいなか恐縮ですが、ご確認のほどよろしくお願い致します。 > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From takakiku810 @ gmail.com Wed Aug 4 15:52:04 2010 From: takakiku810 @ gmail.com (Takahiro Kikumoto) Date: Wed, 4 Aug 2010 15:52:04 +0900 Subject: [fess-user 321] Re: =?iso-2022-jp?b?GyRCST01LSRmJGwkTjghOnckSyREJCQkRhsoQg==?= In-Reply-To: References: <931395.54873.qm@web200016.mail.kks.yahoo.co.jp> Message-ID: 菊本です。 便乗で、類義語に関して要望です。 検索結果のハイライトですが、類義語もハイライトして欲しいという のがあります。 直接の検索クエリ以外の類義で文書が抽出されてくると、ハイライト が全くないということもあるので、なにがヒットしたの?というよう に見えてしまうからです。 ご検討いただければ幸です。 2010年8月4日15:11 Shinsuke Sugaya : > 菅谷です。 > > 類義語は Solr の機能で実現しています。 > solr/core1/conf/synonyms.txt を編集して > solr/core1/conf/schema.xml の > > synonyms="synonyms.txt" ignoreCase="true" expand="false"/> > > のコメントアウトを外します。ただし、index_synonyms.txtと > なっていますので、synonyms.txt に変更してください。 > > たとえば、記述する内容的には、 > > ab,ab/c,Asitakuru butuzou/c > > としておくと、インデックス的には ab として > 検索されると思います。 > > よろしくお願いいたします。 > > shinsuke > > > 2010年8月4日13:54 : >> 菅谷様 >> >> お世話になっております。高橋です。 >> >> 毎回質問で恐縮ですが、社内情報システム部から以下の質問が来ました。 >> >> ≪質問≫ >> 例えば同じ製品名だが >> 1.「ab」 >> 2.「ab/c」 >> 3.「Asitakuru butuzou/c」 >> のように表記ゆれなどは、吸収できるのでしょうか。 >> >> 例えば類義語が定義できるなど。 >> Googleの「もしかして」のようなといった感じです。 >> >> >> 個人的には、ステミングあたりなのかなと思っていますが。。 >> 見当違いでしたらすみません。 >> >> お忙しいなか恐縮ですが、ご確認のほどよろしくお願い致します。 >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From yskjd735 @ ybb.ne.jp Wed Aug 4 16:03:22 2010 From: yskjd735 @ ybb.ne.jp (yskjd735 @ ybb.ne.jp) Date: Wed, 4 Aug 2010 16:03:22 +0900 (JST) Subject: [fess-user 322] Re: =?iso-2022-jp?b?GyRCST01LSRmJGwkTjghOnckSyREJCQkRhsoQg==?= In-Reply-To: Message-ID: <429692.99741.qm@web200007.mail.kks.yahoo.co.jp> 菅谷様 いつもお世話になっています。 高橋です。 類義語の件、ご教授ありがとうございました。 早速、社内に展開したいと思います。 いつもすばやい回答感謝です。 それでは失礼します。 ♯先程は個人アドレスのみに返信してしまいました。申しわけ ありません。 --- Shinsuke Sugaya wrote: > 菅谷です。 > > 類義語は Solr の機能で実現しています。 > solr/core1/conf/synonyms.txt を編集して > solr/core1/conf/schema.xml の > > synonyms="synonyms.txt" ignoreCase="true" expand="false"/> > > のコメントアウトを外します。ただし、index_synonyms.txtと > なっていますので、synonyms.txt に変更してください。 > > たとえば、記述する内容的には、 > > ab,ab/c,Asitakuru butuzou/c > > としておくと、インデックス的には ab として > 検索されると思います。 > > よろしくお願いいたします。 > > shinsuke > > > 2010年8月4日13:54 : > > 菅谷様 > > > > お世話になっております。高橋です。 > > > > 毎回質問で恐縮ですが、社内情報システム部から以下の質問が来ました。 > > > > ≪質問≫ > > 例えば同じ製品名だが > > 1.「ab」 > > 2.「ab/c」 > > 3.「Asitakuru butuzou/c」 > > のように表記ゆれなどは、吸収できるのでしょうか。 > > > > 例えば類義語が定義できるなど。 > > Googleの「もしかして」のようなといった感じです。 > > > > > > 個人的には、ステミングあたりなのかなと思っていますが。。 > > 見当違いでしたらすみません。 > > > > お忙しいなか恐縮ですが、ご確認のほどよろしくお願い致します。 > > > > _______________________________________________ > > Fess-user mailing list > > Fess-user @ lists.sourceforge.jp > > http://lists.sourceforge.jp/mailman/listinfo/fess-user > > > From shinsuke @ yahoo.co.jp Thu Aug 5 09:04:27 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Thu, 5 Aug 2010 09:04:27 +0900 Subject: [fess-user 323] Re: =?iso-2022-jp?b?GyRCST01LSRmJGwkTjghOnckSyREJCQkRhsoQg==?= In-Reply-To: References: <931395.54873.qm@web200016.mail.kks.yahoo.co.jp> Message-ID: 菅谷です。 要望いただきありがとうございます。 できないことはないと思うので、チケット登録を しておきました。時期は未定ですが検討したいと 思います。 菅谷 2010年8月4日15:52 Takahiro Kikumoto : > 菊本です。 > > 便乗で、類義語に関して要望です。 > 検索結果のハイライトですが、類義語もハイライトして欲しいという > のがあります。 > > 直接の検索クエリ以外の類義で文書が抽出されてくると、ハイライト > が全くないということもあるので、なにがヒットしたの?というよう > に見えてしまうからです。 > > ご検討いただければ幸です。 > > > 2010年8月4日15:11 Shinsuke Sugaya : >> 菅谷です。 >> >> 類義語は Solr の機能で実現しています。 >> solr/core1/conf/synonyms.txt を編集して >> solr/core1/conf/schema.xml の >> >> > synonyms="synonyms.txt" ignoreCase="true" expand="false"/> >> >> のコメントアウトを外します。ただし、index_synonyms.txtと >> なっていますので、synonyms.txt に変更してください。 >> >> たとえば、記述する内容的には、 >> >> ab,ab/c,Asitakuru butuzou/c >> >> としておくと、インデックス的には ab として >> 検索されると思います。 >> >> よろしくお願いいたします。 >> >> shinsuke >> >> >> 2010年8月4日13:54 : >>> 菅谷様 >>> >>> お世話になっております。高橋です。 >>> >>> 毎回質問で恐縮ですが、社内情報システム部から以下の質問が来ました。 >>> >>> ≪質問≫ >>> 例えば同じ製品名だが >>> 1.「ab」 >>> 2.「ab/c」 >>> 3.「Asitakuru butuzou/c」 >>> のように表記ゆれなどは、吸収できるのでしょうか。 >>> >>> 例えば類義語が定義できるなど。 >>> Googleの「もしかして」のようなといった感じです。 >>> >>> >>> 個人的には、ステミングあたりなのかなと思っていますが。。 >>> 見当違いでしたらすみません。 >>> >>> お忙しいなか恐縮ですが、ご確認のほどよろしくお願い致します。 >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From takakiku810 @ gmail.com Thu Aug 5 10:40:19 2010 From: takakiku810 @ gmail.com (Takahiro Kikumoto) Date: Thu, 5 Aug 2010 10:40:19 +0900 Subject: [fess-user 324] Re: =?iso-2022-jp?b?GyRCST01LSRmJGwkTjghOnckSyREJCQkRhsoQg==?= In-Reply-To: References: <931395.54873.qm@web200016.mail.kks.yahoo.co.jp> Message-ID: きくもとです。 チケット登録ありがとうございます。 2010年8月5日9:04 Shinsuke Sugaya : > 菅谷です。 > > 要望いただきありがとうございます。 > できないことはないと思うので、チケット登録を > しておきました。時期は未定ですが検討したいと > 思います。 > > 菅谷 > > 2010年8月4日15:52 Takahiro Kikumoto : >> 菊本です。 >> >> 便乗で、類義語に関して要望です。 >> 検索結果のハイライトですが、類義語もハイライトして欲しいという >> のがあります。 >> >> 直接の検索クエリ以外の類義で文書が抽出されてくると、ハイライト >> が全くないということもあるので、なにがヒットしたの?というよう >> に見えてしまうからです。 >> >> ご検討いただければ幸です。 >> >> >> 2010年8月4日15:11 Shinsuke Sugaya : >>> 菅谷です。 >>> >>> 類義語は Solr の機能で実現しています。 >>> solr/core1/conf/synonyms.txt を編集して >>> solr/core1/conf/schema.xml の >>> >>> >> synonyms="synonyms.txt" ignoreCase="true" expand="false"/> >>> >>> のコメントアウトを外します。ただし、index_synonyms.txtと >>> なっていますので、synonyms.txt に変更してください。 >>> >>> たとえば、記述する内容的には、 >>> >>> ab,ab/c,Asitakuru butuzou/c >>> >>> としておくと、インデックス的には ab として >>> 検索されると思います。 >>> >>> よろしくお願いいたします。 >>> >>> shinsuke >>> >>> >>> 2010年8月4日13:54 : >>>> 菅谷様 >>>> >>>> お世話になっております。高橋です。 >>>> >>>> 毎回質問で恐縮ですが、社内情報システム部から以下の質問が来ました。 >>>> >>>> ≪質問≫ >>>> 例えば同じ製品名だが >>>> 1.「ab」 >>>> 2.「ab/c」 >>>> 3.「Asitakuru butuzou/c」 >>>> のように表記ゆれなどは、吸収できるのでしょうか。 >>>> >>>> 例えば類義語が定義できるなど。 >>>> Googleの「もしかして」のようなといった感じです。 >>>> >>>> >>>> 個人的には、ステミングあたりなのかなと思っていますが。。 >>>> 見当違いでしたらすみません。 >>>> >>>> お忙しいなか恐縮ですが、ご確認のほどよろしくお願い致します。 >>>> >>>> _______________________________________________ >>>> Fess-user mailing list >>>> Fess-user @ lists.sourceforge.jp >>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>> >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From lvisdd @ gmail.com Fri Aug 6 02:19:38 2010 From: lvisdd @ gmail.com (lvisdd @ gmail.com) Date: Thu, 05 Aug 2010 17:19:38 +0000 Subject: [fess-user 325] =?iso-2022-jp?b?GyRCJVUlISUkJWslNyU5JUYlYCUvJW0hPCVrO34kTiVVGyhC?= =?iso-2022-jp?b?GyRCJSElJCVrTD4kThsoQlVSSRskQiUoJXMlMyE8JUkbKEI=?= =?iso-2022-jp?b?GyRCJEskRCQkJEYbKEI=?= Message-ID: <00163646c8f4505226048d16c1ef@google.com> 初めまして。加納と申します。 fess 3.1.1 を利用させていただいております。 ファイル名に「++」を含むものついて、 ファイルシステムクロールをした場合に半角スペースに置換される事象が発生しまし た。 「ファイル名」 c:\docs\C++.doc 「ファイルシステムクロール時のTomcatのログ」 file:/c:/docs/C%2B%2B.doc 「検索結果のソース」 C .doc ⇒半角スペース2個 「Solr Adminの検索結果」 file:/c:/docs/C++.doc;type=pc,docomo,au,softbank c:\docs\C .doc C .doc file:/c:/docs/C++.doc ⇒半角スペース1個 ファイルシステムクロール結果の取り込み時と検索結果の表示処理中に、 URIエンコードの「%2B」ではなく、 正規表現の「+」と判定し、半角スペースに置換する箇所が存在するのではないかと 推測しております。 お手数ですが、ご確認をよろしくお願いいたします。 -------------- next part -------------- HTMLの添付ファイルを保管しました... URL: http://lists.sourceforge.jp/mailman/archives/fess-user/attachments/20100805/1d4b5950/attachment.htm From shinsuke @ yahoo.co.jp Fri Aug 6 06:08:00 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Fri, 6 Aug 2010 06:08:00 +0900 Subject: [fess-user 326] Re: =?iso-2022-jp?b?UGFyc2VFeGNlcHRpb24bJEIkLEgvQDgkNyReJDkbKEI=?= =?iso-2022-jp?b?GyRCISMbKEI=?= In-Reply-To: References: Message-ID: 菅谷です。 3.1.3-SNAPSHOT以降で対応しました。 よろしくお願いいたします。 shinsuke 2010年8月4日10:07 Shinsuke Sugaya : > 菅谷です。 > > ご指摘いただきありがとうございます。 > 修正しますので、少々お待ちください。 > > shinsuke > > 2010年8月3日16:37 Takahiro Kikumoto : >> お世話になります。きくもとです。 >> >> クエリとして >> aaa! >> aaa[ >> aaa^ >> のように ![]^ の記号を与えると(!は末尾の場合)、以下のように Lucene で >> 例外が発生しました。 >> >> org.apache.solr.common.SolrException: >> org.apache.lucene.queryParser.ParseException: Cannot parse >> '(title:aaa! OR content:aaa!) AND type:"pc"': Encountered " "OR >> "" at line 1, column 12. >> >> 対処・回避方法が思いつかないので、なにかアドバイスをいただけるなら >> お願いできますでしょうか? >> >> 利用環境は >> CentOS5.2 >> Java 1.6.0_19-b04 >> fess 3.1.2 >> です。 >> >> よろしくお願いします。 >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > From shinsuke @ yahoo.co.jp Fri Aug 6 08:36:36 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Fri, 6 Aug 2010 08:36:36 +0900 Subject: [fess-user 327] Re: =?iso-2022-jp?b?GyRCJVUlISUkJWslNyU5JUYlYCUvJW0hPCVrO34bKEI=?= =?iso-2022-jp?b?GyRCJE4lVSUhJSQla0w+JE4bKEJVUkkbJEIlKCVzJTMbKEI=?= =?iso-2022-jp?b?GyRCITwlSSRLJEQkJCRGGyhC?= In-Reply-To: <00163646c8f4505226048d16c1ef@google.com> References: <00163646c8f4505226048d16c1ef@google.com> Message-ID: 菅谷です。 情報をありがとうございます。 調査・対応いたしますので、 少々お待ちください。 shinsuke 2010年8月6日2:19 : > 初めまして。加納と申します。 > > fess 3.1.1 を利用させていただいております。 > > ファイル名に「++」を含むものついて、 > ファイルシステムクロールをした場合に > 半角スペースに置換される事象が発生しました。 > > 「ファイル名」 > c:\docs\C++.doc > > 「ファイルシステムクロール時のTomcatのログ」 > file:/c:/docs/C%2B%2B.doc > > 「検索結果のソース」 > C .doc > > ⇒半角スペース2個 > > 「Solr Adminの検索結果」 > file:/c:/docs/C++.doc;type=pc,docomo,au,softbank > c:\docs\C .doc > C .doc > file:/c:/docs/C++.doc > > ⇒半角スペース1個 > > ファイルシステムクロール結果の取り込み時と検索結果の表示処理中に、 > URIエンコードの「%2B」ではなく、 > 正規表現の「+」と判定し、半角スペースに置換する箇所 > が存在するのではないかと推測しております。 > > お手数ですが、ご確認をよろしくお願いいたします。 > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > > From takakiku810 @ gmail.com Fri Aug 6 08:39:30 2010 From: takakiku810 @ gmail.com (Takahiro Kikumoto) Date: Fri, 6 Aug 2010 08:39:30 +0900 Subject: [fess-user 328] Re: =?iso-2022-jp?b?UGFyc2VFeGNlcHRpb24bJEIkLEgvQDgkNyReJDkbKEI=?= =?iso-2022-jp?b?GyRCISMbKEI=?= In-Reply-To: References: Message-ID: きくもとです。 早速のご対応ありがとうございます。 感謝致します。 2010年8月6日6:08 Shinsuke Sugaya : > 菅谷です。 > > 3.1.3-SNAPSHOT以降で対応しました。 > よろしくお願いいたします。 > > shinsuke > > 2010年8月4日10:07 Shinsuke Sugaya : >> 菅谷です。 >> >> ご指摘いただきありがとうございます。 >> 修正しますので、少々お待ちください。 >> >> shinsuke >> >> 2010年8月3日16:37 Takahiro Kikumoto : >>> お世話になります。きくもとです。 >>> >>> クエリとして >>> aaa! >>> aaa[ >>> aaa^ >>> のように ![]^ の記号を与えると(!は末尾の場合)、以下のように Lucene で >>> 例外が発生しました。 >>> >>> org.apache.solr.common.SolrException: >>> org.apache.lucene.queryParser.ParseException: Cannot parse >>> '(title:aaa! OR content:aaa!) AND type:"pc"': Encountered " "OR >>> "" at line 1, column 12. >>> >>> 対処・回避方法が思いつかないので、なにかアドバイスをいただけるなら >>> お願いできますでしょうか? >>> >>> 利用環境は >>> CentOS5.2 >>> Java 1.6.0_19-b04 >>> fess 3.1.2 >>> です。 >>> >>> よろしくお願いします。 >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From shinsuke @ yahoo.co.jp Sat Aug 7 08:15:51 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Sat, 7 Aug 2010 08:15:51 +0900 Subject: [fess-user 329] Re: =?iso-2022-jp?b?GyRCJVUlISUkJWslNyU5JUYlYCUvJW0hPCVrO34bKEI=?= =?iso-2022-jp?b?GyRCJE4lVSUhJSQla0w+JE4bKEJVUkkbJEIlKCVzJTMbKEI=?= =?iso-2022-jp?b?GyRCITwlSSRLJEQkJCRGGyhC?= In-Reply-To: References: <00163646c8f4505226048d16c1ef@google.com> Message-ID: 菅谷です。 3.1.3-SNAPSHOT 以降で対応しました。 よろしくお願いいたします。 shinsuke 2010年8月6日8:36 Shinsuke Sugaya : > 菅谷です。 > > 情報をありがとうございます。 > 調査・対応いたしますので、 > 少々お待ちください。 > > shinsuke > > 2010年8月6日2:19 : >> 初めまして。加納と申します。 >> >> fess 3.1.1 を利用させていただいております。 >> >> ファイル名に「++」を含むものついて、 >> ファイルシステムクロールをした場合に >> 半角スペースに置換される事象が発生しました。 >> >> 「ファイル名」 >> c:\docs\C++.doc >> >> 「ファイルシステムクロール時のTomcatのログ」 >> file:/c:/docs/C%2B%2B.doc >> >> 「検索結果のソース」 >> C .doc >> >> ⇒半角スペース2個 >> >> 「Solr Adminの検索結果」 >> file:/c:/docs/C++.doc;type=pc,docomo,au,softbank >> c:\docs\C .doc >> C .doc >> file:/c:/docs/C++.doc >> >> ⇒半角スペース1個 >> >> ファイルシステムクロール結果の取り込み時と検索結果の表示処理中に、 >> URIエンコードの「%2B」ではなく、 >> 正規表現の「+」と判定し、半角スペースに置換する箇所 >> が存在するのではないかと推測しております。 >> >> お手数ですが、ご確認をよろしくお願いいたします。 >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> >> > From lvisdd @ gmail.com Sat Aug 7 12:31:52 2010 From: lvisdd @ gmail.com (Kunihiko Kanou) Date: Sat, 7 Aug 2010 12:31:52 +0900 Subject: [fess-user 330] Re: =?iso-2022-jp?b?GyRCJVUlISUkJWslNyU5JUYlYCUvJW0hPCVrO34bKEI=?= =?iso-2022-jp?b?GyRCJE4lVSUhJSQla0w+JE4bKEJVUkkbJEIlKCVzJTMbKEI=?= =?iso-2022-jp?b?GyRCITwlSSRLJEQkJCRGGyhC?= In-Reply-To: References: <00163646c8f4505226048d16c1ef@google.com> Message-ID: 加納です。 早速のご対応ありがとうございます。 以上、よろしくお願い致します。 2010年8月7日8:15 Shinsuke Sugaya : > 菅谷です。 > > 3.1.3-SNAPSHOT 以降で対応しました。 > よろしくお願いいたします。 > > shinsuke > > > 2010年8月6日8:36 Shinsuke Sugaya : >> 菅谷です。 >> >> 情報をありがとうございます。 >> 調査・対応いたしますので、 >> 少々お待ちください。 >> >> shinsuke >> >> 2010年8月6日2:19 : >>> 初めまして。加納と申します。 >>> >>> fess 3.1.1 を利用させていただいております。 >>> >>> ファイル名に「++」を含むものついて、 >>> ファイルシステムクロールをした場合に >>> 半角スペースに置換される事象が発生しました。 >>> >>> 「ファイル名」 >>> c:\docs\C++.doc >>> >>> 「ファイルシステムクロール時のTomcatのログ」 >>> file:/c:/docs/C%2B%2B.doc >>> >>> 「検索結果のソース」 >>> C .doc >>> >>> ⇒半角スペース2個 >>> >>> 「Solr Adminの検索結果」 >>> file:/c:/docs/C++.doc;type=pc,docomo,au,softbank >>> c:\docs\C .doc >>> C .doc >>> file:/c:/docs/C++.doc >>> >>> ⇒半角スペース1個 >>> >>> ファイルシステムクロール結果の取り込み時と検索結果の表示処理中に、 >>> URIエンコードの「%2B」ではなく、 >>> 正規表現の「+」と判定し、半角スペースに置換する箇所 >>> が存在するのではないかと推測しております。 >>> >>> お手数ですが、ご確認をよろしくお願いいたします。 >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >>> >> > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From lvisdd @ gmail.com Mon Aug 9 23:30:58 2010 From: lvisdd @ gmail.com (lvisdd @ gmail.com) Date: Mon, 09 Aug 2010 14:30:58 +0000 Subject: [fess-user 331] =?iso-2022-jp?b?GyRCJVUlISUkJWslNyU5JUYlYCUvJW0hPCVrO34kThsoQnJ0?= =?iso-2022-jp?b?ZhskQiVJJS0lZSVhJXMlSCROSjg7ejI9JDEkSyREJCQbKEI=?= =?iso-2022-jp?b?GyRCJEYbKEI=?= Message-ID: <0016363b7b067914c9048d64ddd7@google.com> お世話になります。 加納です。 rtfドキュメントに対して、 ファイルシステムクロールしたところ、 "digest"が文字化けするようです。 【solr admin検索結果】 「Microsoft Word 97-2003 文書」 test TEST テスト てすと ...test TEST テスト てすと application/msword c:\docs\rtf\test.doc ⇒OK 「Word 97-2003 & 6.0/95 -RTF (*.doc)」 test TEST ? e ? X ? g ? Ä ? ? ? Æ ...test TEST ? e ? X ? g ? Ä ? ? ? Æ application/msword c:\docs\rtf\test_rtf.doc ⇒NG 「リッチ テキスト形式 (RTF) 文書」 test TEST ? e ? X ? g ? Ä ? ? ? Æ ...test TEST ? e ? X ? g ? Ä ? ? ? Æ application/rtf c:\docs\rtf\test.rtf ⇒NG 【利用環境】 OS:WindowsXP-SP3 Java:1.6.0_20 fess:3.1.1/3.1.3(SNAPSHOT) MS-WORD:2002/2003 以下のサイトで紹介されているように、 Wordから出力されるRTFの文字列が、 Unicode化されていないのが原因でしょうか? 【参考】 以上、よろしくお願い致します。 -------------- next part -------------- HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B... URL: http://lists.sourceforge.jp/mailman/archives/fess-user/attachments/20100809/2085faf1/attachment.htm From shinsuke @ yahoo.co.jp Tue Aug 10 10:16:01 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Tue, 10 Aug 2010 10:16:01 +0900 Subject: [fess-user 332] Re: =?iso-2022-jp?b?GyRCJVUlISUkJWslNyU5JUYlYCUvJW0hPCVrO34bKEI=?= =?iso-2022-jp?b?GyRCJE4bKEJydGYbJEIlSSUtJWUlYSVzJUgkTko4O3obKEI=?= =?iso-2022-jp?b?GyRCMj0kMSRLJEQkJCRGGyhC?= In-Reply-To: <0016363b7b067914c9048d64ddd7@google.com> References: <0016363b7b067914c9048d64ddd7@google.com> Message-ID: 菅谷です。 情報をありがとうございます。 Shift_JIS で扱われているためと思われます。 対策を検討したいと思います。 shinsuke 2010年8月9日23:30 : > お世話になります。 > 加納です。 > > rtfドキュメントに対して、 > ファイルシステムクロールしたところ、 > "digest"が文字化けするようです。 > > 【solr admin検索結果】 > > 「Microsoft Word 97-2003 文書」 > test TEST テスト てすと > ...test TEST テスト てすと > application/msword > c:\docs\rtf\test.doc > > ⇒OK > > 「Word 97-2003 & 6.0/95 -RTF (*.doc)」 > test TEST ? e ? X ? g ? Ä ? ? ? Æ > ...test TEST ? e ? X ? g ? Ä ? ? ? Æ > application/msword > c:\docs\rtf\test_rtf.doc > > ⇒NG > > 「リッチ テキスト形式 (RTF) 文書」 > test TEST ? e ? X ? g ? Ä ? ? ? Æ > ...test TEST ? e ? X ? g ? Ä ? ? ? Æ > application/rtf > c:\docs\rtf\test.rtf > > ⇒NG > > 【利用環境】 > OS:WindowsXP-SP3 > Java:1.6.0_20 > fess:3.1.1/3.1.3(SNAPSHOT) > MS-WORD:2002/2003 > > 以下のサイトで紹介されているように、 > Wordから出力されるRTFの文字列が、 > Unicode化されていないのが原因でしょうか? > > 【参考】 > > > 以上、よろしくお願い致します。 > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > > From ganosu0 @ gmail.com Thu Aug 19 07:26:37 2010 From: ganosu0 @ gmail.com (Sugano) Date: Thu, 19 Aug 2010 07:26:37 +0900 Subject: [fess-user 333] =?iso-2022-jp?b?GyRCJUclVSUpJWslSCRHJE4lPSE8JUg4ITp3TS04ejI9GyhC?= =?iso-2022-jp?b?GyRCJEskRCQkJEYbKEI=?= Message-ID: <24CB3F246C1080ganosu0@gmail.com> いつもお世話になります。すがのです。 Fessの検索結果でlastModifiedのソート検索をデフォルトで有効に したいと考えております。 (検索フォームに検索語と一緒に「sort:lastModified.desc」と入 力しなくても、デフォルトでファイルの最終更新日が新しい順に検 索結果に出力されるようにソート検索したいです) 上記ですが、有効にできる方法などはありますでしょうか? (indexMain.jspもしくは何かのパラメータファイルの修正で対応可 能でしょうか?) 以上、よろしくお願いします。 From shinsuke @ yahoo.co.jp Thu Aug 19 10:37:55 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Thu, 19 Aug 2010 10:37:55 +0900 Subject: [fess-user 334] Re: =?iso-2022-jp?b?GyRCJUclVSUpJWslSCRHJE4lPSE8JUg4ITp3TS0bKEI=?= =?iso-2022-jp?b?GyRCOHoyPSRLJEQkJCRGGyhC?= In-Reply-To: <24CB3F246C1080ganosu0@gmail.com> References: <24CB3F246C1080ganosu0@gmail.com> Message-ID: 菅谷です。 現状、パラメータを付加することができませんので、 JavaScriptでの対応になるかと思います。たとえば、 JSPの「検索結果ページ (Headタグ内) 」で を追加して「検索結果ページ (フッター) 」で とかで検索ボタンのクリック時に sort:〜を 付加して送ることができると思います。 次のバージョンでは dicon ファイルなどの設定で パラメータを渡せるようにしたいと思います。 shinsuke 2010年8月19日7:26 Sugano : > いつもお世話になります。すがのです。 > > Fessの検索結果でlastModifiedのソート検索をデフォルトで有効に > したいと考えております。 > (検索フォームに検索語と一緒に「sort:lastModified.desc」と入 > 力しなくても、デフォルトでファイルの最終更新日が新しい順に検 > 索結果に出力されるようにソート検索したいです) > > 上記ですが、有効にできる方法などはありますでしょうか? > (indexMain.jspもしくは何かのパラメータファイルの修正で対応可 > 能でしょうか?) > > 以上、よろしくお願いします。 > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From ganosu0 @ gmail.com Fri Aug 20 00:48:24 2010 From: ganosu0 @ gmail.com (Sugano) Date: Fri, 20 Aug 2010 00:48:24 +0900 Subject: [fess-user 335] Re: =?iso-2022-jp?b?GyRCJUclVSUpJWslSCRHJE4lPSE8JUg4ITp3TS0bKEI=?= =?iso-2022-jp?b?GyRCOHoyPSRLJEQkJCRGGyhC?= In-Reply-To: References: <24CB3F246C1080ganosu0@gmail.com> Message-ID: <25CB3FB5F4EA8Fganosu0@gmail.com> いつもお世話になります。 すがのです。 本件、菅谷さんの方法で上手くできました! 色々と応用できそうなので、jspページをいじってみて、 いろんなパターンでテストしてみます! ご回答ありがとうございました。 P.S. 社内で検索エンジンの実績も出ていて、非常に好評です! 新機能を追加したVerUp版などを楽しみにしております!! > ----Original Message---- > Thu, 19 Aug 2010 10:37:55 +0900 > From: Shinsuke Sugaya > Reply-To: fess-user @ lists.sourceforge.jp > To: fess-user @ lists.sourceforge.jp > Subject: [fess-user 334] Re:デフォルトでのソート検索有効化 > について > > 菅谷です。 > > 現状、パラメータを付加することができませんので、 > JavaScriptでの対応になるかと思います。たとえば、 > JSPの「検索結果ページ (Headタグ内) 」で > > > > を追加して「検索結果ページ (フッター) 」で > > > > とかで検索ボタンのクリック時に sort:〜を > 付加して送ることができると思います。 > > 次のバージョンでは dicon ファイルなどの設定で > パラメータを渡せるようにしたいと思います。 > > shinsuke > > 2010年8月19日7:26 Sugano : > > いつもお世話になります。すがのです。 > > > > Fessの検索結果でlastModifiedのソート検索をデフォルトで有効に > > したいと考えております。 > > (検索フォームに検索語と一緒に「sort:lastModified.desc」と入 > > 力しなくても、デフォルトでファイルの最終更新日が新しい順に検 > > 索結果に出力されるようにソート検索したいです) > > > > 上記ですが、有効にできる方法などはありますでしょうか? > > (indexMain.jspもしくは何かのパラメータファイルの修正で対応可 > > 能でしょうか?) > > > > 以上、よろしくお願いします。 > > > > _______________________________________________ > > Fess-user mailing list > > Fess-user @ lists.sourceforge.jp > > http://lists.sourceforge.jp/mailman/listinfo/fess-user > > > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user From ganosu0 @ gmail.com Fri Aug 20 01:14:27 2010 From: ganosu0 @ gmail.com (Sugano) Date: Fri, 20 Aug 2010 01:14:27 +0900 Subject: [fess-user 336] =?iso-2022-jp?b?GyRCIVo/NzUhRz0lIiUkJUclIyUiIVslLyVtITwla0JQGyhC?= =?iso-2022-jp?b?GyRCPl0zMCVVJSElJCVrJE5LXEo4MEozMCROPnBKczxoGyhC?= =?iso-2022-jp?b?GyRCRkAbKEI=?= Message-ID: <26CB3FB99913B7ganosu0@gmail.com> いつもお世話になります。 すがのです。 以前に募集していたFess新機能のアイディアですが、さきほど1つ 思いついたので、参考までに報告しておきます。 ・クロール対象外ファイルの本文以外の情報取得(ファイル名など) ファイルの中身を見なくても、ファイル名のみで内容を推測できる ドキュメントは多いと思います。 クロール対象ファイルサイズの上限を上回るファイルや、フィルタ リング対象のファイルは、通常はインデックス作成は行われません が、ファイル内のデータは取得しないで、ファイル名・ファイル更 新日時などの取得ができる機能があればと思いました。 (本文は空でインデックス作成するなど) そうすることで、サイズが大きめになりやすい画像付ファイルなど も、ファイル名にキーワードが含まれていれば検索対象内に入りや すくなり、より有益な情報を多く検索しやすくなるのでは?と思い ました。 以上、思いつきですが、参考になるようであれば幸いです。。 From shinsuke @ yahoo.co.jp Fri Aug 20 09:40:31 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Fri, 20 Aug 2010 09:40:31 +0900 Subject: [fess-user 337] Re: =?iso-2022-jp?b?GyRCJUclVSUpJWslSCRHJE4lPSE8JUg4ITp3TS0bKEI=?= =?iso-2022-jp?b?GyRCOHoyPSRLJEQkJCRGGyhC?= In-Reply-To: <25CB3FB5F4EA8Fganosu0@gmail.com> References: <24CB3F246C1080ganosu0@gmail.com> <25CB3FB5F4EA8Fganosu0@gmail.com> Message-ID: 菅谷です。 確認していただきありがとうございます。 ざっくり書いた JavaScript なので、細かいことを したい場合は JavaScript でもうちょっとがんばる 必要があるかもしれません (^^; > 社内で検索エンジンの実績も出ていて、非常に好評です! ありがとうございます。 大変嬉しいです! shinsuke 2010年8月20日0:48 Sugano : > いつもお世話になります。 > すがのです。 > > 本件、菅谷さんの方法で上手くできました! > > 色々と応用できそうなので、jspページをいじってみて、 > いろんなパターンでテストしてみます! > > ご回答ありがとうございました。 > > P.S. > 社内で検索エンジンの実績も出ていて、非常に好評です! > 新機能を追加したVerUp版などを楽しみにしております!! >> ----Original Message---- >> Thu, 19 Aug 2010 10:37:55 +0900 >> From: Shinsuke Sugaya >> Reply-To: fess-user @ lists.sourceforge.jp >> To: fess-user @ lists.sourceforge.jp >> Subject: [fess-user 334] Re:デフォルトでのソート検索有効化 >> について >> > >> 菅谷です。 >> >> 現状、パラメータを付加することができませんので、 >> JavaScriptでの対応になるかと思います。たとえば、 >> JSPの「検索結果ページ (Headタグ内) 」で >> >> >> >> を追加して「検索結果ページ (フッター) 」で >> >> >> >> とかで検索ボタンのクリック時に sort:〜を >> 付加して送ることができると思います。 >> >> 次のバージョンでは dicon ファイルなどの設定で >> パラメータを渡せるようにしたいと思います。 >> >> shinsuke >> >> 2010年8月19日7:26 Sugano : >> > いつもお世話になります。すがのです。 >> > >> > Fessの検索結果でlastModifiedのソート検索をデフォルトで有効に >> > したいと考えております。 >> > (検索フォームに検索語と一緒に「sort:lastModified.desc」と入 >> > 力しなくても、デフォルトでファイルの最終更新日が新しい順に検 >> > 索結果に出力されるようにソート検索したいです) >> > >> > 上記ですが、有効にできる方法などはありますでしょうか? >> > (indexMain.jspもしくは何かのパラメータファイルの修正で対応可 >> > 能でしょうか?) >> > >> > 以上、よろしくお願いします。 >> > >> > _______________________________________________ >> > Fess-user mailing list >> > Fess-user @ lists.sourceforge.jp >> > http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From shinsuke @ yahoo.co.jp Fri Aug 20 09:45:55 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Fri, 20 Aug 2010 09:45:55 +0900 Subject: [fess-user 338] Re: =?iso-2022-jp?b?GyRCIVo/NzUhRz0lIiUkJUclIyUiIVslLyVtITwbKEI=?= =?iso-2022-jp?b?GyRCJWtCUD5dMzAlVSUhJSQlayROS1xKODBKMzAkTj5wGyhC?= =?iso-2022-jp?b?GyRCSnM8aEZAGyhC?= In-Reply-To: <26CB3FB99913B7ganosu0@gmail.com> References: <26CB3FB99913B7ganosu0@gmail.com> Message-ID: 菅谷です。 ありがとうございます。 確かにあると便利な機能かと思いますので、 チケットは #22874 として登録しました。 対応方法を検討してみたいと思います。 shinsuke 2010年8月20日1:14 Sugano : > いつもお世話になります。 > すがのです。 > > 以前に募集していたFess新機能のアイディアですが、さきほど1つ > 思いついたので、参考までに報告しておきます。 > > ・クロール対象外ファイルの本文以外の情報取得(ファイル名など) > ファイルの中身を見なくても、ファイル名のみで内容を推測できる > ドキュメントは多いと思います。 > > クロール対象ファイルサイズの上限を上回るファイルや、フィルタ > リング対象のファイルは、通常はインデックス作成は行われません > が、ファイル内のデータは取得しないで、ファイル名・ファイル更 > 新日時などの取得ができる機能があればと思いました。 > (本文は空でインデックス作成するなど) > > そうすることで、サイズが大きめになりやすい画像付ファイルなど > も、ファイル名にキーワードが含まれていれば検索対象内に入りや > すくなり、より有益な情報を多く検索しやすくなるのでは?と思い > ました。 > > 以上、思いつきですが、参考になるようであれば幸いです。。 > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user >