From shinsuke @ yahoo.co.jp Thu May 6 11:58:08 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Thu, 6 May 2010 11:58:08 +0900 Subject: [fess-user 195] Re: =?iso-2022-jp?b?GyRCJVElOSVeJUMlVCVzJTAkSyREJCQkRhsoQg==?= In-Reply-To: References: <4BD7B40F.3090603@gmail.com> <4BD815FB.5030107@gmail.com> Message-ID: 菅谷です。 URLエンコードするとWindows環境のIEで表示できない ケースがあるので、デフォルトは現状のままにして、 設定で変更可能にしました。 webapps/fess/WEB-INF/classes/app.dicon に というところで encodeUrlLinkプロパティを 追加してみました。encodeUrlLinkをtrueに するとURLエンコードされた状態になります。 よろしくお願いいたします。 shinsuke 2010年4月29日11:32 ynt : > 菅谷さん > > こんにちは、矢野です。 > > 設定を直してチャレンジしてみました。 > > 以下の設定ではうまくいかず、 > 正規表現  :opt/samba > 置換文字列 ://hostname.local > 検索結果 :file:////hostname.local/share/ > > 以下のようにしたらうまくいきました。 > 置換文字列 :///hostname.local > #おそらく検索時にfile:/が削除され、file://に置き換えられているのかと思います。 > > しかし、リンクをクリックしたときにファイルを開くことができませんでした。 > リンクをコピーしてアドレスバーに入れて叩けばファイルは開けました。 > > 検索結果のhtmlソースファイルを見たところ、file://のファイルパスに漢字がUTF-8で > そのまま入っていました。こちらの漢字部分を手動でurlencodeしたらファイルの > オープンダイアログが出てきました。 > > 要望ですが、検索結果表示の urlLink を urlencode していただけないでしょうか? > よろしくお願いいたします。 > > 2010年4月28日20:03 tetuyano : >> 菅谷さん >> >> 矢野です。 >> >> 回答ありがとうございます。 >> >> 設定を修正して再度チャレンジしてみます。 >> >> >> (2010/04/28 14:47), Shinsuke Sugaya wrote: >>> 菅谷です。 >>> >>> 利用いただきありがとうございます。 >>> >>>> 1.パスマッピングは、クロール中でも反映されますか? >>> >>> いいえ、反映されません。 >>> クロール前に設定しておく必要があります。 >>> >>>> 2.パスマッピングで >>>> file:///opt/samba/share/*****.xls >>>> でている部分を >>>> file://///hostname.local/share/*****.xls >>>> としたいのですが、書き方はどうすればよろしいでしょうか? >>> >>>> 正規表現  :opt/samba >>>> 置換文字列 ://hostname.local >>> >>> 上記で置換されると思います。 >>> クロール前に設定していただいてもだめでしたら >>> 調べますのでお知らせください。 >>> >>> shinsuke >>> >>> >>> 2010年4月28日13:05 tetuyano: >>>> こんにちは。 >>>> 矢野といいます。 >>>> >>>> fess-3.0.0 を昨日から使い始めました。 >>>> 素晴らしいプロダクトをありがとうございます。 >>>> >>>> データが700GBぐらいあるので全然クロールが終わってないですが、 >>>> ほんとに5分で動いたじゃんすげー、と思っております。 >>>> >>>> 以下の環境で使っておりますが、fessのパスマッピングで上手くいかないので >>>> お教えください。CentOSにSambaを入れてファイルサーバとしています。 >>>> そのファイルサーバにfessをインストールして全文検索しようとしております。 >>>> >>>> 1.稼働環境 >>>> OS:CentOS-5.2(64bit) >>>> Java:"1.6.0_13"(64bit) >>>> Application:Samba、Apache >>>> >>>> 2.Fess設定 >>>> クロール全般:デフォルト >>>> ウェブ:なし >>>> ファイルシステム: >>>> パス: file:/opt/samba/share >>>> データストア:なし >>>> その他設定:デフォルト >>>> >>>> 3.検索した結果 >>>> fessの検索画面でリンクが以下のように出ています。 >>>> file:///opt/samba/share/*****.xls >>>> 緑のパス表記は、 >>>> /opt/samba/share/*****.xls >>>> のように出ています。 >>>> >>>> ■質問事項 >>>> 1.パスマッピングは、クロール中でも反映されますか? >>>> 2.パスマッピングで >>>> file:///opt/samba/share/*****.xls >>>> でている部分を >>>> file://///hostname.local/share/*****.xls >>>> としたいのですが、書き方はどうすればよろしいでしょうか? >>>> >>>> テストしてみた限りでは、 >>>> 正規表現  :opt/samba >>>> 置換文字列 ://hostname.local >>>> としてみましたが、反映されません。 >>>> >>>> 正規表現を >>>> 正規表現  :.*(opt/samba).* >>>> 正規表現  :.* >>>> としてみても同じでした。 >>>> >>>> よろしくお願いいたします。 >>>> >>>> -- >>>> tetuyano >>>> tetuyano @ gmail.com >>>> >>>> _______________________________________________ >>>> Fess-user mailing list >>>> Fess-user @ lists.sourceforge.jp >>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>> >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> >> -- >> tetuyano >> tetuyano @ gmail.com >> > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From tetuyano @ gmail.com Fri May 7 12:03:53 2010 From: tetuyano @ gmail.com (tetuyano) Date: Fri, 07 May 2010 12:03:53 +0900 Subject: [fess-user 196] Re: =?iso-2022-jp?b?GyRCJVElOSVeJUMlVCVzJTAkSyREJCQkRhsoQg==?= In-Reply-To: <0C222C5B4BE28FAC.47cf1411@eplgtb> References: <4BD7B40F.3090603@gmail.com> <4BD815FB.5030107@gmail.com> <0C222C5B4BE28FAC.47cf1411@eplgtb> Message-ID: <4BE38319.50303@gmail.com> 矢野です。 早速対応、ありがとうございます。 どんどん開発が進んでいて驚くばかりです。 Version 3.1.0 を楽しみにしております。 (2010/05/06 11:58), Shinsuke Sugaya wrote: > 菅谷です。 > > URLエンコードするとWindows環境のIEで表示できない > ケースがあるので、デフォルトは現状のままにして、 > 設定で変更可能にしました。 > > webapps/fess/WEB-INF/classes/app.dicon に > > > > > > というところで encodeUrlLinkプロパティを > 追加してみました。encodeUrlLinkをtrueに > するとURLエンコードされた状態になります。 > > よろしくお願いいたします。 > > shinsuke -- tetuyano tetuyano @ gmail.com From mshibata @ shimadzu.co.jp Tue May 18 14:36:39 2010 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Tue, 18 May 2010 14:36:39 +0900 Subject: [fess-user 197] =?iso-2022-jp?b?MjAwMTAtMDUtMTcgU05BUFNIT1QgGyRCJE4lbSUwJEcbKEIu?= =?iso-2022-jp?b?Li4=?= In-Reply-To: <4BD7B40F.3090603@gmail.com> References: <4BD7B40F.3090603@gmail.com> Message-ID: <201005180536.AA12857@ea8055.shimadzu.co.jp> 柴田@亀岡市です。 仕事でしばらく塞がっていたのですが、一段落ついて再度 Fess をテスト してます。 本稼働サーバーでは 2.0.0 で work フォルダのサイズが増えていくのを 週一定時タスクでクリアしていますので、3.1.0 の状況はウォッチして いる (リリースしたら置き換えようとしている) のですが、表向き機能的 にどこかどう変わったというのがわからないので、どの切り口で見るでも なくただ動かしてみているという感じです。 久々に動かしたのでいつの頃からか不明ですが、昨日の SNAPSHOT でクロ ールの最後のところで以下のログを吐いています。 SNAPSHOT だしご報告するのも何なのですが、念のためお知らせしておき ます。 要点は "Requested format at index 56, but it wasn't found" が 1000 行近く出力されてから終わっていることがメインです。 本日のログでその後にエラーメッセージが続いていますが、これはその後 admin で管理画面に入ろうとしたら無応答になったので、そのときのもの (別件?) と思われます。 ----- 昨日クロール終了時 ----- 2010-05-17 20:50:59,781 [Thread-40] INFO jp.sf.fess.helper.SystemHelper - Crawler: Exit Code= 0 - Crawler Process Output: Requested format at index 56, but it wasn't found ...これが 998 行続く。 Requested format at index 56, but it wasn't found WARN: The method class org.apache.commons.logging.impl.SLF4JLogFactory#release() was invoked. WARN: Please see http://www.slf4j.org/codes.html#release for an explanation. ----- ここまで ----- ----- 本日クロール終了時 ----- 2010-05-18 13:43:44,531 [Thread-15] INFO jp.sf.fess.helper.SystemHelper - Crawler: Exit Code= 0 - Crawler Process Output: Requested format at index 56, but it wasn't found ...これが 998 行続く。 Requested format at index 56, but it wasn't found WARN: The method class org.apache.commons.logging.impl.SLF4JLogFactory#release() was invoked. WARN: Please see http://www.slf4j.org/codes.html#release for an explanation. 2010-05-18 13:43:58,750 [http-8080-2] INFO jp.sf.fess.action.admin.SystemAction - could not get server groups. jp.sf.fess.solr.FessSolrException: An exception occurs at SolrServer(solrServer1) of solrGroup1 group. at jp.sf.fess.solr.SolrServerGroup.query(SolrServerGroup.java:341) at jp.sf.fess.solr.SolrServerGroup.query(SolrServerGroup.java:249) at jp.sf.fess.action.admin.SystemAction.getSessionIdList(SystemAction.java:394) at jp.sf.fess.action.admin.SystemAction.getGroupActionItems(SystemAction.java:366) at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3. $$getGroupActionItems$$invokeSuperMethod$$(SystemAction$$EnhancedByS2AOP$$135f7f3.java) at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3$$MethodInvocation $$getGroupActionItems10.proceed(MethodInvocationClassGenerator.java) at org.seasar.framework.aop.interceptors.ThrowsInterceptor.invoke (ThrowsInterceptor.java:79) at jp.sf.fess.interceptor.FessActionMessagesThrowsInterceptor.invoke (FessActionMessagesThrowsInterceptor.java:36) at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3$$MethodInvocation $$getGroupActionItems10.proceed(MethodInvocationClassGenerator.java) at org.seasar.framework.aop.interceptors.TraceInterceptor.invoke (TraceInterceptor.java:56) at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3$$MethodInvocation $$getGroupActionItems10.proceed(MethodInvocationClassGenerator.java) at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3.getGroupActionItems (SystemAction$$EnhancedByS2AOP$$135f7f3.java) at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39) at sun.reflect.DelegatingMethodAccessorImpl.invoke (DelegatingMethodAccessorImpl.java:25) at java.lang.reflect.Method.invoke(Method.java:597) at org.seasar.framework.util.MethodUtil.invoke(MethodUtil.java:96) at org.seasar.framework.beans.impl.PropertyDescImpl.getValue (PropertyDescImpl.java:233) at org.seasar.struts.action.S2RequestProcessor.exportPropertiesToRequest (S2RequestProcessor.java:344) at org.seasar.struts.action.S2RequestProcessor.doForward(S2RequestProcessor.java:303) at org.apache.struts.action.RequestProcessor.processForwardConfig (RequestProcessor.java:398) at org.seasar.struts.action.S2RequestProcessor.process(S2RequestProcessor.java:134) at org.apache.struts.action.ActionServlet.process(ActionServlet.java:1196) at org.apache.struts.action.ActionServlet.doGet(ActionServlet.java:414) at javax.servlet.http.HttpServlet.service(HttpServlet.java:617) at javax.servlet.http.HttpServlet.service(HttpServlet.java:717) at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter (ApplicationFilterChain.java:290) at org.apache.catalina.core.ApplicationFilterChain.doFilter (ApplicationFilterChain.java:206) at org.seasar.framework.container.hotdeploy.HotdeployFilter.doFilter (HotdeployFilter.java:71) at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter (ApplicationFilterChain.java:235) at org.apache.catalina.core.ApplicationFilterChain.doFilter (ApplicationFilterChain.java:206) at org.seasar.framework.container.filter.S2ContainerFilter.doFilter (S2ContainerFilter.java:79) at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter (ApplicationFilterChain.java:235) at org.apache.catalina.core.ApplicationFilterChain.doFilter (ApplicationFilterChain.java:206) at org.mobylet.core.http.MobyletFilter.processFilter(MobyletFilter.java:110) at org.mobylet.core.http.MobyletFilter.doFilter(MobyletFilter.java:74) at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter (ApplicationFilterChain.java:235) at org.apache.catalina.core.ApplicationFilterChain.doFilter (ApplicationFilterChain.java:206) at org.apache.catalina.core.ApplicationDispatcher.invoke (ApplicationDispatcher.java:646) at org.apache.catalina.core.ApplicationDispatcher.processRequest (ApplicationDispatcher.java:436) at org.apache.catalina.core.ApplicationDispatcher.doForward (ApplicationDispatcher.java:374) at org.apache.catalina.core.ApplicationDispatcher.forward (ApplicationDispatcher.java:302) at org.seasar.struts.filter.RoutingFilter.forward(RoutingFilter.java:219) at org.seasar.struts.filter.RoutingFilter.doFilter(RoutingFilter.java:99) at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter (ApplicationFilterChain.java:235) at org.apache.catalina.core.ApplicationFilterChain.doFilter (ApplicationFilterChain.java:206) at jp.sf.fess.filter.AuthenticationFilter.doFilter(AuthenticationFilter.java:110) at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter (ApplicationFilterChain.java:235) at org.apache.catalina.core.ApplicationFilterChain.doFilter (ApplicationFilterChain.java:206) at org.seasar.framework.container.hotdeploy.HotdeployFilter.doFilter (HotdeployFilter.java:71) at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter (ApplicationFilterChain.java:235) at org.apache.catalina.core.ApplicationFilterChain.doFilter (ApplicationFilterChain.java:206) at org.seasar.framework.container.filter.S2ContainerFilter.doFilter (S2ContainerFilter.java:79) at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter (ApplicationFilterChain.java:235) at org.apache.catalina.core.ApplicationFilterChain.doFilter (ApplicationFilterChain.java:206) at org.mobylet.core.http.MobyletFilter.processFilter(MobyletFilter.java:110) at org.mobylet.core.http.MobyletFilter.doFilter(MobyletFilter.java:74) at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter (ApplicationFilterChain.java:235) at org.apache.catalina.core.ApplicationFilterChain.doFilter (ApplicationFilterChain.java:206) at org.apache.catalina.core.StandardWrapperValve.invoke(StandardWrapperValve.java:233) at org.apache.catalina.core.StandardContextValve.invoke(StandardContextValve.java:191) at org.apache.catalina.authenticator.AuthenticatorBase.invoke (AuthenticatorBase.java:465) at org.apache.catalina.core.StandardHostValve.invoke(StandardHostValve.java:127) at org.apache.catalina.valves.ErrorReportValve.invoke(ErrorReportValve.java:102) at org.apache.catalina.valves.RequestFilterValve.process(RequestFilterValve.java:269) at org.apache.catalina.valves.RemoteAddrValve.invoke(RemoteAddrValve.java:81) at org.apache.catalina.core.StandardEngineValve.invoke(StandardEngineValve.java:109) at org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:298) at org.apache.coyote.http11.Http11AprProcessor.process(Http11AprProcessor.java:859) at org.apache.coyote.http11.Http11AprProtocol$Http11ConnectionHandler.process (Http11AprProtocol.java:579) at org.apache.tomcat.util.net.AprEndpoint$Worker.run(AprEndpoint.java:1555) at java.lang.Thread.run(Thread.java:619) Caused by: org.apache.solr.client.solrj.SolrServerException: java.net.SocketException: Connection reset at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request (CommonsHttpSolrServer.java:472) at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request (CommonsHttpSolrServer.java:243) at org.apache.solr.client.solrj.request.QueryRequest.process(QueryRequest.java:89) at org.apache.solr.client.solrj.SolrServer.query(SolrServer.java:122) at jp.sf.fess.solr.SolrServerGroup.query(SolrServerGroup.java:311) ... 71 more Caused by: java.net.SocketException: Connection reset at java.net.SocketInputStream.read(SocketInputStream.java:168) at java.io.BufferedInputStream.fill(BufferedInputStream.java:218) at java.io.BufferedInputStream.read(BufferedInputStream.java:237) at org.apache.commons.httpclient.HttpParser.readRawLine(HttpParser.java:78) at org.apache.commons.httpclient.HttpParser.readLine(HttpParser.java:106) at org.apache.commons.httpclient.HttpConnection.readLine(HttpConnection.java:1116) at org.apache.commons.httpclient.MultiThreadedHttpConnectionManager $HttpConnectionAdapter.readLine(MultiThreadedHttpConnectionManager.java:1413) at org.apache.commons.httpclient.HttpMethodBase.readStatusLine (HttpMethodBase.java:1973) at org.apache.commons.httpclient.HttpMethodBase.readResponse(HttpMethodBase.java:1735) at org.apache.commons.httpclient.HttpMethodBase.execute(HttpMethodBase.java:1098) at org.apache.commons.httpclient.HttpMethodDirector.executeWithRetry (HttpMethodDirector.java:398) at org.apache.commons.httpclient.HttpMethodDirector.executeMethod (HttpMethodDirector.java:171) at org.apache.commons.httpclient.HttpClient.executeMethod(HttpClient.java:397) at org.apache.commons.httpclient.HttpClient.executeMethod(HttpClient.java:323) at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request (CommonsHttpSolrServer.java:416) ... 75 more ----- ここまで ----- From shinsuke @ yahoo.co.jp Wed May 19 10:51:08 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Wed, 19 May 2010 10:51:08 +0900 Subject: [fess-user 198] Re: =?iso-2022-jp?b?MjAwMTAtMDUtMTcgU05BUFNIT1QgGyRCJE4lbSUwGyhC?= =?iso-2022-jp?b?GyRCJEcbKEIuLi4=?= In-Reply-To: <201005180536.AA12857@ea8055.shimadzu.co.jp> References: <4BD7B40F.3090603@gmail.com> <201005180536.AA12857@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 情報をありがとうございます。 "Requested format〜" のログの件とシステム画面での Exception の件を対応してみました。前者は利用している POI の問題であり、Fess のログで出力するように変更しました。 後者は Solr へのクエリーリクエストを再送するようにして 対応しました。 > SNAPSHOT だしご報告するのも何なのですが、念のためお知らせしておき > ます。 最新の SNAPSHOT での情報をいただけた方が大変うれしかったり します (^^; よろしくお願いいたします。 shinsuke 2010年5月18日14:36 Masayuki Shibata : > 柴田@亀岡市です。 > > 仕事でしばらく塞がっていたのですが、一段落ついて再度 Fess をテスト > してます。 > > 本稼働サーバーでは 2.0.0 で work フォルダのサイズが増えていくのを > 週一定時タスクでクリアしていますので、3.1.0 の状況はウォッチして > いる (リリースしたら置き換えようとしている) のですが、表向き機能的 > にどこかどう変わったというのがわからないので、どの切り口で見るでも > なくただ動かしてみているという感じです。 > > 久々に動かしたのでいつの頃からか不明ですが、昨日の SNAPSHOT でクロ > ールの最後のところで以下のログを吐いています。 > > SNAPSHOT だしご報告するのも何なのですが、念のためお知らせしておき > ます。 > > 要点は "Requested format at index 56, but it wasn't found" が 1000 > 行近く出力されてから終わっていることがメインです。 > > 本日のログでその後にエラーメッセージが続いていますが、これはその後 > admin で管理画面に入ろうとしたら無応答になったので、そのときのもの > (別件?) と思われます。 > > ----- 昨日クロール終了時 ----- > 2010-05-17 20:50:59,781 [Thread-40] INFO jp.sf.fess.helper.SystemHelper - Crawler: Exit Code= > 0 - Crawler Process Output: > Requested format at index 56, but it wasn't found > ...これが 998 行続く。 > Requested format at index 56, but it wasn't found > WARN: The method class org.apache.commons.logging.impl.SLF4JLogFactory#release() was invoked. > WARN: Please see http://www.slf4j.org/codes.html#release for an explanation. > ----- ここまで ----- > > ----- 本日クロール終了時 ----- > 2010-05-18 13:43:44,531 [Thread-15] INFO jp.sf.fess.helper.SystemHelper - Crawler: Exit Code= > 0 - Crawler Process Output: > Requested format at index 56, but it wasn't found > ...これが 998 行続く。 > Requested format at index 56, but it wasn't found > WARN: The method class org.apache.commons.logging.impl.SLF4JLogFactory#release() was invoked. > WARN: Please see http://www.slf4j.org/codes.html#release for an explanation. > > 2010-05-18 13:43:58,750 [http-8080-2] INFO jp.sf.fess.action.admin.SystemAction - could not > get server groups. > jp.sf.fess.solr.FessSolrException: An exception occurs at SolrServer(solrServer1) of > solrGroup1 group. > at jp.sf.fess.solr.SolrServerGroup.query(SolrServerGroup.java:341) > at jp.sf.fess.solr.SolrServerGroup.query(SolrServerGroup.java:249) > at jp.sf.fess.action.admin.SystemAction.getSessionIdList(SystemAction.java:394) > at jp.sf.fess.action.admin.SystemAction.getGroupActionItems(SystemAction.java:366) > at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3. > $$getGroupActionItems$$invokeSuperMethod$$(SystemAction$$EnhancedByS2AOP$$135f7f3.java) > at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3$$MethodInvocation > $$getGroupActionItems10.proceed(MethodInvocationClassGenerator.java) > at org.seasar.framework.aop.interceptors.ThrowsInterceptor.invoke > (ThrowsInterceptor.java:79) > at jp.sf.fess.interceptor.FessActionMessagesThrowsInterceptor.invoke > (FessActionMessagesThrowsInterceptor.java:36) > at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3$$MethodInvocation > $$getGroupActionItems10.proceed(MethodInvocationClassGenerator.java) > at org.seasar.framework.aop.interceptors.TraceInterceptor.invoke > (TraceInterceptor.java:56) > at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3$$MethodInvocation > $$getGroupActionItems10.proceed(MethodInvocationClassGenerator.java) > at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3.getGroupActionItems > (SystemAction$$EnhancedByS2AOP$$135f7f3.java) > at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) > at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39) > at sun.reflect.DelegatingMethodAccessorImpl.invoke > (DelegatingMethodAccessorImpl.java:25) > at java.lang.reflect.Method.invoke(Method.java:597) > at org.seasar.framework.util.MethodUtil.invoke(MethodUtil.java:96) > at org.seasar.framework.beans.impl.PropertyDescImpl.getValue > (PropertyDescImpl.java:233) > at org.seasar.struts.action.S2RequestProcessor.exportPropertiesToRequest > (S2RequestProcessor.java:344) > at org.seasar.struts.action.S2RequestProcessor.doForward(S2RequestProcessor.java:303) > at org.apache.struts.action.RequestProcessor.processForwardConfig > (RequestProcessor.java:398) > at org.seasar.struts.action.S2RequestProcessor.process(S2RequestProcessor.java:134) > at org.apache.struts.action.ActionServlet.process(ActionServlet.java:1196) > at org.apache.struts.action.ActionServlet.doGet(ActionServlet.java:414) > at javax.servlet.http.HttpServlet.service(HttpServlet.java:617) > at javax.servlet.http.HttpServlet.service(HttpServlet.java:717) > at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter > (ApplicationFilterChain.java:290) > at org.apache.catalina.core.ApplicationFilterChain.doFilter > (ApplicationFilterChain.java:206) > at org.seasar.framework.container.hotdeploy.HotdeployFilter.doFilter > (HotdeployFilter.java:71) > at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter > (ApplicationFilterChain.java:235) > at org.apache.catalina.core.ApplicationFilterChain.doFilter > (ApplicationFilterChain.java:206) > at org.seasar.framework.container.filter.S2ContainerFilter.doFilter > (S2ContainerFilter.java:79) > at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter > (ApplicationFilterChain.java:235) > at org.apache.catalina.core.ApplicationFilterChain.doFilter > (ApplicationFilterChain.java:206) > at org.mobylet.core.http.MobyletFilter.processFilter(MobyletFilter.java:110) > at org.mobylet.core.http.MobyletFilter.doFilter(MobyletFilter.java:74) > at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter > (ApplicationFilterChain.java:235) > at org.apache.catalina.core.ApplicationFilterChain.doFilter > (ApplicationFilterChain.java:206) > at org.apache.catalina.core.ApplicationDispatcher.invoke > (ApplicationDispatcher.java:646) > at org.apache.catalina.core.ApplicationDispatcher.processRequest > (ApplicationDispatcher.java:436) > at org.apache.catalina.core.ApplicationDispatcher.doForward > (ApplicationDispatcher.java:374) > at org.apache.catalina.core.ApplicationDispatcher.forward > (ApplicationDispatcher.java:302) > at org.seasar.struts.filter.RoutingFilter.forward(RoutingFilter.java:219) > at org.seasar.struts.filter.RoutingFilter.doFilter(RoutingFilter.java:99) > at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter > (ApplicationFilterChain.java:235) > at org.apache.catalina.core.ApplicationFilterChain.doFilter > (ApplicationFilterChain.java:206) > at jp.sf.fess.filter.AuthenticationFilter.doFilter(AuthenticationFilter.java:110) > at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter > (ApplicationFilterChain.java:235) > at org.apache.catalina.core.ApplicationFilterChain.doFilter > (ApplicationFilterChain.java:206) > at org.seasar.framework.container.hotdeploy.HotdeployFilter.doFilter > (HotdeployFilter.java:71) > at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter > (ApplicationFilterChain.java:235) > at org.apache.catalina.core.ApplicationFilterChain.doFilter > (ApplicationFilterChain.java:206) > at org.seasar.framework.container.filter.S2ContainerFilter.doFilter > (S2ContainerFilter.java:79) > at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter > (ApplicationFilterChain.java:235) > at org.apache.catalina.core.ApplicationFilterChain.doFilter > (ApplicationFilterChain.java:206) > at org.mobylet.core.http.MobyletFilter.processFilter(MobyletFilter.java:110) > at org.mobylet.core.http.MobyletFilter.doFilter(MobyletFilter.java:74) > at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter > (ApplicationFilterChain.java:235) > at org.apache.catalina.core.ApplicationFilterChain.doFilter > (ApplicationFilterChain.java:206) > at org.apache.catalina.core.StandardWrapperValve.invoke(StandardWrapperValve.java:233) > at org.apache.catalina.core.StandardContextValve.invoke(StandardContextValve.java:191) > at org.apache.catalina.authenticator.AuthenticatorBase.invoke > (AuthenticatorBase.java:465) > at org.apache.catalina.core.StandardHostValve.invoke(StandardHostValve.java:127) > at org.apache.catalina.valves.ErrorReportValve.invoke(ErrorReportValve.java:102) > at org.apache.catalina.valves.RequestFilterValve.process(RequestFilterValve.java:269) > at org.apache.catalina.valves.RemoteAddrValve.invoke(RemoteAddrValve.java:81) > at org.apache.catalina.core.StandardEngineValve.invoke(StandardEngineValve.java:109) > at org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:298) > at org.apache.coyote.http11.Http11AprProcessor.process(Http11AprProcessor.java:859) > at org.apache.coyote.http11.Http11AprProtocol$Http11ConnectionHandler.process > (Http11AprProtocol.java:579) > at org.apache.tomcat.util.net.AprEndpoint$Worker.run(AprEndpoint.java:1555) > at java.lang.Thread.run(Thread.java:619) > Caused by: org.apache.solr.client.solrj.SolrServerException: java.net.SocketException: > Connection reset > at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request > (CommonsHttpSolrServer.java:472) > at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request > (CommonsHttpSolrServer.java:243) > at org.apache.solr.client.solrj.request.QueryRequest.process(QueryRequest.java:89) > at org.apache.solr.client.solrj.SolrServer.query(SolrServer.java:122) > at jp.sf.fess.solr.SolrServerGroup.query(SolrServerGroup.java:311) > ... 71 more > Caused by: java.net.SocketException: Connection reset > at java.net.SocketInputStream.read(SocketInputStream.java:168) > at java.io.BufferedInputStream.fill(BufferedInputStream.java:218) > at java.io.BufferedInputStream.read(BufferedInputStream.java:237) > at org.apache.commons.httpclient.HttpParser.readRawLine(HttpParser.java:78) > at org.apache.commons.httpclient.HttpParser.readLine(HttpParser.java:106) > at org.apache.commons.httpclient.HttpConnection.readLine(HttpConnection.java:1116) > at org.apache.commons.httpclient.MultiThreadedHttpConnectionManager > $HttpConnectionAdapter.readLine(MultiThreadedHttpConnectionManager.java:1413) > at org.apache.commons.httpclient.HttpMethodBase.readStatusLine > (HttpMethodBase.java:1973) > at org.apache.commons.httpclient.HttpMethodBase.readResponse(HttpMethodBase.java:1735) > at org.apache.commons.httpclient.HttpMethodBase.execute(HttpMethodBase.java:1098) > at org.apache.commons.httpclient.HttpMethodDirector.executeWithRetry > (HttpMethodDirector.java:398) > at org.apache.commons.httpclient.HttpMethodDirector.executeMethod > (HttpMethodDirector.java:171) > at org.apache.commons.httpclient.HttpClient.executeMethod(HttpClient.java:397) > at org.apache.commons.httpclient.HttpClient.executeMethod(HttpClient.java:323) > at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request > (CommonsHttpSolrServer.java:416) > ... 75 more > ----- ここまで ----- > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From mshibata @ shimadzu.co.jp Thu May 20 12:06:03 2010 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Thu, 20 May 2010 12:06:03 +0900 Subject: [fess-user 199] Re: =?iso-2022-jp?b?MjAwMTAtMDUtMTcgU05BUFNIT1QgGyRCJE4lbSUwGyhC?= =?iso-2022-jp?b?GyRCJEcbKEIuLi4=?= In-Reply-To: References: Message-ID: <201005200306.AA12883@ea8055.shimadzu.co.jp> 柴田@亀岡市です。 今度はクロールの最後の方ではなく、途中に何カ所か以下のログが入ってます。 #昨日夜 20:00 ごろの Snapshot でやってみてます。 2010-05-20 11:48:54,628 [Robot-20100520113221-1-10] WARN org.seasar.robot.extractor.impl.TikaExtractor - Requested format at index 56, but it wasn't found Requested format at index 56, but it wasn't found Requested format at index 56, but it wasn't found ... と同じ行が 900行ちょっと繰り返されてます。 それと、localhost でクロールしている最中に管理画面にログインして「シス テム設定」ページに入ろうとすると必ず1回固まってしまうような気がしま す。 重いだけなのかも知れませんが、いったんブラウザを閉じて再度「システム設 定」を開くとスムーズに開くのでちょっと妙な気がします。 >菅谷です。 > >情報をありがとうございます。 >"Requested format〜" のログの件とシステム画面での >Exception の件を対応してみました。前者は利用している >POI の問題であり、Fess のログで出力するように変更しました。 >後者は Solr へのクエリーリクエストを再送するようにして >対応しました。 > >> SNAPSHOT だしご報告するのも何なのですが、念のためお知らせしておき >> ます。 > >最新の SNAPSHOT での情報をいただけた方が大変うれしかったり >します (^^; > >よろしくお願いいたします。 > >shinsuke > > >2010年5月18日14:36 Masayuki Shibata : >> 柴田@亀岡市です。 >> >> 仕事でしばらく塞がっていたのですが、一段落ついて再度 Fess をテスト >> してます。 >> >> 本稼働サーバーでは 2.0.0 で work フォルダのサイズが増えていくのを >> 週一定時タスクでクリアしていますので、3.1.0 の状況はウォッチして >> いる (リリースしたら置き換えようとしている) のですが、表向き機能的 >> にどこかどう変わったというのがわからないので、どの切り口で見るでも >> なくただ動かしてみているという感じです。 >> >> 久々に動かしたのでいつの頃からか不明ですが、昨日の SNAPSHOT でクロ >> ールの最後のところで以下のログを吐いています。 >> >> SNAPSHOT だしご報告するのも何なのですが、念のためお知らせしておき >> ます。 >> >> 要点は "Requested format at index 56, but it wasn't found" が 1000 >> 行近く出力されてから終わっていることがメインです。 >> >> 本日のログでその後にエラーメッセージが続いていますが、これはその後 >> admin で管理画面に入ろうとしたら無応答になったので、そのときのもの >> (別件?) と思われます。 >> >> ----- 昨日クロール終了時 ----- >> 2010-05-17 20:50:59,781 [Thread-40] INFO jp.sf.fess.helper.SystemHelper - Crawler: Exit Code= >> 0 - Crawler Process Output: >> Requested format at index 56, but it wasn't found >> ...これが 998 行続く。 >> Requested format at index 56, but it wasn't found >> WARN: The method class org.apache.commons.logging.impl.SLF4JLogFactory#release() was invoked. >> WARN: Please see http://www.slf4j.org/codes.html#release for an explanation. >> ----- ここまで ----- >> >> ----- 本日クロール終了時 ----- >> 2010-05-18 13:43:44,531 [Thread-15] INFO jp.sf.fess.helper.SystemHelper - Crawler: Exit Code= >> 0 - Crawler Process Output: >> Requested format at index 56, but it wasn't found >> ...これが 998 行続く。 >> Requested format at index 56, but it wasn't found >> WARN: The method class org.apache.commons.logging.impl.SLF4JLogFactory#release() was invoked. >> WARN: Please see http://www.slf4j.org/codes.html#release for an explanation. >> >> 2010-05-18 13:43:58,750 [http-8080-2] INFO jp.sf.fess.action.admin.SystemAction - could not >> get server groups. >> jp.sf.fess.solr.FessSolrException: An exception occurs at SolrServer(solrServer1) of >> solrGroup1 group. >> at jp.sf.fess.solr.SolrServerGroup.query(SolrServerGroup.java:341) >> at jp.sf.fess.solr.SolrServerGroup.query(SolrServerGroup.java:249) >> at jp.sf.fess.action.admin.SystemAction.getSessionIdList(SystemAction.java:394) >> at jp.sf.fess.action.admin.SystemAction.getGroupActionItems(SystemAction.java:366) >> at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3. >> $$getGroupActionItems$$invokeSuperMethod$$(SystemAction$$EnhancedByS2AOP$$135f7f3.java) >> at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3$$MethodInvocation >> $$getGroupActionItems10.proceed(MethodInvocationClassGenerator.java) >> at org.seasar.framework.aop.interceptors.ThrowsInterceptor.invoke >> (ThrowsInterceptor.java:79) >> at jp.sf.fess.interceptor.FessActionMessagesThrowsInterceptor.invoke >> (FessActionMessagesThrowsInterceptor.java:36) >> at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3$$MethodInvocation >> $$getGroupActionItems10.proceed(MethodInvocationClassGenerator.java) >> at org.seasar.framework.aop.interceptors.TraceInterceptor.invoke >> (TraceInterceptor.java:56) >> at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3$$MethodInvocation >> $$getGroupActionItems10.proceed(MethodInvocationClassGenerator.java) >> at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3.getGroupActionItems >> (SystemAction$$EnhancedByS2AOP$$135f7f3.java) >> at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) >> at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39) >> at sun.reflect.DelegatingMethodAccessorImpl.invoke >> (DelegatingMethodAccessorImpl.java:25) >> at java.lang.reflect.Method.invoke(Method.java:597) >> at org.seasar.framework.util.MethodUtil.invoke(MethodUtil.java:96) >> at org.seasar.framework.beans.impl.PropertyDescImpl.getValue >> (PropertyDescImpl.java:233) >> at org.seasar.struts.action.S2RequestProcessor.exportPropertiesToRequest >> (S2RequestProcessor.java:344) >> at org.seasar.struts.action.S2RequestProcessor.doForward(S2RequestProcessor.java:303) >> at org.apache.struts.action.RequestProcessor.processForwardConfig >> (RequestProcessor.java:398) >> at org.seasar.struts.action.S2RequestProcessor.process(S2RequestProcessor.java:134) >> at org.apache.struts.action.ActionServlet.process(ActionServlet.java:1196) >> at org.apache.struts.action.ActionServlet.doGet(ActionServlet.java:414) >> at javax.servlet.http.HttpServlet.service(HttpServlet.java:617) >> at javax.servlet.http.HttpServlet.service(HttpServlet.java:717) >> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >> (ApplicationFilterChain.java:290) >> at org.apache.catalina.core.ApplicationFilterChain.doFilter >> (ApplicationFilterChain.java:206) >> at org.seasar.framework.container.hotdeploy.HotdeployFilter.doFilter >> (HotdeployFilter.java:71) >> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >> (ApplicationFilterChain.java:235) >> at org.apache.catalina.core.ApplicationFilterChain.doFilter >> (ApplicationFilterChain.java:206) >> at org.seasar.framework.container.filter.S2ContainerFilter.doFilter >> (S2ContainerFilter.java:79) >> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >> (ApplicationFilterChain.java:235) >> at org.apache.catalina.core.ApplicationFilterChain.doFilter >> (ApplicationFilterChain.java:206) >> at org.mobylet.core.http.MobyletFilter.processFilter(MobyletFilter.java:110) >> at org.mobylet.core.http.MobyletFilter.doFilter(MobyletFilter.java:74) >> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >> (ApplicationFilterChain.java:235) >> at org.apache.catalina.core.ApplicationFilterChain.doFilter >> (ApplicationFilterChain.java:206) >> at org.apache.catalina.core.ApplicationDispatcher.invoke >> (ApplicationDispatcher.java:646) >> at org.apache.catalina.core.ApplicationDispatcher.processRequest >> (ApplicationDispatcher.java:436) >> at org.apache.catalina.core.ApplicationDispatcher.doForward >> (ApplicationDispatcher.java:374) >> at org.apache.catalina.core.ApplicationDispatcher.forward >> (ApplicationDispatcher.java:302) >> at org.seasar.struts.filter.RoutingFilter.forward(RoutingFilter.java:219) >> at org.seasar.struts.filter.RoutingFilter.doFilter(RoutingFilter.java:99) >> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >> (ApplicationFilterChain.java:235) >> at org.apache.catalina.core.ApplicationFilterChain.doFilter >> (ApplicationFilterChain.java:206) >> at jp.sf.fess.filter.AuthenticationFilter.doFilter(AuthenticationFilter.java:110) >> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >> (ApplicationFilterChain.java:235) >> at org.apache.catalina.core.ApplicationFilterChain.doFilter >> (ApplicationFilterChain.java:206) >> at org.seasar.framework.container.hotdeploy.HotdeployFilter.doFilter >> (HotdeployFilter.java:71) >> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >> (ApplicationFilterChain.java:235) >> at org.apache.catalina.core.ApplicationFilterChain.doFilter >> (ApplicationFilterChain.java:206) >> at org.seasar.framework.container.filter.S2ContainerFilter.doFilter >> (S2ContainerFilter.java:79) >> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >> (ApplicationFilterChain.java:235) >> at org.apache.catalina.core.ApplicationFilterChain.doFilter >> (ApplicationFilterChain.java:206) >> at org.mobylet.core.http.MobyletFilter.processFilter(MobyletFilter.java:110) >> at org.mobylet.core.http.MobyletFilter.doFilter(MobyletFilter.java:74) >> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >> (ApplicationFilterChain.java:235) >> at org.apache.catalina.core.ApplicationFilterChain.doFilter >> (ApplicationFilterChain.java:206) >> at org.apache.catalina.core.StandardWrapperValve.invoke(StandardWrapperValve.java:233) >> at org.apache.catalina.core.StandardContextValve.invoke(StandardContextValve.java:191) >> at org.apache.catalina.authenticator.AuthenticatorBase.invoke >> (AuthenticatorBase.java:465) >> at org.apache.catalina.core.StandardHostValve.invoke(StandardHostValve.java:127) >> at org.apache.catalina.valves.ErrorReportValve.invoke(ErrorReportValve.java:102) >> at org.apache.catalina.valves.RequestFilterValve.process(RequestFilterValve.java:269) >> at org.apache.catalina.valves.RemoteAddrValve.invoke(RemoteAddrValve.java:81) >> at org.apache.catalina.core.StandardEngineValve.invoke(StandardEngineValve.java:109) >> at org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:298) >> at org.apache.coyote.http11.Http11AprProcessor.process(Http11AprProcessor.java:859) >> at org.apache.coyote.http11.Http11AprProtocol$Http11ConnectionHandler.process >> (Http11AprProtocol.java:579) >> at org.apache.tomcat.util.net.AprEndpoint$Worker.run(AprEndpoint.java:1555) >> at java.lang.Thread.run(Thread.java:619) >> Caused by: org.apache.solr.client.solrj.SolrServerException: java.net.SocketException: >> Connection reset >> at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request >> (CommonsHttpSolrServer.java:472) >> at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request >> (CommonsHttpSolrServer.java:243) >> at org.apache.solr.client.solrj.request.QueryRequest.process(QueryRequest.java:89) >> at org.apache.solr.client.solrj.SolrServer.query(SolrServer.java:122) >> at jp.sf.fess.solr.SolrServerGroup.query(SolrServerGroup.java:311) >> ... 71 more >> Caused by: java.net.SocketException: Connection reset >> at java.net.SocketInputStream.read(SocketInputStream.java:168) >> at java.io.BufferedInputStream.fill(BufferedInputStream.java:218) >> at java.io.BufferedInputStream.read(BufferedInputStream.java:237) >> at org.apache.commons.httpclient.HttpParser.readRawLine(HttpParser.java:78) >> at org.apache.commons.httpclient.HttpParser.readLine(HttpParser.java:106) >> at org.apache.commons.httpclient.HttpConnection.readLine(HttpConnection.java:1116) >> at org.apache.commons.httpclient.MultiThreadedHttpConnectionManager >> $HttpConnectionAdapter.readLine(MultiThreadedHttpConnectionManager.java:1413) >> at org.apache.commons.httpclient.HttpMethodBase.readStatusLine >> (HttpMethodBase.java:1973) >> at org.apache.commons.httpclient.HttpMethodBase.readResponse(HttpMethodBase.java:1735) >> at org.apache.commons.httpclient.HttpMethodBase.execute(HttpMethodBase.java:1098) >> at org.apache.commons.httpclient.HttpMethodDirector.executeWithRetry >> (HttpMethodDirector.java:398) >> at org.apache.commons.httpclient.HttpMethodDirector.executeMethod >> (HttpMethodDirector.java:171) >> at org.apache.commons.httpclient.HttpClient.executeMethod(HttpClient.java:397) >> at org.apache.commons.httpclient.HttpClient.executeMethod(HttpClient.java:323) >> at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request >> (CommonsHttpSolrServer.java:416) >> ... 75 more >> ----- ここまで ----- >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > >_______________________________________________ >Fess-user mailing list >Fess-user @ lists.sourceforge.jp >http://lists.sourceforge.jp/mailman/listinfo/fess-user > From shinsuke @ yahoo.co.jp Thu May 20 13:34:50 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Thu, 20 May 2010 13:34:50 +0900 Subject: [fess-user 200] Re: =?iso-2022-jp?b?MjAwMTAtMDUtMTcgU05BUFNIT1QgGyRCJE4lbSUwGyhC?= =?iso-2022-jp?b?GyRCJEcbKEIuLi4=?= In-Reply-To: <201005200306.AA12883@ea8055.shimadzu.co.jp> References: <201005200306.AA12883@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 確認していただきありがとうございます。 > Requested format at index 56, but it wasn't found MS Office 系のファイル(たぶん Excel)だと思いますが、 Apache POI からのエラーになります。どこかのセルの フォーマットが認識できていない状況かと思います。 (しかも、それが900個くらいある?) もし、それが起きる ファイルをいただけるようでしたら、確認させていただきたい と思います。 システム設定ページについては表示する際に Solr に問い合わせに行きます。ですので、短い 間隔でのクロールなどすると影響を受けるかと 思います。そこまで遅いのは確認できていないので 今度、Windows でも試してみます。 shinsuke 2010年5月20日12:06 Masayuki Shibata : > 柴田@亀岡市です。 > > 今度はクロールの最後の方ではなく、途中に何カ所か以下のログが入ってます。 > #昨日夜 20:00 ごろの Snapshot でやってみてます。 > > 2010-05-20 11:48:54,628 [Robot-20100520113221-1-10] WARN > org.seasar.robot.extractor.impl.TikaExtractor - Requested format at index 56, but it wasn't found > Requested format at index 56, but it wasn't found > Requested format at index 56, but it wasn't found > ... と同じ行が 900行ちょっと繰り返されてます。 > > それと、localhost でクロールしている最中に管理画面にログインして「シス > テム設定」ページに入ろうとすると必ず1回固まってしまうような気がしま > す。 > > 重いだけなのかも知れませんが、いったんブラウザを閉じて再度「システム設 > 定」を開くとスムーズに開くのでちょっと妙な気がします。 > > >>菅谷です。 >> >>情報をありがとうございます。 >>"Requested format〜" のログの件とシステム画面での >>Exception の件を対応してみました。前者は利用している >>POI の問題であり、Fess のログで出力するように変更しました。 >>後者は Solr へのクエリーリクエストを再送するようにして >>対応しました。 >> >>> SNAPSHOT だしご報告するのも何なのですが、念のためお知らせしておき >>> ます。 >> >>最新の SNAPSHOT での情報をいただけた方が大変うれしかったり >>します (^^; >> >>よろしくお願いいたします。 >> >>shinsuke >> >> >>2010年5月18日14:36 Masayuki Shibata : >>> 柴田@亀岡市です。 >>> >>> 仕事でしばらく塞がっていたのですが、一段落ついて再度 Fess をテスト >>> してます。 >>> >>> 本稼働サーバーでは 2.0.0 で work フォルダのサイズが増えていくのを >>> 週一定時タスクでクリアしていますので、3.1.0 の状況はウォッチして >>> いる (リリースしたら置き換えようとしている) のですが、表向き機能的 >>> にどこかどう変わったというのがわからないので、どの切り口で見るでも >>> なくただ動かしてみているという感じです。 >>> >>> 久々に動かしたのでいつの頃からか不明ですが、昨日の SNAPSHOT でクロ >>> ールの最後のところで以下のログを吐いています。 >>> >>> SNAPSHOT だしご報告するのも何なのですが、念のためお知らせしておき >>> ます。 >>> >>> 要点は "Requested format at index 56, but it wasn't found" が 1000 >>> 行近く出力されてから終わっていることがメインです。 >>> >>> 本日のログでその後にエラーメッセージが続いていますが、これはその後 >>> admin で管理画面に入ろうとしたら無応答になったので、そのときのもの >>> (別件?) と思われます。 >>> >>> ----- 昨日クロール終了時 ----- >>> 2010-05-17 20:50:59,781 [Thread-40] INFO jp.sf.fess.helper.SystemHelper - Crawler: Exit Code= >>> 0 - Crawler Process Output: >>> Requested format at index 56, but it wasn't found >>> ...これが 998 行続く。 >>> Requested format at index 56, but it wasn't found >>> WARN: The method class org.apache.commons.logging.impl.SLF4JLogFactory#release() was invoked. >>> WARN: Please see http://www.slf4j.org/codes.html#release for an explanation. >>> ----- ここまで ----- >>> >>> ----- 本日クロール終了時 ----- >>> 2010-05-18 13:43:44,531 [Thread-15] INFO jp.sf.fess.helper.SystemHelper - Crawler: Exit Code= >>> 0 - Crawler Process Output: >>> Requested format at index 56, but it wasn't found >>> ...これが 998 行続く。 >>> Requested format at index 56, but it wasn't found >>> WARN: The method class org.apache.commons.logging.impl.SLF4JLogFactory#release() was invoked. >>> WARN: Please see http://www.slf4j.org/codes.html#release for an explanation. >>> >>> 2010-05-18 13:43:58,750 [http-8080-2] INFO jp.sf.fess.action.admin.SystemAction - could not >>> get server groups. >>> jp.sf.fess.solr.FessSolrException: An exception occurs at SolrServer(solrServer1) of >>> solrGroup1 group. >>> at jp.sf.fess.solr.SolrServerGroup.query(SolrServerGroup.java:341) >>> at jp.sf.fess.solr.SolrServerGroup.query(SolrServerGroup.java:249) >>> at jp.sf.fess.action.admin.SystemAction.getSessionIdList(SystemAction.java:394) >>> at jp.sf.fess.action.admin.SystemAction.getGroupActionItems(SystemAction.java:366) >>> at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3. >>> $$getGroupActionItems$$invokeSuperMethod$$(SystemAction$$EnhancedByS2AOP$$135f7f3.java) >>> at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3$$MethodInvocation >>> $$getGroupActionItems10.proceed(MethodInvocationClassGenerator.java) >>> at org.seasar.framework.aop.interceptors.ThrowsInterceptor.invoke >>> (ThrowsInterceptor.java:79) >>> at jp.sf.fess.interceptor.FessActionMessagesThrowsInterceptor.invoke >>> (FessActionMessagesThrowsInterceptor.java:36) >>> at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3$$MethodInvocation >>> $$getGroupActionItems10.proceed(MethodInvocationClassGenerator.java) >>> at org.seasar.framework.aop.interceptors.TraceInterceptor.invoke >>> (TraceInterceptor.java:56) >>> at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3$$MethodInvocation >>> $$getGroupActionItems10.proceed(MethodInvocationClassGenerator.java) >>> at jp.sf.fess.action.admin.SystemAction$$EnhancedByS2AOP$$135f7f3.getGroupActionItems >>> (SystemAction$$EnhancedByS2AOP$$135f7f3.java) >>> at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) >>> at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39) >>> at sun.reflect.DelegatingMethodAccessorImpl.invoke >>> (DelegatingMethodAccessorImpl.java:25) >>> at java.lang.reflect.Method.invoke(Method.java:597) >>> at org.seasar.framework.util.MethodUtil.invoke(MethodUtil.java:96) >>> at org.seasar.framework.beans.impl.PropertyDescImpl.getValue >>> (PropertyDescImpl.java:233) >>> at org.seasar.struts.action.S2RequestProcessor.exportPropertiesToRequest >>> (S2RequestProcessor.java:344) >>> at org.seasar.struts.action.S2RequestProcessor.doForward(S2RequestProcessor.java:303) >>> at org.apache.struts.action.RequestProcessor.processForwardConfig >>> (RequestProcessor.java:398) >>> at org.seasar.struts.action.S2RequestProcessor.process(S2RequestProcessor.java:134) >>> at org.apache.struts.action.ActionServlet.process(ActionServlet.java:1196) >>> at org.apache.struts.action.ActionServlet.doGet(ActionServlet.java:414) >>> at javax.servlet.http.HttpServlet.service(HttpServlet.java:617) >>> at javax.servlet.http.HttpServlet.service(HttpServlet.java:717) >>> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >>> (ApplicationFilterChain.java:290) >>> at org.apache.catalina.core.ApplicationFilterChain.doFilter >>> (ApplicationFilterChain.java:206) >>> at org.seasar.framework.container.hotdeploy.HotdeployFilter.doFilter >>> (HotdeployFilter.java:71) >>> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >>> (ApplicationFilterChain.java:235) >>> at org.apache.catalina.core.ApplicationFilterChain.doFilter >>> (ApplicationFilterChain.java:206) >>> at org.seasar.framework.container.filter.S2ContainerFilter.doFilter >>> (S2ContainerFilter.java:79) >>> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >>> (ApplicationFilterChain.java:235) >>> at org.apache.catalina.core.ApplicationFilterChain.doFilter >>> (ApplicationFilterChain.java:206) >>> at org.mobylet.core.http.MobyletFilter.processFilter(MobyletFilter.java:110) >>> at org.mobylet.core.http.MobyletFilter.doFilter(MobyletFilter.java:74) >>> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >>> (ApplicationFilterChain.java:235) >>> at org.apache.catalina.core.ApplicationFilterChain.doFilter >>> (ApplicationFilterChain.java:206) >>> at org.apache.catalina.core.ApplicationDispatcher.invoke >>> (ApplicationDispatcher.java:646) >>> at org.apache.catalina.core.ApplicationDispatcher.processRequest >>> (ApplicationDispatcher.java:436) >>> at org.apache.catalina.core.ApplicationDispatcher.doForward >>> (ApplicationDispatcher.java:374) >>> at org.apache.catalina.core.ApplicationDispatcher.forward >>> (ApplicationDispatcher.java:302) >>> at org.seasar.struts.filter.RoutingFilter.forward(RoutingFilter.java:219) >>> at org.seasar.struts.filter.RoutingFilter.doFilter(RoutingFilter.java:99) >>> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >>> (ApplicationFilterChain.java:235) >>> at org.apache.catalina.core.ApplicationFilterChain.doFilter >>> (ApplicationFilterChain.java:206) >>> at jp.sf.fess.filter.AuthenticationFilter.doFilter(AuthenticationFilter.java:110) >>> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >>> (ApplicationFilterChain.java:235) >>> at org.apache.catalina.core.ApplicationFilterChain.doFilter >>> (ApplicationFilterChain.java:206) >>> at org.seasar.framework.container.hotdeploy.HotdeployFilter.doFilter >>> (HotdeployFilter.java:71) >>> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >>> (ApplicationFilterChain.java:235) >>> at org.apache.catalina.core.ApplicationFilterChain.doFilter >>> (ApplicationFilterChain.java:206) >>> at org.seasar.framework.container.filter.S2ContainerFilter.doFilter >>> (S2ContainerFilter.java:79) >>> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >>> (ApplicationFilterChain.java:235) >>> at org.apache.catalina.core.ApplicationFilterChain.doFilter >>> (ApplicationFilterChain.java:206) >>> at org.mobylet.core.http.MobyletFilter.processFilter(MobyletFilter.java:110) >>> at org.mobylet.core.http.MobyletFilter.doFilter(MobyletFilter.java:74) >>> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter >>> (ApplicationFilterChain.java:235) >>> at org.apache.catalina.core.ApplicationFilterChain.doFilter >>> (ApplicationFilterChain.java:206) >>> at org.apache.catalina.core.StandardWrapperValve.invoke(StandardWrapperValve.java:233) >>> at org.apache.catalina.core.StandardContextValve.invoke(StandardContextValve.java:191) >>> at org.apache.catalina.authenticator.AuthenticatorBase.invoke >>> (AuthenticatorBase.java:465) >>> at org.apache.catalina.core.StandardHostValve.invoke(StandardHostValve.java:127) >>> at org.apache.catalina.valves.ErrorReportValve.invoke(ErrorReportValve.java:102) >>> at org.apache.catalina.valves.RequestFilterValve.process(RequestFilterValve.java:269) >>> at org.apache.catalina.valves.RemoteAddrValve.invoke(RemoteAddrValve.java:81) >>> at org.apache.catalina.core.StandardEngineValve.invoke(StandardEngineValve.java:109) >>> at org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:298) >>> at org.apache.coyote.http11.Http11AprProcessor.process(Http11AprProcessor.java:859) >>> at org.apache.coyote.http11.Http11AprProtocol$Http11ConnectionHandler.process >>> (Http11AprProtocol.java:579) >>> at org.apache.tomcat.util.net.AprEndpoint$Worker.run(AprEndpoint.java:1555) >>> at java.lang.Thread.run(Thread.java:619) >>> Caused by: org.apache.solr.client.solrj.SolrServerException: java.net.SocketException: >>> Connection reset >>> at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request >>> (CommonsHttpSolrServer.java:472) >>> at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request >>> (CommonsHttpSolrServer.java:243) >>> at org.apache.solr.client.solrj.request.QueryRequest.process(QueryRequest.java:89) >>> at org.apache.solr.client.solrj.SolrServer.query(SolrServer.java:122) >>> at jp.sf.fess.solr.SolrServerGroup.query(SolrServerGroup.java:311) >>> ... 71 more >>> Caused by: java.net.SocketException: Connection reset >>> at java.net.SocketInputStream.read(SocketInputStream.java:168) >>> at java.io.BufferedInputStream.fill(BufferedInputStream.java:218) >>> at java.io.BufferedInputStream.read(BufferedInputStream.java:237) >>> at org.apache.commons.httpclient.HttpParser.readRawLine(HttpParser.java:78) >>> at org.apache.commons.httpclient.HttpParser.readLine(HttpParser.java:106) >>> at org.apache.commons.httpclient.HttpConnection.readLine(HttpConnection.java:1116) >>> at org.apache.commons.httpclient.MultiThreadedHttpConnectionManager >>> $HttpConnectionAdapter.readLine(MultiThreadedHttpConnectionManager.java:1413) >>> at org.apache.commons.httpclient.HttpMethodBase.readStatusLine >>> (HttpMethodBase.java:1973) >>> at org.apache.commons.httpclient.HttpMethodBase.readResponse(HttpMethodBase.java:1735) >>> at org.apache.commons.httpclient.HttpMethodBase.execute(HttpMethodBase.java:1098) >>> at org.apache.commons.httpclient.HttpMethodDirector.executeWithRetry >>> (HttpMethodDirector.java:398) >>> at org.apache.commons.httpclient.HttpMethodDirector.executeMethod >>> (HttpMethodDirector.java:171) >>> at org.apache.commons.httpclient.HttpClient.executeMethod(HttpClient.java:397) >>> at org.apache.commons.httpclient.HttpClient.executeMethod(HttpClient.java:323) >>> at org.apache.solr.client.solrj.impl.CommonsHttpSolrServer.request >>> (CommonsHttpSolrServer.java:416) >>> ... 75 more >>> ----- ここまで ----- >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> >>_______________________________________________ >>Fess-user mailing list >>Fess-user @ lists.sourceforge.jp >>http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From Tetsuyoshi.Kashiwazaki @ csk.com Thu May 20 14:03:28 2010 From: Tetsuyoshi.Kashiwazaki @ csk.com (Tetsuyoshi.Kashiwazaki @ csk.com) Date: Thu, 20 May 2010 14:03:28 +0900 Subject: [fess-user 201] =?iso-2022-jp?b?T1IgGyRCOCE6dyRLJEQkJCRGGyhC?= Message-ID: はじめまして。柏崎と申します。 今回全文検索を導入することになり、 Fessを使用させて頂こうと考えております。 つきましては下記質問をさせて頂きます。 検索時のOR検索はどのように行うのでしょうか? "単語1 単語2"と入れるとAND検索になってしまいます。 以上 From mshibata @ shimadzu.co.jp Thu May 20 14:14:16 2010 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Thu, 20 May 2010 14:14:16 +0900 Subject: [fess-user 202] Re: =?iso-2022-jp?b?T1IgGyRCOCE6dyRLJEQkJCRGGyhC?= In-Reply-To: References: Message-ID: <201005200514.AA12885@ea8055.shimadzu.co.jp> 柴田@亀岡市といいます。 Fess の機能の追加要求については http://sourceforge.jp/projects/fess/ticket/ ...に一覧がありますが、どうやら OR 検索はまだ実装されていないよう です。 > >はじめまして。柏崎と申します。 > >今回全文検索を導入することになり、 >Fessを使用させて頂こうと考えております。 > >つきましては下記質問をさせて頂きます。 > >検索時のOR検索はどのように行うのでしょうか? >"単語1 単語2"と入れるとAND検索になってしまいます。 > >以上 > >_______________________________________________ >Fess-user mailing list >Fess-user @ lists.sourceforge.jp >http://lists.sourceforge.jp/mailman/listinfo/fess-user > From shinsuke @ yahoo.co.jp Thu May 20 14:16:25 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Thu, 20 May 2010 14:16:25 +0900 Subject: [fess-user 203] Re: =?iso-2022-jp?b?T1IgGyRCOCE6dyRLJEQkJCRGGyhC?= In-Reply-To: <201005200514.AA12885@ea8055.shimadzu.co.jp> References: <201005200514.AA12885@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 http://sourceforge.jp/ticket/browse.php?group_id=4342&tid=21070 として近いうちに対応したいと思います。 少々お待ちください…。 shinsuke 2010年5月20日14:14 Masayuki Shibata : > 柴田@亀岡市といいます。 > > Fess の機能の追加要求については > http://sourceforge.jp/projects/fess/ticket/ > ...に一覧がありますが、どうやら OR 検索はまだ実装されていないよう > です。 > >> >>はじめまして。柏崎と申します。 >> >>今回全文検索を導入することになり、 >>Fessを使用させて頂こうと考えております。 >> >>つきましては下記質問をさせて頂きます。 >> >>検索時のOR検索はどのように行うのでしょうか? >>"単語1 単語2"と入れるとAND検索になってしまいます。 >> >>以上 >> >>_______________________________________________ >>Fess-user mailing list >>Fess-user @ lists.sourceforge.jp >>http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From mshibata @ shimadzu.co.jp Thu May 20 14:41:30 2010 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Thu, 20 May 2010 14:41:30 +0900 Subject: [fess-user 204] Re: =?iso-2022-jp?b?MjAwMTAtMDUtMTcgU05BUFNIT1QgGyRCJE4lbSUwGyhC?= =?iso-2022-jp?b?GyRCJEcbKEIuLi4=?= In-Reply-To: References: Message-ID: <201005200541.AA12886@ea8055.shimadzu.co.jp> 柴田@亀岡市です。 >MS Office 系のファイル(たぶん Excel)だと思いますが、 ... >ファイルをいただけるようでしたら、確認させていただきたい >と思います。 製品開発文書置き場の Subversion がクロール先に入っておりますの でファイルをお出しできない可能性は高いですが... そもそもどうやってファイルを特定するのでしょうか? ログのその繰り返しが発生する直前の行に登場してくるものだと Excel、Word 以外にも テキストやHTML (今回見たのは Subversion のディレクトリリスティング画面) など色々なファイルタイプのもの があります。 本日1回、Fess を更新してフルでクロールかけたところ 15 箇所で これが発生しており、ざっとスクロールして見つけた 900行ほど繰り 返すものだけかと思っておりましたら、2行とか 4行というものもあ りました。 #スクロールしながら見ていて流れてしまってました。 中身も色々で、そもそもクロールしても情報が拾えずエラーメッセー ジが出る類 (Excel ですとマクロを含んでいるので開いたときに確認 画面が出るものは、クロールしようにも内容が拾えず、通常は Java のエラーメッセージがログに出力されているようなものです) もあれ ば、ごくごく普通に開くことのできる Excel、Word ファイルもあり ます。 From Tetsuyoshi.Kashiwazaki @ csk.com Thu May 20 14:42:34 2010 From: Tetsuyoshi.Kashiwazaki @ csk.com (Tetsuyoshi.Kashiwazaki @ csk.com) Date: Thu, 20 May 2010 14:42:34 +0900 Subject: [fess-user 205] Re: =?iso-2022-jp?b?T1IgGyRCOCE6dyRLJEQkJCRGGyhC?= Message-ID: 柏崎です。 すいません。見落としていました。 ご対応お待ちしております。 ただ、一点気になるのが、 現在"単語1 OR 単語2"と入れると 不正なクエリ文字列になってしまいシステムエラーとなってしまいます。 ORだけではないかもしれませんのでエスケープ処理が必要かと思います。 以下、ログです。 "名前 OR 住所"が"((title:名前 AND title:OR AND title:住所) OR (content:名前 AND content:OR AND content:住所)) AND type:"pc""となってしまったようです。 2010/05/20 14:30:52 org.apache.solr.common.SolrException log 致命的: org.apache.solr.common.SolrException: org.apache.lucene.queryParser.ParseException: Cannot parse '((title:名前 AND title:OR AND title:住所) OR (content:名前 AND content:OR AND content:住所)) AND type:"pc"': Encountered " "OR "" at line 1, column 21. Was expecting one of: "(" ... "*" ... ... ... ... ... "[" ... "{" ... ... at org.apache.solr.handler.component.QueryComponent.prepare(QueryComponent.java:108) at org.apache.solr.handler.component.SearchHandler.handleRequestBody(SearchHandler.java:174) at org.apache.solr.handler.RequestHandlerBase.handleRequest(RequestHandlerBase.java:131) at org.apache.solr.core.SolrCore.execute(SolrCore.java:1316) at org.apache.solr.servlet.SolrDispatchFilter.execute(SolrDispatchFilter.java:338) at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:241) at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:235) at org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:206) at org.apache.catalina.core.StandardWrapperValve.invoke(StandardWrapperValve.java:233) at org.apache.catalina.core.StandardContextValve.invoke(StandardContextValve.java:191) at org.apache.catalina.authenticator.AuthenticatorBase.invoke(AuthenticatorBase.java:558) at org.apache.catalina.core.StandardHostValve.invoke(StandardHostValve.java:127) at org.apache.catalina.valves.ErrorReportValve.invoke(ErrorReportValve.java:102) at org.apache.catalina.core.StandardEngineValve.invoke(StandardEngineValve.java:109) at org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:298) at org.apache.coyote.http11.Http11Processor.process(Http11Processor.java:852) at org.apache.coyote.http11.Http11Protocol$Http11ConnectionHandler.process(Http11Protocol.java:588) at org.apache.tomcat.util.net.JIoEndpoint$Worker.run(JIoEndpoint.java:489) at java.lang.Thread.run(Thread.java:619) Caused by: org.apache.lucene.queryParser.ParseException: Cannot parse '((title:名前 AND title:OR AND title:住所) OR (content:名前 AND content:OR AND content:住所)) AND type:"pc"': Encountered " "OR "" at line 1, column 21. Was expecting one of: "(" ... "*" ... ... ... ... ... "[" ... "{" ... ... at org.apache.lucene.queryParser.QueryParser.parse(QueryParser.java:205) at org.apache.solr.search.LuceneQParser.parse(LuceneQParserPlugin.java:78) at org.apache.solr.search.QParser.getQuery(QParser.java:131) at org.apache.solr.handler.component.QueryComponent.prepare(QueryComponent.java:89) ... 18 more Caused by: org.apache.lucene.queryParser.ParseException: Encountered " "OR "" at line 1, column 21. Was expecting one of: "(" ... "*" ... ... ... ... ... "[" ... "{" ... ... at org.apache.lucene.queryParser.QueryParser.generateParseException(QueryParser.java:1846) at org.apache.lucene.queryParser.QueryParser.jj_consume_token(QueryParser.java:1728) at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1355) at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1294) at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1341) at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1265) at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1341) at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1265) at org.apache.lucene.queryParser.QueryParser.TopLevelQuery(QueryParser.java:1254) at org.apache.lucene.queryParser.QueryParser.parse(QueryParser.java:200) ... 21 more 以上 Shinsuke Sugaya @lists.sourceforge.jp 2010/05/20 14:16:25 fess-user @ lists.sourceforge.jpに返信してください 送信者: fess-user-bounces @ lists.sourceforge.jp 宛先: fess-user @ lists.sourceforge.jp cc: 件名: [fess-user 203] Re: OR 検索について 菅谷です。 http://sourceforge.jp/ticket/browse.php?group_id=4342&tid=21070 として近いうちに対応したいと思います。 少々お待ちください…。 shinsuke 2010年5月20日14:14 Masayuki Shibata : > 柴田@亀岡市といいます。 > > Fess の機能の追加要求については > http://sourceforge.jp/projects/fess/ticket/ > ...に一覧がありますが、どうやら OR 検索はまだ実装されていないよう > です。 > >> >>はじめまして。柏崎と申します。 >> >>今回全文検索を導入することになり、 >>Fessを使用させて頂こうと考えております。 >> >>つきましては下記質問をさせて頂きます。 >> >>検索時のOR検索はどのように行うのでしょうか? >>"単語1 単語2"と入れるとAND検索になってしまいます。 >> >>以上 >> >>_______________________________________________ >>Fess-user mailing list >>Fess-user @ lists.sourceforge.jp >>http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > _______________________________________________ Fess-user mailing list Fess-user @ lists.sourceforge.jp http://lists.sourceforge.jp/mailman/listinfo/fess-user From shinsuke @ yahoo.co.jp Thu May 20 14:58:29 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Thu, 20 May 2010 14:58:29 +0900 Subject: [fess-user 206] Re: =?iso-2022-jp?b?T1IgGyRCOCE6dyRLJEQkJCRGGyhC?= In-Reply-To: References: Message-ID: 菅谷です。 情報をありがとうございます。 そのエラーも合わせて対応します。 shinsuke 2010年5月20日14:42 : > > > 柏崎です。 > > すいません。見落としていました。 > ご対応お待ちしております。 > > ただ、一点気になるのが、 > 現在"単語1 OR 単語2"と入れると > 不正なクエリ文字列になってしまいシステムエラーとなってしまいます。 > ORだけではないかもしれませんのでエスケープ処理が必要かと思います。 > > 以下、ログです。 > "名前 OR 住所"が"((title:名前 AND title:OR AND title:住所) OR (content:名前 > AND content:OR AND content:住所)) AND type:"pc""となってしまったようです。 > > 2010/05/20 14:30:52 org.apache.solr.common.SolrException log > 致命的: org.apache.solr.common.SolrException: org.apache.lucene.queryParser.ParseException: Cannot parse '((title:名前 AND title:OR AND title:住所) OR > (content:名前 AND content:OR AND content:住所)) AND type:"pc"': Encountered " "OR "" at line 1, column 21. > Was expecting one of: > "(" ... > "*" ... > ... > ... > ... > ... > "[" ... > "{" ... > ... > > at org.apache.solr.handler.component.QueryComponent.prepare(QueryComponent.java:108) > at org.apache.solr.handler.component.SearchHandler.handleRequestBody(SearchHandler.java:174) > at org.apache.solr.handler.RequestHandlerBase.handleRequest(RequestHandlerBase.java:131) > at org.apache.solr.core.SolrCore.execute(SolrCore.java:1316) > at org.apache.solr.servlet.SolrDispatchFilter.execute(SolrDispatchFilter.java:338) > at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:241) > at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:235) > at org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:206) > at org.apache.catalina.core.StandardWrapperValve.invoke(StandardWrapperValve.java:233) > at org.apache.catalina.core.StandardContextValve.invoke(StandardContextValve.java:191) > at org.apache.catalina.authenticator.AuthenticatorBase.invoke(AuthenticatorBase.java:558) > at org.apache.catalina.core.StandardHostValve.invoke(StandardHostValve.java:127) > at org.apache.catalina.valves.ErrorReportValve.invoke(ErrorReportValve.java:102) > at org.apache.catalina.core.StandardEngineValve.invoke(StandardEngineValve.java:109) > at org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:298) > at org.apache.coyote.http11.Http11Processor.process(Http11Processor.java:852) > at org.apache.coyote.http11.Http11Protocol$Http11ConnectionHandler.process(Http11Protocol.java:588) > at org.apache.tomcat.util.net.JIoEndpoint$Worker.run(JIoEndpoint.java:489) > at java.lang.Thread.run(Thread.java:619) > Caused by: org.apache.lucene.queryParser.ParseException: Cannot parse '((title:名前 AND title:OR AND title:住所) OR (content:名前 AND content:OR AND > content:住所)) AND type:"pc"': Encountered " "OR "" at line 1, column 21. > Was expecting one of: > "(" ... > "*" ... > ... > ... > ... > ... > "[" ... > "{" ... > ... > > at org.apache.lucene.queryParser.QueryParser.parse(QueryParser.java:205) > at org.apache.solr.search.LuceneQParser.parse(LuceneQParserPlugin.java:78) > at org.apache.solr.search.QParser.getQuery(QParser.java:131) > at org.apache.solr.handler.component.QueryComponent.prepare(QueryComponent.java:89) > ... 18 more > Caused by: org.apache.lucene.queryParser.ParseException: Encountered " "OR "" at line 1, column 21. > Was expecting one of: > "(" ... > "*" ... > ... > ... > ... > ... > "[" ... > "{" ... > ... > > at org.apache.lucene.queryParser.QueryParser.generateParseException(QueryParser.java:1846) > at org.apache.lucene.queryParser.QueryParser.jj_consume_token(QueryParser.java:1728) > at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1355) > at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1294) > at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1341) > at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1265) > at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1341) > at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1265) > at org.apache.lucene.queryParser.QueryParser.TopLevelQuery(QueryParser.java:1254) > at org.apache.lucene.queryParser.QueryParser.parse(QueryParser.java:200) > ... 21 more > > 以上 > > > > > > Shinsuke Sugaya @lists.sourceforge.jp 2010/05/20 > 14:16:25 > > fess-user @ lists.sourceforge.jpに返信してください > > 送信者: fess-user-bounces @ lists.sourceforge.jp > > > 宛先: fess-user @ lists.sourceforge.jp > cc: > 件名: [fess-user 203] Re: OR 検索について > > > 菅谷です。 > > http://sourceforge.jp/ticket/browse.php?group_id=4342&tid=21070 > として近いうちに対応したいと思います。 > 少々お待ちください…。 > > shinsuke > > > 2010年5月20日14:14 Masayuki Shibata : >> 柴田@亀岡市といいます。 >> >> Fess の機能の追加要求については >> http://sourceforge.jp/projects/fess/ticket/ >> ...に一覧がありますが、どうやら OR 検索はまだ実装されていないよう >> です。 >> >>> >>>はじめまして。柏崎と申します。 >>> >>>今回全文検索を導入することになり、 >>>Fessを使用させて頂こうと考えております。 >>> >>>つきましては下記質問をさせて頂きます。 >>> >>>検索時のOR検索はどのように行うのでしょうか? >>>"単語1 単語2"と入れるとAND検索になってしまいます。 >>> >>>以上 >>> >>>_______________________________________________ >>>Fess-user mailing list >>>Fess-user @ lists.sourceforge.jp >>>http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From shinsuke @ yahoo.co.jp Thu May 20 15:44:48 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Thu, 20 May 2010 15:44:48 +0900 Subject: [fess-user 207] Re: =?iso-2022-jp?b?MjAwMTAtMDUtMTcgU05BUFNIT1QgGyRCJE4lbSUwGyhC?= =?iso-2022-jp?b?GyRCJEcbKEIuLi4=?= In-Reply-To: <201005200541.AA12886@ea8055.shimadzu.co.jp> References: <201005200541.AA12886@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 > そもそもどうやってファイルを特定するのでしょうか? ログに出ている [Robot-20100520113221-1-10] という 部分の最後の数字がスレッドごとに異なります。 ですので、[Robot-20100520113221-1-10] と出力されて いるものの中で、それの上に出ているものから特定できます。 クロールしているものは INFO レベルで Crawling URL: http://.. という感じのログで出力されます。 現在、POI 自体をバージョンアップしてあるので、Exception の内容を評価しなければならないと考えています。問題自体は POI の問題なので、なかなか対応も難しいところもありますが…。 shinsuke 2010年5月20日14:41 Masayuki Shibata : > 柴田@亀岡市です。 > >>MS Office 系のファイル(たぶん Excel)だと思いますが、 > ... >>ファイルをいただけるようでしたら、確認させていただきたい >>と思います。 > > 製品開発文書置き場の Subversion がクロール先に入っておりますの > でファイルをお出しできない可能性は高いですが... > > そもそもどうやってファイルを特定するのでしょうか? > > ログのその繰り返しが発生する直前の行に登場してくるものだと > Excel、Word 以外にも テキストやHTML (今回見たのは Subversion > のディレクトリリスティング画面) など色々なファイルタイプのもの > があります。 > > 本日1回、Fess を更新してフルでクロールかけたところ 15 箇所で > これが発生しており、ざっとスクロールして見つけた 900行ほど繰り > 返すものだけかと思っておりましたら、2行とか 4行というものもあ > りました。 > #スクロールしながら見ていて流れてしまってました。 > > 中身も色々で、そもそもクロールしても情報が拾えずエラーメッセー > ジが出る類 (Excel ですとマクロを含んでいるので開いたときに確認 > 画面が出るものは、クロールしようにも内容が拾えず、通常は Java > のエラーメッセージがログに出力されているようなものです) もあれ > ば、ごくごく普通に開くことのできる Excel、Word ファイルもあり > ます。 > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From mshibata @ shimadzu.co.jp Thu May 20 16:44:04 2010 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Thu, 20 May 2010 16:44:04 +0900 Subject: [fess-user 208] Re: =?iso-2022-jp?b?MjAwMTAtMDUtMTcgU05BUFNIT1QgGyRCJE4lbSUwGyhC?= =?iso-2022-jp?b?GyRCJEcbKEIuLi4=?= In-Reply-To: References: Message-ID: <201005200744.AA12888@ea8055.shimadzu.co.jp> 確かに Excel が多いです。全 15 ファイル中 13 あります。 残り2個が Word ファイルですが、エラー行とかなり離れて上の方に登場 してます。Excel だと 2-3 行上を探せばたいがい見つかるのですが... 残念ながらお出しできそうなファイルはありませんので、自分で目視で見 てみたのですが、何の変哲もないファイルに見えます。 #特徴を絞り込めませんでした。 ログのエラー行も 1箇所から 928箇所まで千差万別です。 単純な表を書いただけという Excel も混じってます。 #どうやってアプローチすべきか途方に暮れますね。 >菅谷です。 > >> そもそもどうやってファイルを特定するのでしょうか? > >ログに出ている [Robot-20100520113221-1-10] という >部分の最後の数字がスレッドごとに異なります。 >ですので、[Robot-20100520113221-1-10] と出力されて >いるものの中で、それの上に出ているものから特定できます。 >クロールしているものは INFO レベルで Crawling URL: http://.. >という感じのログで出力されます。 > >現在、POI 自体をバージョンアップしてあるので、Exception >の内容を評価しなければならないと考えています。問題自体は >POI の問題なので、なかなか対応も難しいところもありますが…。 > >shinsuke > > >2010年5月20日14:41 Masayuki Shibata : >> 柴田@亀岡市です。 >> >>>MS Office 系のファイル(たぶん Excel)だと思いますが、 >> ... >>>ファイルをいただけるようでしたら、確認させていただきたい >>>と思います。 >> >> 製品開発文書置き場の Subversion がクロール先に入っておりますの >> でファイルをお出しできない可能性は高いですが... >> >> そもそもどうやってファイルを特定するのでしょうか? >> >> ログのその繰り返しが発生する直前の行に登場してくるものだと >> Excel、Word 以外にも テキストやHTML (今回見たのは Subversion >> のディレクトリリスティング画面) など色々なファイルタイプのもの >> があります。 >> >> 本日1回、Fess を更新してフルでクロールかけたところ 15 箇所で >> これが発生しており、ざっとスクロールして見つけた 900行ほど繰り >> 返すものだけかと思っておりましたら、2行とか 4行というものもあ >> りました。 >> #スクロールしながら見ていて流れてしまってました。 >> >> 中身も色々で、そもそもクロールしても情報が拾えずエラーメッセー >> ジが出る類 (Excel ですとマクロを含んでいるので開いたときに確認 >> 画面が出るものは、クロールしようにも内容が拾えず、通常は Java >> のエラーメッセージがログに出力されているようなものです) もあれ >> ば、ごくごく普通に開くことのできる Excel、Word ファイルもあり >> ます。 >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > >_______________________________________________ >Fess-user mailing list >Fess-user @ lists.sourceforge.jp >http://lists.sourceforge.jp/mailman/listinfo/fess-user > From mshibata @ shimadzu.co.jp Fri May 21 09:33:45 2010 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Fri, 21 May 2010 09:33:45 +0900 Subject: [fess-user 209] Re: =?iso-2022-jp?b?MjAwMTAtMDUtMTcgU05BUFNIT1QgGyRCJE4lbSUwGyhC?= =?iso-2022-jp?b?GyRCJEcbKEIuLi4=?= In-Reply-To: <201005200744.AA12888@ea8055.shimadzu.co.jp> References: <201005200744.AA12888@ea8055.shimadzu.co.jp> Message-ID: <201005210033.AA12896@ea8055.shimadzu.co.jp> 柴田@亀岡市です。 ひとつだけどう読んでも何を開発しているかわからないもの がありました。 ファイル名だけがやばかったのでリネームしてあります。 たまたま対象ファイル中で一番単純な表のファイルでエラー 行は1行だけ出力されているものです。 >確かに Excel が多いです。全 15 ファイル中 13 あります。 > >残り2個が Word ファイルですが、エラー行とかなり離れて上の方に登場 >してます。Excel だと 2-3 行上を探せばたいがい見つかるのですが... > >残念ながらお出しできそうなファイルはありませんので、自分で目視で見 >てみたのですが、何の変哲もないファイルに見えます。 >#特徴を絞り込めませんでした。 > >ログのエラー行も 1箇所から 928箇所まで千差万別です。 > >単純な表を書いただけという Excel も混じってます。 >#どうやってアプローチすべきか途方に暮れますね。 > >>菅谷です。 >> >>> そもそもどうやってファイルを特定するのでしょうか? >> >>ログに出ている [Robot-20100520113221-1-10] という >>部分の最後の数字がスレッドごとに異なります。 >>ですので、[Robot-20100520113221-1-10] と出力されて >>いるものの中で、それの上に出ているものから特定できます。 >>クロールしているものは INFO レベルで Crawling URL: http://.. >>という感じのログで出力されます。 >> >>現在、POI 自体をバージョンアップしてあるので、Exception >>の内容を評価しなければならないと考えています。問題自体は >>POI の問題なので、なかなか対応も難しいところもありますが…。 >> >>shinsuke >> >> >>2010年5月20日14:41 Masayuki Shibata : >>> 柴田@亀岡市です。 >>> >>>>MS Office 系のファイル(たぶん Excel)だと思いますが、 >>> ... >>>>ファイルをいただけるようでしたら、確認させていただきたい >>>>と思います。 >>> >>> 製品開発文書置き場の Subversion がクロール先に入っておりますの >>> でファイルをお出しできない可能性は高いですが... >>> >>> そもそもどうやってファイルを特定するのでしょうか? >>> >>> ログのその繰り返しが発生する直前の行に登場してくるものだと >>> Excel、Word 以外にも テキストやHTML (今回見たのは Subversion >>> のディレクトリリスティング画面) など色々なファイルタイプのもの >>> があります。 >>> >>> 本日1回、Fess を更新してフルでクロールかけたところ 15 箇所で >>> これが発生しており、ざっとスクロールして見つけた 900行ほど繰り >>> 返すものだけかと思っておりましたら、2行とか 4行というものもあ >>> りました。 >>> #スクロールしながら見ていて流れてしまってました。 >>> >>> 中身も色々で、そもそもクロールしても情報が拾えずエラーメッセー >>> ジが出る類 (Excel ですとマクロを含んでいるので開いたときに確認 >>> 画面が出るものは、クロールしようにも内容が拾えず、通常は Java >>> のエラーメッセージがログに出力されているようなものです) もあれ >>> ば、ごくごく普通に開くことのできる Excel、Word ファイルもあり >>> ます。 >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> >>_______________________________________________ >>Fess-user mailing list >>Fess-user @ lists.sourceforge.jp >>http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > >_______________________________________________ >Fess-user mailing list >Fess-user @ lists.sourceforge.jp >http://lists.sourceforge.jp/mailman/listinfo/fess-user > -------------- next part -------------- テキスト形式以外の添付ファイルを保管しました... ファイル名: 結合テストスケジュール.xls 型: application/vnd.ms-excel サイズ: 18944 バイト 説明: 無し URL: http://lists.sourceforge.jp/mailman/archives/fess-user/attachments/20100521/0c1367b8/attachment-0001.xls From shinsuke @ yahoo.co.jp Fri May 21 09:42:45 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Fri, 21 May 2010 09:42:45 +0900 Subject: [fess-user 210] Re: =?iso-2022-jp?b?MjAwMTAtMDUtMTcgU05BUFNIT1QgGyRCJE4lbSUwGyhC?= =?iso-2022-jp?b?GyRCJEcbKEIuLi4=?= In-Reply-To: <201005210033.AA12896@ea8055.shimadzu.co.jp> References: <201005200744.AA12888@ea8055.shimadzu.co.jp> <201005210033.AA12896@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 ありがとうございます! 利用させていただきます。 shinsuke 2010年5月21日9:33 Masayuki Shibata : > 柴田@亀岡市です。 > > ひとつだけどう読んでも何を開発しているかわからないもの > がありました。 > > ファイル名だけがやばかったのでリネームしてあります。 > > たまたま対象ファイル中で一番単純な表のファイルでエラー > 行は1行だけ出力されているものです。 > >>確かに Excel が多いです。全 15 ファイル中 13 あります。 >> >>残り2個が Word ファイルですが、エラー行とかなり離れて上の方に登場 >>してます。Excel だと 2-3 行上を探せばたいがい見つかるのですが... >> >>残念ながらお出しできそうなファイルはありませんので、自分で目視で見 >>てみたのですが、何の変哲もないファイルに見えます。 >>#特徴を絞り込めませんでした。 >> >>ログのエラー行も 1箇所から 928箇所まで千差万別です。 >> >>単純な表を書いただけという Excel も混じってます。 >>#どうやってアプローチすべきか途方に暮れますね。 >> >>>菅谷です。 >>> >>>> そもそもどうやってファイルを特定するのでしょうか? >>> >>>ログに出ている [Robot-20100520113221-1-10] という >>>部分の最後の数字がスレッドごとに異なります。 >>>ですので、[Robot-20100520113221-1-10] と出力されて >>>いるものの中で、それの上に出ているものから特定できます。 >>>クロールしているものは INFO レベルで Crawling URL: http://.. >>>という感じのログで出力されます。 >>> >>>現在、POI 自体をバージョンアップしてあるので、Exception >>>の内容を評価しなければならないと考えています。問題自体は >>>POI の問題なので、なかなか対応も難しいところもありますが…。 >>> >>>shinsuke >>> >>> >>>2010年5月20日14:41 Masayuki Shibata : >>>> 柴田@亀岡市です。 >>>> >>>>>MS Office 系のファイル(たぶん Excel)だと思いますが、 >>>> ... >>>>>ファイルをいただけるようでしたら、確認させていただきたい >>>>>と思います。 >>>> >>>> 製品開発文書置き場の Subversion がクロール先に入っておりますの >>>> でファイルをお出しできない可能性は高いですが... >>>> >>>> そもそもどうやってファイルを特定するのでしょうか? >>>> >>>> ログのその繰り返しが発生する直前の行に登場してくるものだと >>>> Excel、Word 以外にも テキストやHTML (今回見たのは Subversion >>>> のディレクトリリスティング画面) など色々なファイルタイプのもの >>>> があります。 >>>> >>>> 本日1回、Fess を更新してフルでクロールかけたところ 15 箇所で >>>> これが発生しており、ざっとスクロールして見つけた 900行ほど繰り >>>> 返すものだけかと思っておりましたら、2行とか 4行というものもあ >>>> りました。 >>>> #スクロールしながら見ていて流れてしまってました。 >>>> >>>> 中身も色々で、そもそもクロールしても情報が拾えずエラーメッセー >>>> ジが出る類 (Excel ですとマクロを含んでいるので開いたときに確認 >>>> 画面が出るものは、クロールしようにも内容が拾えず、通常は Java >>>> のエラーメッセージがログに出力されているようなものです) もあれ >>>> ば、ごくごく普通に開くことのできる Excel、Word ファイルもあり >>>> ます。 >>>> >>>> _______________________________________________ >>>> Fess-user mailing list >>>> Fess-user @ lists.sourceforge.jp >>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>> >>> >>>_______________________________________________ >>>Fess-user mailing list >>>Fess-user @ lists.sourceforge.jp >>>http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> >>_______________________________________________ >>Fess-user mailing list >>Fess-user @ lists.sourceforge.jp >>http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > > From mshibata @ shimadzu.co.jp Fri May 21 09:44:02 2010 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Fri, 21 May 2010 09:44:02 +0900 Subject: [fess-user 211] =?iso-2022-jp?b?GyRCJS8lbSE8JWtCUD5dMzAbKEIgVVJMIBskQiQsGyhCIElu?= =?iso-2022-jp?b?dmFsaWQgY2hpbGQgVVJM?= In-Reply-To: <201005200744.AA12888@ea8055.shimadzu.co.jp> References: <201005200744.AA12888@ea8055.shimadzu.co.jp> Message-ID: <201005210044.AA12897@ea8055.shimadzu.co.jp> 柴田@亀岡市です。 以前はページ内にリンクがあっても、クロール対象 URL の範囲でないもの を呼ぼうとしていなかったように思う (私の錯覚?) のですが、ログを見る と範囲外の URL にアクセスに行こうとして題記のエラーになっているよう です。 3.1.0 の 5月18日のスナップショットで気づきましたが、いつ頃から発生し ているかはわかりません。 結局エラーになるので結果は変わりませんし、もしかしてそういう仕様もあ るのかも知れませんが、以前のログでは気づきませんでした。 From shinsuke @ yahoo.co.jp Fri May 21 10:03:40 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Fri, 21 May 2010 10:03:40 +0900 Subject: [fess-user 212] Re: =?iso-2022-jp?b?GyRCJS8lbSE8JWtCUD5dMzAbKEIgVVJMIBskQiQsGyhC?= =?iso-2022-jp?b?IEludmFsaWQgY2hpbGQgVVJM?= In-Reply-To: <201005210044.AA12897@ea8055.shimadzu.co.jp> References: <201005200744.AA12888@ea8055.shimadzu.co.jp> <201005210044.AA12897@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 情報をありがとうございます。 コードを確認したところ、そのログが出る状況は 現在クロールしているファイル内に含まれる URL を 正規化していく中で、URL を正規化できなかった、 という状況でした。ですので、その URL に対して クロールは試みてない感じです。メッセージ内容的に わかりにくというのもあるので、修正したいと思います。 ありがとうございました。 shinsuke 2010年5月21日9:44 Masayuki Shibata : > 柴田@亀岡市です。 > > 以前はページ内にリンクがあっても、クロール対象 URL の範囲でないもの > を呼ぼうとしていなかったように思う (私の錯覚?) のですが、ログを見る > と範囲外の URL にアクセスに行こうとして題記のエラーになっているよう > です。 > > 3.1.0 の 5月18日のスナップショットで気づきましたが、いつ頃から発生し > ているかはわかりません。 > > 結局エラーになるので結果は変わりませんし、もしかしてそういう仕様もあ > るのかも知れませんが、以前のログでは気づきませんでした。 > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From shinsuke @ yahoo.co.jp Sun May 23 08:57:54 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Sun, 23 May 2010 08:57:54 +0900 Subject: [fess-user 213] Re: =?iso-2022-jp?b?T1IgGyRCOCE6dyRLJEQkJCRGGyhC?= In-Reply-To: References: Message-ID: 菅谷です。 or 検索に対応しました(ついでにnot検索も対応)。 利用方法は ほげ OR ふが というように OR でつなぎます。 not検索は NOT ほげ ほげ NOT ふが のようにします。ただし、 NOT ほげ OR NOT ふが のような not の or 検索はできません。 問題がありましたら、お知らせください。 shinsuke 2010年5月20日14:58 Shinsuke Sugaya : > 菅谷です。 > > 情報をありがとうございます。 > そのエラーも合わせて対応します。 > > shinsuke > > > 2010年5月20日14:42 : >> >> >> 柏崎です。 >> >> すいません。見落としていました。 >> ご対応お待ちしております。 >> >> ただ、一点気になるのが、 >> 現在"単語1 OR 単語2"と入れると >> 不正なクエリ文字列になってしまいシステムエラーとなってしまいます。 >> ORだけではないかもしれませんのでエスケープ処理が必要かと思います。 >> >> 以下、ログです。 >> "名前 OR 住所"が"((title:名前 AND title:OR AND title:住所) OR (content:名前 >> AND content:OR AND content:住所)) AND type:"pc""となってしまったようです。 >> >> 2010/05/20 14:30:52 org.apache.solr.common.SolrException log >> 致命的: org.apache.solr.common.SolrException: org.apache.lucene.queryParser.ParseException: Cannot parse '((title:名前 AND title:OR AND title:住所) OR >> (content:名前 AND content:OR AND content:住所)) AND type:"pc"': Encountered " "OR "" at line 1, column 21. >> Was expecting one of: >> "(" ... >> "*" ... >> ... >> ... >> ... >> ... >> "[" ... >> "{" ... >> ... >> >> at org.apache.solr.handler.component.QueryComponent.prepare(QueryComponent.java:108) >> at org.apache.solr.handler.component.SearchHandler.handleRequestBody(SearchHandler.java:174) >> at org.apache.solr.handler.RequestHandlerBase.handleRequest(RequestHandlerBase.java:131) >> at org.apache.solr.core.SolrCore.execute(SolrCore.java:1316) >> at org.apache.solr.servlet.SolrDispatchFilter.execute(SolrDispatchFilter.java:338) >> at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:241) >> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:235) >> at org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:206) >> at org.apache.catalina.core.StandardWrapperValve.invoke(StandardWrapperValve.java:233) >> at org.apache.catalina.core.StandardContextValve.invoke(StandardContextValve.java:191) >> at org.apache.catalina.authenticator.AuthenticatorBase.invoke(AuthenticatorBase.java:558) >> at org.apache.catalina.core.StandardHostValve.invoke(StandardHostValve.java:127) >> at org.apache.catalina.valves.ErrorReportValve.invoke(ErrorReportValve.java:102) >> at org.apache.catalina.core.StandardEngineValve.invoke(StandardEngineValve.java:109) >> at org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:298) >> at org.apache.coyote.http11.Http11Processor.process(Http11Processor.java:852) >> at org.apache.coyote.http11.Http11Protocol$Http11ConnectionHandler.process(Http11Protocol.java:588) >> at org.apache.tomcat.util.net.JIoEndpoint$Worker.run(JIoEndpoint.java:489) >> at java.lang.Thread.run(Thread.java:619) >> Caused by: org.apache.lucene.queryParser.ParseException: Cannot parse '((title:名前 AND title:OR AND title:住所) OR (content:名前 AND content:OR AND >> content:住所)) AND type:"pc"': Encountered " "OR "" at line 1, column 21. >> Was expecting one of: >> "(" ... >> "*" ... >> ... >> ... >> ... >> ... >> "[" ... >> "{" ... >> ... >> >> at org.apache.lucene.queryParser.QueryParser.parse(QueryParser.java:205) >> at org.apache.solr.search.LuceneQParser.parse(LuceneQParserPlugin.java:78) >> at org.apache.solr.search.QParser.getQuery(QParser.java:131) >> at org.apache.solr.handler.component.QueryComponent.prepare(QueryComponent.java:89) >> ... 18 more >> Caused by: org.apache.lucene.queryParser.ParseException: Encountered " "OR "" at line 1, column 21. >> Was expecting one of: >> "(" ... >> "*" ... >> ... >> ... >> ... >> ... >> "[" ... >> "{" ... >> ... >> >> at org.apache.lucene.queryParser.QueryParser.generateParseException(QueryParser.java:1846) >> at org.apache.lucene.queryParser.QueryParser.jj_consume_token(QueryParser.java:1728) >> at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1355) >> at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1294) >> at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1341) >> at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1265) >> at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1341) >> at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1265) >> at org.apache.lucene.queryParser.QueryParser.TopLevelQuery(QueryParser.java:1254) >> at org.apache.lucene.queryParser.QueryParser.parse(QueryParser.java:200) >> ... 21 more >> >> 以上 >> >> >> >> >> >> Shinsuke Sugaya @lists.sourceforge.jp 2010/05/20 >> 14:16:25 >> >> fess-user @ lists.sourceforge.jpに返信してください >> >> 送信者: fess-user-bounces @ lists.sourceforge.jp >> >> >> 宛先: fess-user @ lists.sourceforge.jp >> cc: >> 件名: [fess-user 203] Re: OR 検索について >> >> >> 菅谷です。 >> >> http://sourceforge.jp/ticket/browse.php?group_id=4342&tid=21070 >> として近いうちに対応したいと思います。 >> 少々お待ちください…。 >> >> shinsuke >> >> >> 2010年5月20日14:14 Masayuki Shibata : >>> 柴田@亀岡市といいます。 >>> >>> Fess の機能の追加要求については >>> http://sourceforge.jp/projects/fess/ticket/ >>> ...に一覧がありますが、どうやら OR 検索はまだ実装されていないよう >>> です。 >>> >>>> >>>>はじめまして。柏崎と申します。 >>>> >>>>今回全文検索を導入することになり、 >>>>Fessを使用させて頂こうと考えております。 >>>> >>>>つきましては下記質問をさせて頂きます。 >>>> >>>>検索時のOR検索はどのように行うのでしょうか? >>>>"単語1 単語2"と入れるとAND検索になってしまいます。 >>>> >>>>以上 >>>> >>>>_______________________________________________ >>>>Fess-user mailing list >>>>Fess-user @ lists.sourceforge.jp >>>>http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>> >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > From mshibata @ shimadzu.co.jp Mon May 24 08:33:45 2010 From: mshibata @ shimadzu.co.jp (Masayuki Shibata) Date: Mon, 24 May 2010 08:33:45 +0900 Subject: [fess-user 214] Re: =?iso-2022-jp?b?T1IgGyRCOCE6dyRLJEQkJCRGGyhC?= In-Reply-To: References: Message-ID: <201005232333.AA12914@ea8055.shimadzu.co.jp> 柴田@亀岡市です。 ごくごく普通に質問です。 NOT のエスケープする方法はどうなっていますか? #NOT 自体が検索文字列の場合の指定方法です。 OR はそもそも短すぎて検索文字としては無視されるのですよね? >菅谷です。 > >or 検索に対応しました(ついでにnot検索も対応)。 >利用方法は > >ほげ OR ふが > >というように OR でつなぎます。 >not検索は > >NOT ほげ >ほげ NOT ふが > >のようにします。ただし、 > >NOT ほげ OR NOT ふが > >のような not の or 検索はできません。 >問題がありましたら、お知らせください。 > >shinsuke > > >2010年5月20日14:58 Shinsuke Sugaya : >> 菅谷です。 >> >> 情報をありがとうございます。 >> そのエラーも合わせて対応します。 >> >> shinsuke >> >> >> 2010年5月20日14:42 : >>> >>> >>> 柏崎です。 >>> >>> すいません。見落としていました。 >>> ご対応お待ちしております。 >>> >>> ただ、一点気になるのが、 >>> 現在"単語1 OR 単語2"と入れると >>> 不正なクエリ文字列になってしまいシステムエラーとなってしまいます。 >>> ORだけではないかもしれませんのでエスケープ処理が必要かと思います。 >>> >>> 以下、ログです。 >>> "名前 OR 住所"が"((title:名前 AND title:OR AND title:住所) OR (content:名前 >>> AND content:OR AND content:住所)) AND type:"pc""となってしまったようです。 >>> >>> 2010/05/20 14:30:52 org.apache.solr.common.SolrException log >>> 致命的: org.apache.solr.common.SolrException: org.apache.lucene.queryParser.ParseException: Cannot parse '((title:名前 AND title:OR AND title:住所) OR >>> (content:名前 AND content:OR AND content:住所)) AND type:"pc"': Encountered " "OR "" at line 1, column 21. >>> Was expecting one of: >>> "(" ... >>> "*" ... >>> ... >>> ... >>> ... >>> ... >>> "[" ... >>> "{" ... >>> ... >>> >>> at org.apache.solr.handler.component.QueryComponent.prepare(QueryComponent.java:108) >>> at org.apache.solr.handler.component.SearchHandler.handleRequestBody (SearchHandler.java:174) >>> at org.apache.solr.handler.RequestHandlerBase.handleRequest(RequestHandlerBase.java:131) >>> at org.apache.solr.core.SolrCore.execute(SolrCore.java:1316) >>> at org.apache.solr.servlet.SolrDispatchFilter.execute(SolrDispatchFilter.java:338) >>> at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:241) >>> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter (ApplicationFilterChain.java:235) >>> at org.apache.catalina.core.ApplicationFilterChain.doFilter (ApplicationFilterChain.java:206) >>> at org.apache.catalina.core.StandardWrapperValve.invoke(StandardWrapperValve.java:233) >>> at org.apache.catalina.core.StandardContextValve.invoke(StandardContextValve.java:191) >>> at org.apache.catalina.authenticator.AuthenticatorBase.invoke (AuthenticatorBase.java:558) >>> at org.apache.catalina.core.StandardHostValve.invoke(StandardHostValve.java:127) >>> at org.apache.catalina.valves.ErrorReportValve.invoke(ErrorReportValve.java:102) >>> at org.apache.catalina.core.StandardEngineValve.invoke(StandardEngineValve.java:109) >>> at org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:298) >>> at org.apache.coyote.http11.Http11Processor.process(Http11Processor.java:852) >>> at org.apache.coyote.http11.Http11Protocol$Http11ConnectionHandler.process (Http11Protocol.java:588) >>> at org.apache.tomcat.util.net.JIoEndpoint$Worker.run(JIoEndpoint.java:489) >>> at java.lang.Thread.run(Thread.java:619) >>> Caused by: org.apache.lucene.queryParser.ParseException: Cannot parse '((title:名前 AND title:OR AND title:住所) OR (content:名前 AND content:OR AND >>> content:住所)) AND type:"pc"': Encountered " "OR "" at line 1, column 21. >>> Was expecting one of: >>> "(" ... >>> "*" ... >>> ... >>> ... >>> ... >>> ... >>> "[" ... >>> "{" ... >>> ... >>> >>> at org.apache.lucene.queryParser.QueryParser.parse(QueryParser.java:205) >>> at org.apache.solr.search.LuceneQParser.parse(LuceneQParserPlugin.java:78) >>> at org.apache.solr.search.QParser.getQuery(QParser.java:131) >>> at org.apache.solr.handler.component.QueryComponent.prepare(QueryComponent.java:89) >>> ... 18 more >>> Caused by: org.apache.lucene.queryParser.ParseException: Encountered " "OR "" at line 1, column 21. >>> Was expecting one of: >>> "(" ... >>> "*" ... >>> ... >>> ... >>> ... >>> ... >>> "[" ... >>> "{" ... >>> ... >>> >>> at org.apache.lucene.queryParser.QueryParser.generateParseException (QueryParser.java:1846) >>> at org.apache.lucene.queryParser.QueryParser.jj_consume_token(QueryParser.java:1728) >>> at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1355) >>> at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1294) >>> at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1341) >>> at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1265) >>> at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1341) >>> at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1265) >>> at org.apache.lucene.queryParser.QueryParser.TopLevelQuery(QueryParser.java:1254) >>> at org.apache.lucene.queryParser.QueryParser.parse(QueryParser.java:200) >>> ... 21 more >>> >>> 以上 >>> >>> >>> >>> >>> >>> Shinsuke Sugaya @lists.sourceforge.jp 2010/05/20 >>> 14:16:25 >>> >>> fess-user @ lists.sourceforge.jpに返信してください >>> >>> 送信者: fess-user-bounces @ lists.sourceforge.jp >>> >>> >>> 宛先: fess-user @ lists.sourceforge.jp >>> cc: >>> 件名: [fess-user 203] Re: OR 検索について >>> >>> >>> 菅谷です。 >>> >>> http://sourceforge.jp/ticket/browse.php?group_id=4342&tid=21070 >>> として近いうちに対応したいと思います。 >>> 少々お待ちください…。 >>> >>> shinsuke >>> >>> >>> 2010年5月20日14:14 Masayuki Shibata : >>>> 柴田@亀岡市といいます。 >>>> >>>> Fess の機能の追加要求については >>>> http://sourceforge.jp/projects/fess/ticket/ >>>> ...に一覧がありますが、どうやら OR 検索はまだ実装されていないよう >>>> です。 >>>> >>>>> >>>>>はじめまして。柏崎と申します。 >>>>> >>>>>今回全文検索を導入することになり、 >>>>>Fessを使用させて頂こうと考えております。 >>>>> >>>>>つきましては下記質問をさせて頂きます。 >>>>> >>>>>検索時のOR検索はどのように行うのでしょうか? >>>>>"単語1 単語2"と入れるとAND検索になってしまいます。 >>>>> >>>>>以上 >>>>> >>>>>_______________________________________________ >>>>>Fess-user mailing list >>>>>Fess-user @ lists.sourceforge.jp >>>>>http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>>> >>>> >>>> _______________________________________________ >>>> Fess-user mailing list >>>> Fess-user @ lists.sourceforge.jp >>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>> >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> > >_______________________________________________ >Fess-user mailing list >Fess-user @ lists.sourceforge.jp >http://lists.sourceforge.jp/mailman/listinfo/fess-user > ---------- Shibata, Masayuki Manager, Software Development Shimadzu Corporation Analytical Measuring Instruments Division Research & Development Department Telephone: 075-823-1441 Japan Facsimile: 075-823-1365 Japan E-mail: mshibata @ shimadzu.co.jp From shinsuke @ yahoo.co.jp Mon May 24 09:11:16 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Mon, 24 May 2010 09:11:16 +0900 Subject: [fess-user 215] Re: =?iso-2022-jp?b?T1IgGyRCOCE6dyRLJEQkJCRGGyhC?= In-Reply-To: <201005232333.AA12914@ea8055.shimadzu.co.jp> References: <201005232333.AA12914@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 NOT も OR も \NOT や \OR とすれば エスケープされると思いますが、Solr の stopword の設定で not と or が無視されるので どちらも検索語としては無視されると思います。 よろしくお願いいたします。 shinsuke 2010年5月24日8:33 Masayuki Shibata : > 柴田@亀岡市です。 > > ごくごく普通に質問です。 > > NOT のエスケープする方法はどうなっていますか? > #NOT 自体が検索文字列の場合の指定方法です。 > > OR はそもそも短すぎて検索文字としては無視されるのですよね? > >>菅谷です。 >> >>or 検索に対応しました(ついでにnot検索も対応)。 >>利用方法は >> >>ほげ OR ふが >> >>というように OR でつなぎます。 >>not検索は >> >>NOT ほげ >>ほげ NOT ふが >> >>のようにします。ただし、 >> >>NOT ほげ OR NOT ふが >> >>のような not の or 検索はできません。 >>問題がありましたら、お知らせください。 >> >>shinsuke >> >> >>2010年5月20日14:58 Shinsuke Sugaya : >>> 菅谷です。 >>> >>> 情報をありがとうございます。 >>> そのエラーも合わせて対応します。 >>> >>> shinsuke >>> >>> >>> 2010年5月20日14:42 : >>>> >>>> >>>> 柏崎です。 >>>> >>>> すいません。見落としていました。 >>>> ご対応お待ちしております。 >>>> >>>> ただ、一点気になるのが、 >>>> 現在"単語1 OR 単語2"と入れると >>>> 不正なクエリ文字列になってしまいシステムエラーとなってしまいます。 >>>> ORだけではないかもしれませんのでエスケープ処理が必要かと思います。 >>>> >>>> 以下、ログです。 >>>> "名前 OR 住所"が"((title:名前 AND title:OR AND title:住所) OR (content:名前 >>>> AND content:OR AND content:住所)) AND type:"pc""となってしまったようです。 >>>> >>>> 2010/05/20 14:30:52 org.apache.solr.common.SolrException log >>>> 致命的: org.apache.solr.common.SolrException: org.apache.lucene.queryParser.ParseException: > Cannot parse '((title:名前 AND title:OR AND title:住所) OR >>>> (content:名前 AND content:OR AND content:住所)) AND type:"pc"': Encountered " "OR "" at > line 1, column 21. >>>> Was expecting one of: >>>> "(" ... >>>> "*" ... >>>> ... >>>> ... >>>> ... >>>> ... >>>> "[" ... >>>> "{" ... >>>> ... >>>> >>>> at org.apache.solr.handler.component.QueryComponent.prepare(QueryComponent.java:108) >>>> at org.apache.solr.handler.component.SearchHandler.handleRequestBody > (SearchHandler.java:174) >>>> at org.apache.solr.handler.RequestHandlerBase.handleRequest(RequestHandlerBase.java:131) >>>> at org.apache.solr.core.SolrCore.execute(SolrCore.java:1316) >>>> at org.apache.solr.servlet.SolrDispatchFilter.execute(SolrDispatchFilter.java:338) >>>> at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:241) >>>> at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter > (ApplicationFilterChain.java:235) >>>> at org.apache.catalina.core.ApplicationFilterChain.doFilter > (ApplicationFilterChain.java:206) >>>> at org.apache.catalina.core.StandardWrapperValve.invoke(StandardWrapperValve.java:233) >>>> at org.apache.catalina.core.StandardContextValve.invoke(StandardContextValve.java:191) >>>> at org.apache.catalina.authenticator.AuthenticatorBase.invoke > (AuthenticatorBase.java:558) >>>> at org.apache.catalina.core.StandardHostValve.invoke(StandardHostValve.java:127) >>>> at org.apache.catalina.valves.ErrorReportValve.invoke(ErrorReportValve.java:102) >>>> at org.apache.catalina.core.StandardEngineValve.invoke(StandardEngineValve.java:109) >>>> at org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:298) >>>> at org.apache.coyote.http11.Http11Processor.process(Http11Processor.java:852) >>>> at org.apache.coyote.http11.Http11Protocol$Http11ConnectionHandler.process > (Http11Protocol.java:588) >>>> at org.apache.tomcat.util.net.JIoEndpoint$Worker.run(JIoEndpoint.java:489) >>>> at java.lang.Thread.run(Thread.java:619) >>>> Caused by: org.apache.lucene.queryParser.ParseException: Cannot parse '((title:名前 AND > title:OR AND title:住所) OR (content:名前 AND content:OR AND >>>> content:住所)) AND type:"pc"': Encountered " "OR "" at line 1, column 21. >>>> Was expecting one of: >>>> "(" ... >>>> "*" ... >>>> ... >>>> ... >>>> ... >>>> ... >>>> "[" ... >>>> "{" ... >>>> ... >>>> >>>> at org.apache.lucene.queryParser.QueryParser.parse(QueryParser.java:205) >>>> at org.apache.solr.search.LuceneQParser.parse(LuceneQParserPlugin.java:78) >>>> at org.apache.solr.search.QParser.getQuery(QParser.java:131) >>>> at org.apache.solr.handler.component.QueryComponent.prepare(QueryComponent.java:89) >>>> ... 18 more >>>> Caused by: org.apache.lucene.queryParser.ParseException: Encountered " "OR "" at line 1, > column 21. >>>> Was expecting one of: >>>> "(" ... >>>> "*" ... >>>> ... >>>> ... >>>> ... >>>> ... >>>> "[" ... >>>> "{" ... >>>> ... >>>> >>>> at org.apache.lucene.queryParser.QueryParser.generateParseException > (QueryParser.java:1846) >>>> at org.apache.lucene.queryParser.QueryParser.jj_consume_token(QueryParser.java:1728) >>>> at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1355) >>>> at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1294) >>>> at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1341) >>>> at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1265) >>>> at org.apache.lucene.queryParser.QueryParser.Clause(QueryParser.java:1341) >>>> at org.apache.lucene.queryParser.QueryParser.Query(QueryParser.java:1265) >>>> at org.apache.lucene.queryParser.QueryParser.TopLevelQuery(QueryParser.java:1254) >>>> at org.apache.lucene.queryParser.QueryParser.parse(QueryParser.java:200) >>>> ... 21 more >>>> >>>> 以上 >>>> >>>> >>>> >>>> >>>> >>>> Shinsuke Sugaya @lists.sourceforge.jp 2010/05/20 >>>> 14:16:25 >>>> >>>> fess-user @ lists.sourceforge.jpに返信してください >>>> >>>> 送信者: fess-user-bounces @ lists.sourceforge.jp >>>> >>>> >>>> 宛先: fess-user @ lists.sourceforge.jp >>>> cc: >>>> 件名: [fess-user 203] Re: OR 検索について >>>> >>>> >>>> 菅谷です。 >>>> >>>> http://sourceforge.jp/ticket/browse.php?group_id=4342&tid=21070 >>>> として近いうちに対応したいと思います。 >>>> 少々お待ちください…。 >>>> >>>> shinsuke >>>> >>>> >>>> 2010年5月20日14:14 Masayuki Shibata : >>>>> 柴田@亀岡市といいます。 >>>>> >>>>> Fess の機能の追加要求については >>>>> http://sourceforge.jp/projects/fess/ticket/ >>>>> ...に一覧がありますが、どうやら OR 検索はまだ実装されていないよう >>>>> です。 >>>>> >>>>>> >>>>>>はじめまして。柏崎と申します。 >>>>>> >>>>>>今回全文検索を導入することになり、 >>>>>>Fessを使用させて頂こうと考えております。 >>>>>> >>>>>>つきましては下記質問をさせて頂きます。 >>>>>> >>>>>>検索時のOR検索はどのように行うのでしょうか? >>>>>>"単語1 単語2"と入れるとAND検索になってしまいます。 >>>>>> >>>>>>以上 >>>>>> >>>>>>_______________________________________________ >>>>>>Fess-user mailing list >>>>>>Fess-user @ lists.sourceforge.jp >>>>>>http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>>>> >>>>> >>>>> _______________________________________________ >>>>> Fess-user mailing list >>>>> Fess-user @ lists.sourceforge.jp >>>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>>> >>>> >>>> _______________________________________________ >>>> Fess-user mailing list >>>> Fess-user @ lists.sourceforge.jp >>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>> >>>> _______________________________________________ >>>> Fess-user mailing list >>>> Fess-user @ lists.sourceforge.jp >>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>> >>> >> >>_______________________________________________ >>Fess-user mailing list >>Fess-user @ lists.sourceforge.jp >>http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > > ---------- > Shibata, Masayuki > Manager, Software Development > Shimadzu Corporation > Analytical Measuring Instruments Division > Research & Development Department > Telephone: 075-823-1441 Japan > Facsimile: 075-823-1365 Japan > E-mail: mshibata @ shimadzu.co.jp > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From shinsuke @ yahoo.co.jp Mon May 24 11:30:54 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Mon, 24 May 2010 11:30:54 +0900 Subject: [fess-user 216] Re: =?iso-2022-jp?b?MjAwMTAtMDUtMTcgU05BUFNIT1QgGyRCJE4lbSUwGyhC?= =?iso-2022-jp?b?GyRCJEcbKEIuLi4=?= In-Reply-To: <201005210033.AA12896@ea8055.shimadzu.co.jp> References: <201005200744.AA12888@ea8055.shimadzu.co.jp> <201005210033.AA12896@ea8055.shimadzu.co.jp> Message-ID: 菅谷です。 調べてみました。 原因は 2010/1/1 というようなところを 1月1日のように表示形式を変換している セルでした。この表示形式のフォーマットを 取得できないため、そのログが出力されて います。そのファイル内にある他のセルの 文字列自体は取得できているようです。 この問題は、Fess というより Tika か POI を 何とかしないと厳しいと思うので、そちらに 対しての対応を検討します。 shinsuke 2010年5月21日9:33 Masayuki Shibata : > 柴田@亀岡市です。 > > ひとつだけどう読んでも何を開発しているかわからないもの > がありました。 > > ファイル名だけがやばかったのでリネームしてあります。 > > たまたま対象ファイル中で一番単純な表のファイルでエラー > 行は1行だけ出力されているものです。 > >>確かに Excel が多いです。全 15 ファイル中 13 あります。 >> >>残り2個が Word ファイルですが、エラー行とかなり離れて上の方に登場 >>してます。Excel だと 2-3 行上を探せばたいがい見つかるのですが... >> >>残念ながらお出しできそうなファイルはありませんので、自分で目視で見 >>てみたのですが、何の変哲もないファイルに見えます。 >>#特徴を絞り込めませんでした。 >> >>ログのエラー行も 1箇所から 928箇所まで千差万別です。 >> >>単純な表を書いただけという Excel も混じってます。 >>#どうやってアプローチすべきか途方に暮れますね。 >> >>>菅谷です。 >>> >>>> そもそもどうやってファイルを特定するのでしょうか? >>> >>>ログに出ている [Robot-20100520113221-1-10] という >>>部分の最後の数字がスレッドごとに異なります。 >>>ですので、[Robot-20100520113221-1-10] と出力されて >>>いるものの中で、それの上に出ているものから特定できます。 >>>クロールしているものは INFO レベルで Crawling URL: http://.. >>>という感じのログで出力されます。 >>> >>>現在、POI 自体をバージョンアップしてあるので、Exception >>>の内容を評価しなければならないと考えています。問題自体は >>>POI の問題なので、なかなか対応も難しいところもありますが…。 >>> >>>shinsuke >>> >>> >>>2010年5月20日14:41 Masayuki Shibata : >>>> 柴田@亀岡市です。 >>>> >>>>>MS Office 系のファイル(たぶん Excel)だと思いますが、 >>>> ... >>>>>ファイルをいただけるようでしたら、確認させていただきたい >>>>>と思います。 >>>> >>>> 製品開発文書置き場の Subversion がクロール先に入っておりますの >>>> でファイルをお出しできない可能性は高いですが... >>>> >>>> そもそもどうやってファイルを特定するのでしょうか? >>>> >>>> ログのその繰り返しが発生する直前の行に登場してくるものだと >>>> Excel、Word 以外にも テキストやHTML (今回見たのは Subversion >>>> のディレクトリリスティング画面) など色々なファイルタイプのもの >>>> があります。 >>>> >>>> 本日1回、Fess を更新してフルでクロールかけたところ 15 箇所で >>>> これが発生しており、ざっとスクロールして見つけた 900行ほど繰り >>>> 返すものだけかと思っておりましたら、2行とか 4行というものもあ >>>> りました。 >>>> #スクロールしながら見ていて流れてしまってました。 >>>> >>>> 中身も色々で、そもそもクロールしても情報が拾えずエラーメッセー >>>> ジが出る類 (Excel ですとマクロを含んでいるので開いたときに確認 >>>> 画面が出るものは、クロールしようにも内容が拾えず、通常は Java >>>> のエラーメッセージがログに出力されているようなものです) もあれ >>>> ば、ごくごく普通に開くことのできる Excel、Word ファイルもあり >>>> ます。 >>>> >>>> _______________________________________________ >>>> Fess-user mailing list >>>> Fess-user @ lists.sourceforge.jp >>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>> >>> >>>_______________________________________________ >>>Fess-user mailing list >>>Fess-user @ lists.sourceforge.jp >>>http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> >>_______________________________________________ >>Fess-user mailing list >>Fess-user @ lists.sourceforge.jp >>http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > > From Tetsuyoshi.Kashiwazaki @ csk.com Tue May 25 15:00:26 2010 From: Tetsuyoshi.Kashiwazaki @ csk.com (Tetsuyoshi.Kashiwazaki @ csk.com) Date: Tue, 25 May 2010 15:00:26 +0900 Subject: [fess-user 217] Re: =?iso-2022-jp?b?T1IgGyRCOCE6dyRLJEQkJCRGGyhC?= Message-ID: こんにちは。柏崎です。 OR検索とNOT検索が動作するのを確認しました。 ありがとうございます。 さらにもっと触ってみます。 以上 Shinsuke Sugaya @lists.sourceforge.jp 2010/05/23 08:57:54 fess-user @ lists.sourceforge.jpに返信してください 送信者: fess-user-bounces @ lists.sourceforge.jp 宛先: fess-user @ lists.sourceforge.jp cc: 件名: [fess-user 213] Re: OR 検索について 菅谷です。 or 検索に対応しました(ついでにnot検索も対応)。 利用方法は ほげ OR ふが というように OR でつなぎます。 not検索は NOT ほげ ほげ NOT ふが のようにします。ただし、 NOT ほげ OR NOT ふが のような not の or 検索はできません。 問題がありましたら、お知らせください。 shinsuke From kf96614 @ gmail.com Fri May 28 11:12:56 2010 From: kf96614 @ gmail.com (kazuto fukuda) Date: Fri, 28 May 2010 11:12:56 +0900 Subject: [fess-user 218] =?iso-2022-jp?b?RmVzcxskQiRLJEQkJCRGJE48QUxkGyhC?= Message-ID: はじめまして、福田と申します。 Fessの導入テスト中です。 イントラネットのサイトが対象なのですが、インデックスが作成されません。 ウェブクロールの設定で URL http://10.nnn.nn.nnn/ クロール対象とするURL http://10.nnn.nn.nnn/.* としております。 昨日は一度この設定で、一度はインデックスが作成されたのですが、 今日、システム設定のSolrアクションで削除してから、クローラープロセスを 実行したところ、何も作成されませんでした。 ログファイルも見ましたが、特にエラーは出ていないようです。 何が問題なのでしょうか? 以上です。よろしくお願いします。 From shinsuke @ yahoo.co.jp Fri May 28 15:21:07 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Fri, 28 May 2010 15:21:07 +0900 Subject: [fess-user 219] Re: =?iso-2022-jp?b?RmVzcxskQiRLJEQkJCRGJE48QUxkGyhC?= In-Reply-To: References: Message-ID: 菅谷です。 まず、システム設定のSolrの設定でSolrグループが 有効になっていますでしょうか?あとは、 logs/catalina.out と webapps/fess/WEB-INF/logs/fess.out はクロール時にどのような出力になっているでしょうか? よろしくお願いいたします。 shinsuke 2010年5月28日11:12 kazuto fukuda : > はじめまして、福田と申します。 > > Fessの導入テスト中です。 > イントラネットのサイトが対象なのですが、インデックスが作成されません。 > > ウェブクロールの設定で > URL > http://10.nnn.nn.nnn/ > クロール対象とするURL > http://10.nnn.nn.nnn/.* > > としております。 > 昨日は一度この設定で、一度はインデックスが作成されたのですが、 > 今日、システム設定のSolrアクションで削除してから、クローラープロセスを > 実行したところ、何も作成されませんでした。 > ログファイルも見ましたが、特にエラーは出ていないようです。 > 何が問題なのでしょうか? > > 以上です。よろしくお願いします。 > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From kf96614 @ gmail.com Fri May 28 16:26:04 2010 From: kf96614 @ gmail.com (kazuto fukuda) Date: Fri, 28 May 2010 16:26:04 +0900 Subject: [fess-user 220] Re: =?iso-2022-jp?b?RmVzcxskQiRLJEQkJCRGJE48QUxkGyhC?= In-Reply-To: References: Message-ID: 菅谷様 回答有難うございます。 > まず、システム設定のSolrの設定でSolrグループが > 有効になっていますでしょうか?あとは、 有効になっています。 > logs/catalina.out と webapps/fess/WEB-INF/logs/fess.out > はクロール時にどのような出力になっているでしょうか? 2010-05-28 09:59:05,453 [main] INFO org.seasar.struts.validator.S2ValidatorPlugIn - Loading validation rules file from '/WEB-INF/validator-rules.xml' 2010-05-28 09:59:06,281 [main] INFO org.seasar.framework.container.factory.SingletonS2ContainerFactory - s2-frameworkのバージョンは2.4.39です。 2010-05-28 09:59:06,281 [main] INFO org.seasar.framework.container.factory.SingletonS2ContainerFactory - s2-extensionのバージョンは2.4.39です。 2010-05-28 09:59:06,281 [main] INFO org.seasar.framework.container.factory.SingletonS2ContainerFactory - s2-tigerのバージョンは2.4.39です。 2010-05-28 09:59:10,046 [main] INFO jp.sf.fess.db.allcommon.DBFluteInitializer - ...Initializing DBFlute components! 2010-05-28 09:59:10,062 [main] INFO org.seasar.dbflute.s2dao.extension.TnSqlLogRegistry - ...Closing the sqlLogRegistry. 2010-05-28 09:59:10,093 [main] INFO jp.sf.fess.db.allcommon.DBFluteConfig - ...Locking the configuration of DBFlute! 2010-05-28 09:59:18,031 [main] INFO org.seasar.framework.container.factory.SingletonS2ContainerFactory - Running on [ENV]product, [DEPLOY MODE]Cool Deploy 2010-05-28 10:00:02,421 [Thread-16] INFO jp.sf.fess.helper.SystemHelper - Crawler: Directory=C:\fess\fess-server-3.0.0\webapps\fess Options=[java, -cp, WEB-INF\cmd\resources;WEB-INF\classes;WEB-INF\lib\antlr-2.7.2.jar;WEB-INF\lib\aopalliance-1.0.jar;WEB-INF\lib\args4j-2.0.12.jar;WEB-INF\lib\asm-3.1.jar;WEB-INF\lib\bcmail-jdk16-1.44.jar;WEB-INF\lib\bcprov-jdk16-1.44.jar;WEB-INF\lib\commons-beanutils-1.7.0.jar;WEB-INF\lib\commons-codec-1.3.jar;WEB-INF\lib\commons-collections-3.2.jar;WEB-INF\lib\commons-compress-1.0.jar;WEB-INF\lib\commons-digester-1.6.jar;WEB-INF\lib\commons-el-1.0.jar;WEB-INF\lib\commons-fileupload-1.2.1.jar;WEB-INF\lib\commons-httpclient-3.1.jar;WEB-INF\lib\commons-io-1.4.jar;WEB-INF\lib\commons-lang-2.3.jar;WEB-INF\lib\commons-logging-1.0.3.jar;WEB-INF\lib\commons-validator-1.2.0.jar;WEB-INF\lib\dbflute-runtime-0.9.5.1.jar;WEB-INF\lib\dom4j-1.6.1.jar;WEB-INF\lib\fontbox-1.0-20091008.jar;WEB-INF\lib\geronimo-annotation_1.0_spec-1.0.jar;WEB-INF\lib\geronimo-ejb_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-interceptor_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-jpa_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-jta_1.1_spec-1.0.jar;WEB-INF\lib\geronimo-stax-api_1.0_spec-1.0.1.jar;WEB-INF\lib\h2-1.2.128.jar;WEB-INF\lib\icu4j-3.8.jar;WEB-INF\lib\javassist-3.4.ga.jar;WEB-INF\lib\jcl-over-slf4j-1.5.6.jar;WEB-INF\lib\jempbox-0.8.0-20091008.jar;WEB-INF\lib\jstl-1.1.2.jar;WEB-INF\lib\log4j-1.2.14.jar;WEB-INF\lib\lucene-analyzers-2.9.1.jar;WEB-INF\lib\lucene-core-2.9.1.jar;WEB-INF\lib\lucene-highlighter-2.9.1.jar;WEB-INF\lib\lucene-memory-2.9.1.jar;WEB-INF\lib\lucene-misc-2.9.1.jar;WEB-INF\lib\lucene-queries-2.9.1.jar;WEB-INF\lib\lucene-snowball-2.9.1.jar;WEB-INF\lib\lucene-spellchecker-2.9.1.jar;WEB-INF\lib\mobylet-charset-1.0.2.jar;WEB-INF\lib\mobylet-core-1.0.2.jar;WEB-INF\lib\mobylet-s2extension-1.0.2.jar;WEB-INF\lib\mobylet-taglibs-1.0.2.jar;WEB-INF\lib\nekohtml-1.9.13.jar;WEB-INF\lib\ognl-2.6.9-patch-20070908.jar;WEB-INF\lib\ooxml-schemas-1.0.jar;WEB-INF\lib\org.codehaus.woodstox-wstx-asl-3.2.7.jar;WEB-INF\lib\oro-2.0.8.jar;WEB-INF\lib\pdfbox-0.8.0-20091008.jar;WEB-INF\lib\poi-3.5-FINAL.jar;WEB-INF\lib\poi-ooxml-3.5-FINAL.jar;WEB-INF\lib\poi-scratchpad-3.5-FINAL.jar;WEB-INF\lib\s2-extension-2.4.39.jar;WEB-INF\lib\s2-framework-2.4.39.jar;WEB-INF\lib\s2-robot-0.4.0.jar;WEB-INF\lib\s2-robot-db-0.4.0.jar;WEB-INF\lib\s2-robot-db-h2-0.4.0.jar;WEB-INF\lib\s2-robot-dbflute-runtime-0.9.6.jar;WEB-INF\lib\s2-tiger-2.4.39.jar;WEB-INF\lib\s2chronos-core-1.0.0.jar;WEB-INF\lib\s2chronos-extension-1.0.0.jar;WEB-INF\lib\sa-struts-1.0.4-sp7.jar;WEB-INF\lib\serializer-2.7.1.jar;WEB-INF\lib\slf4j-api-1.5.6.jar;WEB-INF\lib\slf4j-log4j12-1.5.6.jar;WEB-INF\lib\solr-commons-csv-1.4.0.jar;WEB-INF\lib\solr-core-1.4.0.jar;WEB-INF\lib\solr-solrj-1.4.0.jar;WEB-INF\lib\standard-1.1.2.jar;WEB-INF\lib\stax-api-1.0.1.jar;WEB-INF\lib\struts-1.2.9.jar;WEB-INF\lib\tika-core-0.5-20091008.jar;WEB-INF\lib\tika-parsers-0.5-20091008.jar;WEB-INF\lib\woodstox-wstx-asl-3.2.7.jar;WEB-INF\lib\xalan-2.7.1.jar;WEB-INF\lib\xercesImpl-2.8.1.jar;WEB-INF\lib\xmlbeans-2.3.0.jar;WEB-INF\cmd\lib\geronimo-servlet_2.4_spec-1.0.jar, -Dfess.crawler.process=true, -Dsolr.solr.home=C:\fess\fess-server-3.0.0\solr, -Dsolr.data.dir=C:\fess\fess-server-3.0.0\solr\core1\data, -Dfess.log.file=C:\fess\fess-server-3.0.0\webapps\fess\WEB-INF\logs\fess.out, -Djava.awt.headless=true, -server, -XX:+UseGCOverheadLimit, -XX:+UseConcMarkSweepGC, -XX:+CMSIncrementalMode, -XX:+UseTLAB, -Dpdfbox.cjk.support=true, -Xmx512m, -XX:MaxPermSize=128m, jp.sf.fess.exec.Crawler, --sessionId, 20100528100002] 2010-05-28 10:00:05,000 [main] INFO org.seasar.framework.container.factory.SingletonS2ContainerFactory - s2-frameworkのバージョンは2.4.39です。 2010-05-28 10:00:05,000 [main] INFO org.seasar.framework.container.factory.SingletonS2ContainerFactory - s2-extensionのバージョンは2.4.39です。 2010-05-28 10:00:05,000 [main] INFO org.seasar.framework.container.factory.SingletonS2ContainerFactory - s2-tigerのバージョンは2.4.39です。 2010-05-28 10:00:08,640 [main] INFO jp.sf.fess.db.allcommon.DBFluteInitializer - ...Initializing DBFlute components! 2010-05-28 10:00:08,640 [main] INFO org.seasar.dbflute.s2dao.extension.TnSqlLogRegistry - ...Closing the sqlLogRegistry. 2010-05-28 10:00:08,671 [main] INFO jp.sf.fess.db.allcommon.DBFluteConfig - ...Locking the configuration of DBFlute! 2010-05-28 10:00:08,765 [main] INFO org.seasar.robot.db.allcommon.DBFluteInitializer - ...Initializing DBFlute components! 2010-05-28 10:00:08,812 [main] INFO org.seasar.robot.db.allcommon.DBFluteConfig - ...Locking the configuration of DBFlute! 2010-05-28 10:00:13,109 [main] INFO org.seasar.framework.container.factory.SingletonS2ContainerFactory - Running on [ENV]product, [DEPLOY MODE]Cool Deploy 2010-05-28 10:00:13,812 [main] INFO jp.sf.fess.exec.Crawler - Starting Crawler.. 2010-05-28 10:00:14,796 [Robot-20100528100002-1-3] INFO org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: http://10.nnn.nn.nnn/ 2010-05-28 10:00:14,921 [Robot-20100528100002-1-3] INFO org.seasar.robot.client.http.CommonsHttpClient - Checking URL: http://10.nnn.nn.nnn/robots.txt 2010-05-28 10:00:19,359 [Robot-20100528100002-2-4] INFO org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: http://10.nnn.nn.nnn/ 2010-05-28 10:00:19,406 [Robot-20100528100002-2-4] INFO org.seasar.robot.client.http.CommonsHttpClient - Checking URL: http://10.nnn.nn.nnn/robots.txt 2010-05-28 10:00:24,468 [Robot-20100528100002-3-4] INFO org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: http://150.nn.nn.nnn/oks.htm 2010-05-28 10:00:24,500 [Robot-20100528100002-3-4] INFO org.seasar.robot.client.http.CommonsHttpClient - Checking URL: http://150.nn.nn.nnn/robots.txt 2010-05-28 10:00:24,625 [Robot-20100528100002-3-4] INFO org.apache.commons.httpclient.HttpMethodDirector - No credentials available for DIGEST 'Digest'@150.16.97.150:80 2010-05-28 10:01:14,375 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 3. The processing size is 3. The execution time is 16ms. 2010-05-28 10:01:14,406 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. The processing size is 0. The execution time is 0ms. 2010-05-28 10:02:14,359 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. The processing size is 0. The execution time is 0ms. 2010-05-28 10:02:19,703 [main] INFO jp.sf.fess.helper.WebIndexHelper - [EXEC TIME] crawling time: 125641ms 2010-05-28 10:03:14,359 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. The processing size is 0. The execution time is 0ms. 2010-05-28 10:03:14,359 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - [EXEC TIME] index update time: 47ms 2010-05-28 10:03:14,531 [main] INFO jp.sf.fess.helper.FileSystemIndexHelper - No crawling target urls. 2010-05-28 10:03:14,562 [main] INFO jp.sf.fess.helper.DataIndexHelper - No crawling target data. 2010-05-28 10:03:14,750 [main] INFO jp.sf.fess.exec.Crawler - [EXEC TIME] index optimize time: 188ms 2010-05-28 10:03:14,750 [main] INFO jp.sf.fess.exec.Crawler - Finished Crawler 2010-05-28 10:03:17,812 [Thread-16] INFO jp.sf.fess.helper.SystemHelper - Crawler: Exit Code=0 - Crawler Process Output: Processed: C:\fess\fess-server-3.0.0\webapps\fess\WEB-INF\db\robot.h2.db WARN: The method class org.apache.commons.logging.impl.SLF4JLogFactory#release() was invoked. WARN: Please see http://www.slf4j.org/codes.html#release for an explanation. 以上です。よろしくお願いします。 2010年5月28日15:21 Shinsuke Sugaya : > 菅谷です。 > > まず、システム設定のSolrの設定でSolrグループが > 有効になっていますでしょうか?あとは、 > logs/catalina.out と webapps/fess/WEB-INF/logs/fess.out > はクロール時にどのような出力になっているでしょうか? > よろしくお願いいたします。 > > shinsuke > > > 2010年5月28日11:12 kazuto fukuda : >> はじめまして、福田と申します。 >> >> Fessの導入テスト中です。 >> イントラネットのサイトが対象なのですが、インデックスが作成されません。 >> >> ウェブクロールの設定で >> URL >> http://10.nnn.nn.nnn/ >> クロール対象とするURL >> http://10.nnn.nn.nnn/.* >> >> としております。 >> 昨日は一度この設定で、一度はインデックスが作成されたのですが、 >> 今日、システム設定のSolrアクションで削除してから、クローラープロセスを >> 実行したところ、何も作成されませんでした。 >> ログファイルも見ましたが、特にエラーは出ていないようです。 >> 何が問題なのでしょうか? >> >> 以上です。よろしくお願いします。 >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From shinsuke @ yahoo.co.jp Fri May 28 18:16:35 2010 From: shinsuke @ yahoo.co.jp (Shinsuke Sugaya) Date: Fri, 28 May 2010 18:16:35 +0900 Subject: [fess-user 221] Re: =?iso-2022-jp?b?RmVzcxskQiRLJEQkJCRGJE48QUxkGyhC?= In-Reply-To: References: Message-ID: 菅谷です。 情報をありがとうございます。 ログを見ると、3 ドキュメントでインデックスを 作られていると思われます。他にもクロール対象と なるドキュメントがあるとすると、robots.txt で 除外するルールが記述されているか、"No credentials available for DIGEST" と言われているので、 DIGEST 認証でブロックされているかな気がします。 よろしくお願いします。 shinsuke 2010年5月28日16:26 kazuto fukuda : > 菅谷様 > > 回答有難うございます。 > >> まず、システム設定のSolrの設定でSolrグループが >> 有効になっていますでしょうか?あとは、 > 有効になっています。 > >> logs/catalina.out と webapps/fess/WEB-INF/logs/fess.out >> はクロール時にどのような出力になっているでしょうか? > > 2010-05-28 09:59:05,453 [main] INFO > org.seasar.struts.validator.S2ValidatorPlugIn - Loading validation > rules file from '/WEB-INF/validator-rules.xml' > 2010-05-28 09:59:06,281 [main] INFO > org.seasar.framework.container.factory.SingletonS2ContainerFactory - > s2-frameworkのバージョンは2.4.39です。 > 2010-05-28 09:59:06,281 [main] INFO > org.seasar.framework.container.factory.SingletonS2ContainerFactory - > s2-extensionのバージョンは2.4.39です。 > 2010-05-28 09:59:06,281 [main] INFO > org.seasar.framework.container.factory.SingletonS2ContainerFactory - > s2-tigerのバージョンは2.4.39です。 > 2010-05-28 09:59:10,046 [main] INFO > jp.sf.fess.db.allcommon.DBFluteInitializer - ...Initializing DBFlute > components! > 2010-05-28 09:59:10,062 [main] INFO > org.seasar.dbflute.s2dao.extension.TnSqlLogRegistry - ...Closing the > sqlLogRegistry. > 2010-05-28 09:59:10,093 [main] INFO > jp.sf.fess.db.allcommon.DBFluteConfig - ...Locking the configuration > of DBFlute! > 2010-05-28 09:59:18,031 [main] INFO > org.seasar.framework.container.factory.SingletonS2ContainerFactory - > Running on [ENV]product, [DEPLOY MODE]Cool Deploy > 2010-05-28 10:00:02,421 [Thread-16] INFO > jp.sf.fess.helper.SystemHelper - Crawler: > Directory=C:\fess\fess-server-3.0.0\webapps\fess > Options=[java, -cp, > WEB-INF\cmd\resources;WEB-INF\classes;WEB-INF\lib\antlr-2.7.2.jar;WEB-INF\lib\aopalliance-1.0.jar;WEB-INF\lib\args4j-2.0.12.jar;WEB-INF\lib\asm-3.1.jar;WEB-INF\lib\bcmail-jdk16-1.44.jar;WEB-INF\lib\bcprov-jdk16-1.44.jar;WEB-INF\lib\commons-beanutils-1.7.0.jar;WEB-INF\lib\commons-codec-1.3.jar;WEB-INF\lib\commons-collections-3.2.jar;WEB-INF\lib\commons-compress-1.0.jar;WEB-INF\lib\commons-digester-1.6.jar;WEB-INF\lib\commons-el-1.0.jar;WEB-INF\lib\commons-fileupload-1.2.1.jar;WEB-INF\lib\commons-httpclient-3.1.jar;WEB-INF\lib\commons-io-1.4.jar;WEB-INF\lib\commons-lang-2.3.jar;WEB-INF\lib\commons-logging-1.0.3.jar;WEB-INF\lib\commons-validator-1.2.0.jar;WEB-INF\lib\dbflute-runtime-0.9.5.1.jar;WEB-INF\lib\dom4j-1.6.1.jar;WEB-INF\lib\fontbox-1.0-20091008.jar;WEB-INF\lib\geronimo-annotation_1.0_spec-1.0.jar;WEB-INF\lib\geronimo-ejb_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-interceptor_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-jpa_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-jta_1.1_spec-1.0.jar;WEB-INF\lib\geronimo-stax-api_1.0_spec-1.0.1.jar;WEB-INF\lib\h2-1.2.128.jar;WEB-INF\lib\icu4j-3.8.jar;WEB-INF\lib\javassist-3.4.ga.jar;WEB-INF\lib\jcl-over-slf4j-1.5.6.jar;WEB-INF\lib\jempbox-0.8.0-20091008.jar;WEB-INF\lib\jstl-1.1.2.jar;WEB-INF\lib\log4j-1.2.14.jar;WEB-INF\lib\lucene-analyzers-2.9.1.jar;WEB-INF\lib\lucene-core-2.9.1.jar;WEB-INF\lib\lucene-highlighter-2.9.1.jar;WEB-INF\lib\lucene-memory-2.9.1.jar;WEB-INF\lib\lucene-misc-2.9.1.jar;WEB-INF\lib\lucene-queries-2.9.1.jar;WEB-INF\lib\lucene-snowball-2.9.1.jar;WEB-INF\lib\lucene-spellchecker-2.9.1.jar;WEB-INF\lib\mobylet-charset-1.0.2.jar;WEB-INF\lib\mobylet-core-1.0.2.jar;WEB-INF\lib\mobylet-s2extension-1.0.2.jar;WEB-INF\lib\mobylet-taglibs-1.0.2.jar;WEB-INF\lib\nekohtml-1.9.13.jar;WEB-INF\lib\ognl-2.6.9-patch-20070908.jar;WEB-INF\lib\ooxml-schemas-1.0.jar;WEB-INF\lib\org.codehaus.woodstox-wstx-asl-3.2.7.jar;WEB-INF\lib\oro-2.0.8.jar;WEB-INF\lib\pdfbox-0.8.0-20091008.jar;WEB-INF\lib\poi-3.5-FINAL.jar;WEB-INF\lib\poi-ooxml-3.5-FINAL.jar;WEB-INF\lib\poi-scratchpad-3.5-FINAL.jar;WEB-INF\lib\s2-extension-2.4.39.jar;WEB-INF\lib\s2-framework-2.4.39.jar;WEB-INF\lib\s2-robot-0.4.0.jar;WEB-INF\lib\s2-robot-db-0.4.0.jar;WEB-INF\lib\s2-robot-db-h2-0.4.0.jar;WEB-INF\lib\s2-robot-dbflute-runtime-0.9.6.jar;WEB-INF\lib\s2-tiger-2.4.39.jar;WEB-INF\lib\s2chronos-core-1.0.0.jar;WEB-INF\lib\s2chronos-extension-1.0.0.jar;WEB-INF\lib\sa-struts-1.0.4-sp7.jar;WEB-INF\lib\serializer-2.7.1.jar;WEB-INF\lib\slf4j-api-1.5.6.jar;WEB-INF\lib\slf4j-log4j12-1.5.6.jar;WEB-INF\lib\solr-commons-csv-1.4.0.jar;WEB-INF\lib\solr-core-1.4.0.jar;WEB-INF\lib\solr-solrj-1.4.0.jar;WEB-INF\lib\standard-1.1.2.jar;WEB-INF\lib\stax-api-1.0.1.jar;WEB-INF\lib\struts-1.2.9.jar;WEB-INF\lib\tika-core-0.5-20091008.jar;WEB-INF\lib\tika-parsers-0.5-20091008.jar;WEB-INF\lib\woodstox-wstx-asl-3.2.7.jar;WEB-INF\lib\xalan-2.7.1.jar;WEB-INF\lib\xercesImpl-2.8.1.jar;WEB-INF\lib\xmlbeans-2.3.0.jar;WEB-INF\cmd\lib\geronimo-servlet_2.4_spec-1.0.jar, > -Dfess.crawler.process=true, > -Dsolr.solr.home=C:\fess\fess-server-3.0.0\solr, > -Dsolr.data.dir=C:\fess\fess-server-3.0.0\solr\core1\data, > -Dfess.log.file=C:\fess\fess-server-3.0.0\webapps\fess\WEB-INF\logs\fess.out, > -Djava.awt.headless=true, -server, -XX:+UseGCOverheadLimit, > -XX:+UseConcMarkSweepGC, -XX:+CMSIncrementalMode, -XX:+UseTLAB, > -Dpdfbox.cjk.support=true, -Xmx512m, -XX:MaxPermSize=128m, > jp.sf.fess.exec.Crawler, --sessionId, 20100528100002] > 2010-05-28 10:00:05,000 [main] INFO > org.seasar.framework.container.factory.SingletonS2ContainerFactory - > s2-frameworkのバージョンは2.4.39です。 > 2010-05-28 10:00:05,000 [main] INFO > org.seasar.framework.container.factory.SingletonS2ContainerFactory - > s2-extensionのバージョンは2.4.39です。 > 2010-05-28 10:00:05,000 [main] INFO > org.seasar.framework.container.factory.SingletonS2ContainerFactory - > s2-tigerのバージョンは2.4.39です。 > 2010-05-28 10:00:08,640 [main] INFO > jp.sf.fess.db.allcommon.DBFluteInitializer - ...Initializing DBFlute > components! > 2010-05-28 10:00:08,640 [main] INFO > org.seasar.dbflute.s2dao.extension.TnSqlLogRegistry - ...Closing the > sqlLogRegistry. > 2010-05-28 10:00:08,671 [main] INFO > jp.sf.fess.db.allcommon.DBFluteConfig - ...Locking the configuration > of DBFlute! > 2010-05-28 10:00:08,765 [main] INFO > org.seasar.robot.db.allcommon.DBFluteInitializer - ...Initializing > DBFlute components! > 2010-05-28 10:00:08,812 [main] INFO > org.seasar.robot.db.allcommon.DBFluteConfig - ...Locking the > configuration of DBFlute! > 2010-05-28 10:00:13,109 [main] INFO > org.seasar.framework.container.factory.SingletonS2ContainerFactory - > Running on [ENV]product, [DEPLOY MODE]Cool Deploy > 2010-05-28 10:00:13,812 [main] INFO jp.sf.fess.exec.Crawler - > Starting Crawler.. > 2010-05-28 10:00:14,796 [Robot-20100528100002-1-3] INFO > org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: > http://10.nnn.nn.nnn/ > 2010-05-28 10:00:14,921 [Robot-20100528100002-1-3] INFO > org.seasar.robot.client.http.CommonsHttpClient - Checking URL: > http://10.nnn.nn.nnn/robots.txt > 2010-05-28 10:00:19,359 [Robot-20100528100002-2-4] INFO > org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: > http://10.nnn.nn.nnn/ > 2010-05-28 10:00:19,406 [Robot-20100528100002-2-4] INFO > org.seasar.robot.client.http.CommonsHttpClient - Checking URL: > http://10.nnn.nn.nnn/robots.txt > 2010-05-28 10:00:24,468 [Robot-20100528100002-3-4] INFO > org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: > http://150.nn.nn.nnn/oks.htm > 2010-05-28 10:00:24,500 [Robot-20100528100002-3-4] INFO > org.seasar.robot.client.http.CommonsHttpClient - Checking URL: > http://150.nn.nn.nnn/robots.txt > 2010-05-28 10:00:24,625 [Robot-20100528100002-3-4] INFO > org.apache.commons.httpclient.HttpMethodDirector - No credentials > available for DIGEST 'Digest'@150.16.97.150:80 > 2010-05-28 10:01:14,375 [IndexUpdater] INFO > jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 3. > The processing size is 3. The execution time is 16ms. > 2010-05-28 10:01:14,406 [IndexUpdater] INFO > jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. > The processing size is 0. The execution time is 0ms. > 2010-05-28 10:02:14,359 [IndexUpdater] INFO > jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. > The processing size is 0. The execution time is 0ms. > 2010-05-28 10:02:19,703 [main] INFO jp.sf.fess.helper.WebIndexHelper > - [EXEC TIME] crawling time: 125641ms > 2010-05-28 10:03:14,359 [IndexUpdater] INFO > jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. > The processing size is 0. The execution time is 0ms. > 2010-05-28 10:03:14,359 [IndexUpdater] INFO > jp.sf.fess.solr.IndexUpdater - [EXEC TIME] index update time: 47ms > 2010-05-28 10:03:14,531 [main] INFO > jp.sf.fess.helper.FileSystemIndexHelper - No crawling target urls. > 2010-05-28 10:03:14,562 [main] INFO jp.sf.fess.helper.DataIndexHelper > - No crawling target data. > 2010-05-28 10:03:14,750 [main] INFO jp.sf.fess.exec.Crawler - [EXEC > TIME] index optimize time: 188ms > 2010-05-28 10:03:14,750 [main] INFO jp.sf.fess.exec.Crawler - Finished Crawler > 2010-05-28 10:03:17,812 [Thread-16] INFO > jp.sf.fess.helper.SystemHelper - Crawler: Exit Code=0 - Crawler > Process Output: > Processed: C:\fess\fess-server-3.0.0\webapps\fess\WEB-INF\db\robot.h2.db > WARN: The method class > org.apache.commons.logging.impl.SLF4JLogFactory#release() was invoked. > WARN: Please see http://www.slf4j.org/codes.html#release for an explanation. > > 以上です。よろしくお願いします。 > > 2010年5月28日15:21 Shinsuke Sugaya : >> 菅谷です。 >> >> まず、システム設定のSolrの設定でSolrグループが >> 有効になっていますでしょうか?あとは、 >> logs/catalina.out と webapps/fess/WEB-INF/logs/fess.out >> はクロール時にどのような出力になっているでしょうか? >> よろしくお願いいたします。 >> >> shinsuke >> >> >> 2010年5月28日11:12 kazuto fukuda : >>> はじめまして、福田と申します。 >>> >>> Fessの導入テスト中です。 >>> イントラネットのサイトが対象なのですが、インデックスが作成されません。 >>> >>> ウェブクロールの設定で >>> URL >>> http://10.nnn.nn.nnn/ >>> クロール対象とするURL >>> http://10.nnn.nn.nnn/.* >>> >>> としております。 >>> 昨日は一度この設定で、一度はインデックスが作成されたのですが、 >>> 今日、システム設定のSolrアクションで削除してから、クローラープロセスを >>> 実行したところ、何も作成されませんでした。 >>> ログファイルも見ましたが、特にエラーは出ていないようです。 >>> 何が問題なのでしょうか? >>> >>> 以上です。よろしくお願いします。 >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From kf96614 @ gmail.com Fri May 28 21:50:10 2010 From: kf96614 @ gmail.com (kazuto fukuda) Date: Fri, 28 May 2010 21:50:10 +0900 Subject: [fess-user 222] Re: =?iso-2022-jp?b?RmVzcxskQiRLJEQkJCRGJE48QUxkGyhC?= In-Reply-To: References: Message-ID: 菅谷様 福田です。 おっしゃる通り3つのサイトを検索対象としています。 認証が必要な3番目のサイトが検索出来ないのはわかりますが、 認証が不要な1番目、2番目のサイトのインデックスが作成されない のがなぜなのかわかりません。 fess.out以外に原因を調査する方法はあるでしょうか? 以上です。よろしくお願いします。 2010年5月28日18:16 Shinsuke Sugaya : > 菅谷です。 > > 情報をありがとうございます。 > ログを見ると、3 ドキュメントでインデックスを > 作られていると思われます。他にもクロール対象と > なるドキュメントがあるとすると、robots.txt で > 除外するルールが記述されているか、"No credentials > available for DIGEST" と言われているので、 > DIGEST 認証でブロックされているかな気がします。 > よろしくお願いします。 > > shinsuke > > 2010年5月28日16:26 kazuto fukuda : >> 菅谷様 >> >> 回答有難うございます。 >> >>> まず、システム設定のSolrの設定でSolrグループが >>> 有効になっていますでしょうか?あとは、 >> 有効になっています。 >> >>> logs/catalina.out と webapps/fess/WEB-INF/logs/fess.out >>> はクロール時にどのような出力になっているでしょうか? >> >> 2010-05-28 09:59:05,453 [main] INFO >> org.seasar.struts.validator.S2ValidatorPlugIn - Loading validation >> rules file from '/WEB-INF/validator-rules.xml' >> 2010-05-28 09:59:06,281 [main] INFO >> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >> s2-frameworkのバージョンは2.4.39です。 >> 2010-05-28 09:59:06,281 [main] INFO >> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >> s2-extensionのバージョンは2.4.39です。 >> 2010-05-28 09:59:06,281 [main] INFO >> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >> s2-tigerのバージョンは2.4.39です。 >> 2010-05-28 09:59:10,046 [main] INFO >> jp.sf.fess.db.allcommon.DBFluteInitializer - ...Initializing DBFlute >> components! >> 2010-05-28 09:59:10,062 [main] INFO >> org.seasar.dbflute.s2dao.extension.TnSqlLogRegistry - ...Closing the >> sqlLogRegistry. >> 2010-05-28 09:59:10,093 [main] INFO >> jp.sf.fess.db.allcommon.DBFluteConfig - ...Locking the configuration >> of DBFlute! >> 2010-05-28 09:59:18,031 [main] INFO >> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >> Running on [ENV]product, [DEPLOY MODE]Cool Deploy >> 2010-05-28 10:00:02,421 [Thread-16] INFO >> jp.sf.fess.helper.SystemHelper - Crawler: >> Directory=C:\fess\fess-server-3.0.0\webapps\fess >> Options=[java, -cp, >> WEB-INF\cmd\resources;WEB-INF\classes;WEB-INF\lib\antlr-2.7.2.jar;WEB-INF\lib\aopalliance-1.0.jar;WEB-INF\lib\args4j-2.0.12.jar;WEB-INF\lib\asm-3.1.jar;WEB-INF\lib\bcmail-jdk16-1.44.jar;WEB-INF\lib\bcprov-jdk16-1.44.jar;WEB-INF\lib\commons-beanutils-1.7.0.jar;WEB-INF\lib\commons-codec-1.3.jar;WEB-INF\lib\commons-collections-3.2.jar;WEB-INF\lib\commons-compress-1.0.jar;WEB-INF\lib\commons-digester-1.6.jar;WEB-INF\lib\commons-el-1.0.jar;WEB-INF\lib\commons-fileupload-1.2.1.jar;WEB-INF\lib\commons-httpclient-3.1.jar;WEB-INF\lib\commons-io-1.4.jar;WEB-INF\lib\commons-lang-2.3.jar;WEB-INF\lib\commons-logging-1.0.3.jar;WEB-INF\lib\commons-validator-1.2.0.jar;WEB-INF\lib\dbflute-runtime-0.9.5.1.jar;WEB-INF\lib\dom4j-1.6.1.jar;WEB-INF\lib\fontbox-1.0-20091008.jar;WEB-INF\lib\geronimo-annotation_1.0_spec-1.0.jar;WEB-INF\lib\geronimo-ejb_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-interceptor_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-jpa_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-jta_1.1_spec-1.0.jar;WEB-INF\lib\geronimo-stax-api_1.0_spec-1.0.1.jar;WEB-INF\lib\h2-1.2.128.jar;WEB-INF\lib\icu4j-3.8.jar;WEB-INF\lib\javassist-3.4.ga.jar;WEB-INF\lib\jcl-over-slf4j-1.5.6.jar;WEB-INF\lib\jempbox-0.8.0-20091008.jar;WEB-INF\lib\jstl-1.1.2.jar;WEB-INF\lib\log4j-1.2.14.jar;WEB-INF\lib\lucene-analyzers-2.9.1.jar;WEB-INF\lib\lucene-core-2.9.1.jar;WEB-INF\lib\lucene-highlighter-2.9.1.jar;WEB-INF\lib\lucene-memory-2.9.1.jar;WEB-INF\lib\lucene-misc-2.9.1.jar;WEB-INF\lib\lucene-queries-2.9.1.jar;WEB-INF\lib\lucene-snowball-2.9.1.jar;WEB-INF\lib\lucene-spellchecker-2.9.1.jar;WEB-INF\lib\mobylet-charset-1.0.2.jar;WEB-INF\lib\mobylet-core-1.0.2.jar;WEB-INF\lib\mobylet-s2extension-1.0.2.jar;WEB-INF\lib\mobylet-taglibs-1.0.2.jar;WEB-INF\lib\nekohtml-1.9.13.jar;WEB-INF\lib\ognl-2.6.9-patch-20070908.jar;WEB-INF\lib\ooxml-schemas-1.0.jar;WEB-INF\lib\org.codehaus.woodstox-wstx-asl-3.2.7.jar;WEB-INF\lib\oro-2.0.8.jar;WEB-INF\lib\pdfbox-0.8.0-20091008.jar;WEB-INF\lib\poi-3.5-FINAL.jar;WEB-INF\lib\poi-ooxml-3.5-FINAL.jar;WEB-INF\lib\poi-scratchpad-3.5-FINAL.jar;WEB-INF\lib\s2-extension-2.4.39.jar;WEB-INF\lib\s2-framework-2.4.39.jar;WEB-INF\lib\s2-robot-0.4.0.jar;WEB-INF\lib\s2-robot-db-0.4.0.jar;WEB-INF\lib\s2-robot-db-h2-0.4.0.jar;WEB-INF\lib\s2-robot-dbflute-runtime-0.9.6.jar;WEB-INF\lib\s2-tiger-2.4.39.jar;WEB-INF\lib\s2chronos-core-1.0.0.jar;WEB-INF\lib\s2chronos-extension-1.0.0.jar;WEB-INF\lib\sa-struts-1.0.4-sp7.jar;WEB-INF\lib\serializer-2.7.1.jar;WEB-INF\lib\slf4j-api-1.5.6.jar;WEB-INF\lib\slf4j-log4j12-1.5.6.jar;WEB-INF\lib\solr-commons-csv-1.4.0.jar;WEB-INF\lib\solr-core-1.4.0.jar;WEB-INF\lib\solr-solrj-1.4.0.jar;WEB-INF\lib\standard-1.1.2.jar;WEB-INF\lib\stax-api-1.0.1.jar;WEB-INF\lib\struts-1.2.9.jar;WEB-INF\lib\tika-core-0.5-20091008.jar;WEB-INF\lib\tika-parsers-0.5-20091008.jar;WEB-INF\lib\woodstox-wstx-asl-3.2.7.jar;WEB-INF\lib\xalan-2.7.1.jar;WEB-INF\lib\xercesImpl-2.8.1.jar;WEB-INF\lib\xmlbeans-2.3.0.jar;WEB-INF\cmd\lib\geronimo-servlet_2.4_spec-1.0.jar, >> -Dfess.crawler.process=true, >> -Dsolr.solr.home=C:\fess\fess-server-3.0.0\solr, >> -Dsolr.data.dir=C:\fess\fess-server-3.0.0\solr\core1\data, >> -Dfess.log.file=C:\fess\fess-server-3.0.0\webapps\fess\WEB-INF\logs\fess.out, >> -Djava.awt.headless=true, -server, -XX:+UseGCOverheadLimit, >> -XX:+UseConcMarkSweepGC, -XX:+CMSIncrementalMode, -XX:+UseTLAB, >> -Dpdfbox.cjk.support=true, -Xmx512m, -XX:MaxPermSize=128m, >> jp.sf.fess.exec.Crawler, --sessionId, 20100528100002] >> 2010-05-28 10:00:05,000 [main] INFO >> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >> s2-frameworkのバージョンは2.4.39です。 >> 2010-05-28 10:00:05,000 [main] INFO >> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >> s2-extensionのバージョンは2.4.39です。 >> 2010-05-28 10:00:05,000 [main] INFO >> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >> s2-tigerのバージョンは2.4.39です。 >> 2010-05-28 10:00:08,640 [main] INFO >> jp.sf.fess.db.allcommon.DBFluteInitializer - ...Initializing DBFlute >> components! >> 2010-05-28 10:00:08,640 [main] INFO >> org.seasar.dbflute.s2dao.extension.TnSqlLogRegistry - ...Closing the >> sqlLogRegistry. >> 2010-05-28 10:00:08,671 [main] INFO >> jp.sf.fess.db.allcommon.DBFluteConfig - ...Locking the configuration >> of DBFlute! >> 2010-05-28 10:00:08,765 [main] INFO >> org.seasar.robot.db.allcommon.DBFluteInitializer - ...Initializing >> DBFlute components! >> 2010-05-28 10:00:08,812 [main] INFO >> org.seasar.robot.db.allcommon.DBFluteConfig - ...Locking the >> configuration of DBFlute! >> 2010-05-28 10:00:13,109 [main] INFO >> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >> Running on [ENV]product, [DEPLOY MODE]Cool Deploy >> 2010-05-28 10:00:13,812 [main] INFO jp.sf.fess.exec.Crawler - >> Starting Crawler.. >> 2010-05-28 10:00:14,796 [Robot-20100528100002-1-3] INFO >> org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: >> http://10.nnn.nn.nnn/ >> 2010-05-28 10:00:14,921 [Robot-20100528100002-1-3] INFO >> org.seasar.robot.client.http.CommonsHttpClient - Checking URL: >> http://10.nnn.nn.nnn/robots.txt >> 2010-05-28 10:00:19,359 [Robot-20100528100002-2-4] INFO >> org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: >> http://10.nnn.nn.nnn/ >> 2010-05-28 10:00:19,406 [Robot-20100528100002-2-4] INFO >> org.seasar.robot.client.http.CommonsHttpClient - Checking URL: >> http://10.nnn.nn.nnn/robots.txt >> 2010-05-28 10:00:24,468 [Robot-20100528100002-3-4] INFO >> org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: >> http://150.nn.nn.nnn/oks.htm >> 2010-05-28 10:00:24,500 [Robot-20100528100002-3-4] INFO >> org.seasar.robot.client.http.CommonsHttpClient - Checking URL: >> http://150.nn.nn.nnn/robots.txt >> 2010-05-28 10:00:24,625 [Robot-20100528100002-3-4] INFO >> org.apache.commons.httpclient.HttpMethodDirector - No credentials >> available for DIGEST 'Digest'@150.16.97.150:80 >> 2010-05-28 10:01:14,375 [IndexUpdater] INFO >> jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 3. >> The processing size is 3. The execution time is 16ms. >> 2010-05-28 10:01:14,406 [IndexUpdater] INFO >> jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. >> The processing size is 0. The execution time is 0ms. >> 2010-05-28 10:02:14,359 [IndexUpdater] INFO >> jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. >> The processing size is 0. The execution time is 0ms. >> 2010-05-28 10:02:19,703 [main] INFO jp.sf.fess.helper.WebIndexHelper >> - [EXEC TIME] crawling time: 125641ms >> 2010-05-28 10:03:14,359 [IndexUpdater] INFO >> jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. >> The processing size is 0. The execution time is 0ms. >> 2010-05-28 10:03:14,359 [IndexUpdater] INFO >> jp.sf.fess.solr.IndexUpdater - [EXEC TIME] index update time: 47ms >> 2010-05-28 10:03:14,531 [main] INFO >> jp.sf.fess.helper.FileSystemIndexHelper - No crawling target urls. >> 2010-05-28 10:03:14,562 [main] INFO jp.sf.fess.helper.DataIndexHelper >> - No crawling target data. >> 2010-05-28 10:03:14,750 [main] INFO jp.sf.fess.exec.Crawler - [EXEC >> TIME] index optimize time: 188ms >> 2010-05-28 10:03:14,750 [main] INFO jp.sf.fess.exec.Crawler - Finished Crawler >> 2010-05-28 10:03:17,812 [Thread-16] INFO >> jp.sf.fess.helper.SystemHelper - Crawler: Exit Code=0 - Crawler >> Process Output: >> Processed: C:\fess\fess-server-3.0.0\webapps\fess\WEB-INF\db\robot.h2.db >> WARN: The method class >> org.apache.commons.logging.impl.SLF4JLogFactory#release() was invoked. >> WARN: Please see http://www.slf4j.org/codes.html#release for an explanation. >> >> 以上です。よろしくお願いします。 >> >> 2010年5月28日15:21 Shinsuke Sugaya : >>> 菅谷です。 >>> >>> まず、システム設定のSolrの設定でSolrグループが >>> 有効になっていますでしょうか?あとは、 >>> logs/catalina.out と webapps/fess/WEB-INF/logs/fess.out >>> はクロール時にどのような出力になっているでしょうか? >>> よろしくお願いいたします。 >>> >>> shinsuke >>> >>> >>> 2010年5月28日11:12 kazuto fukuda : >>>> はじめまして、福田と申します。 >>>> >>>> Fessの導入テスト中です。 >>>> イントラネットのサイトが対象なのですが、インデックスが作成されません。 >>>> >>>> ウェブクロールの設定で >>>> URL >>>> http://10.nnn.nn.nnn/ >>>> クロール対象とするURL >>>> http://10.nnn.nn.nnn/.* >>>> >>>> としております。 >>>> 昨日は一度この設定で、一度はインデックスが作成されたのですが、 >>>> 今日、システム設定のSolrアクションで削除してから、クローラープロセスを >>>> 実行したところ、何も作成されませんでした。 >>>> ログファイルも見ましたが、特にエラーは出ていないようです。 >>>> 何が問題なのでしょうか? >>>> >>>> 以上です。よろしくお願いします。 >>>> >>>> _______________________________________________ >>>> Fess-user mailing list >>>> Fess-user @ lists.sourceforge.jp >>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>> >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From kf96614 @ gmail.com Fri May 28 21:54:49 2010 From: kf96614 @ gmail.com (kazuto fukuda) Date: Fri, 28 May 2010 21:54:49 +0900 Subject: [fess-user 223] Re: =?iso-2022-jp?b?RmVzcxskQiRLJEQkJCRGJE48QUxkGyhC?= In-Reply-To: References: Message-ID: 菅谷様 福田です。 > robots.txt で除外するルールが記述されているか すいません。この部分見落としてました。 月曜日に調べてみます。 よろしくお願いします。 2010年5月28日18:16 Shinsuke Sugaya : > 菅谷です。 > > 情報をありがとうございます。 > ログを見ると、3 ドキュメントでインデックスを > 作られていると思われます。他にもクロール対象と > なるドキュメントがあるとすると、robots.txt で > 除外するルールが記述されているか、"No credentials > available for DIGEST" と言われているので、 > DIGEST 認証でブロックされているかな気がします。 > よろしくお願いします。 > > shinsuke > > 2010年5月28日16:26 kazuto fukuda : >> 菅谷様 >> >> 回答有難うございます。 >> >>> まず、システム設定のSolrの設定でSolrグループが >>> 有効になっていますでしょうか?あとは、 >> 有効になっています。 >> >>> logs/catalina.out と webapps/fess/WEB-INF/logs/fess.out >>> はクロール時にどのような出力になっているでしょうか? >> >> 2010-05-28 09:59:05,453 [main] INFO >> org.seasar.struts.validator.S2ValidatorPlugIn - Loading validation >> rules file from '/WEB-INF/validator-rules.xml' >> 2010-05-28 09:59:06,281 [main] INFO >> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >> s2-frameworkのバージョンは2.4.39です。 >> 2010-05-28 09:59:06,281 [main] INFO >> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >> s2-extensionのバージョンは2.4.39です。 >> 2010-05-28 09:59:06,281 [main] INFO >> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >> s2-tigerのバージョンは2.4.39です。 >> 2010-05-28 09:59:10,046 [main] INFO >> jp.sf.fess.db.allcommon.DBFluteInitializer - ...Initializing DBFlute >> components! >> 2010-05-28 09:59:10,062 [main] INFO >> org.seasar.dbflute.s2dao.extension.TnSqlLogRegistry - ...Closing the >> sqlLogRegistry. >> 2010-05-28 09:59:10,093 [main] INFO >> jp.sf.fess.db.allcommon.DBFluteConfig - ...Locking the configuration >> of DBFlute! >> 2010-05-28 09:59:18,031 [main] INFO >> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >> Running on [ENV]product, [DEPLOY MODE]Cool Deploy >> 2010-05-28 10:00:02,421 [Thread-16] INFO >> jp.sf.fess.helper.SystemHelper - Crawler: >> Directory=C:\fess\fess-server-3.0.0\webapps\fess >> Options=[java, -cp, >> WEB-INF\cmd\resources;WEB-INF\classes;WEB-INF\lib\antlr-2.7.2.jar;WEB-INF\lib\aopalliance-1.0.jar;WEB-INF\lib\args4j-2.0.12.jar;WEB-INF\lib\asm-3.1.jar;WEB-INF\lib\bcmail-jdk16-1.44.jar;WEB-INF\lib\bcprov-jdk16-1.44.jar;WEB-INF\lib\commons-beanutils-1.7.0.jar;WEB-INF\lib\commons-codec-1.3.jar;WEB-INF\lib\commons-collections-3.2.jar;WEB-INF\lib\commons-compress-1.0.jar;WEB-INF\lib\commons-digester-1.6.jar;WEB-INF\lib\commons-el-1.0.jar;WEB-INF\lib\commons-fileupload-1.2.1.jar;WEB-INF\lib\commons-httpclient-3.1.jar;WEB-INF\lib\commons-io-1.4.jar;WEB-INF\lib\commons-lang-2.3.jar;WEB-INF\lib\commons-logging-1.0.3.jar;WEB-INF\lib\commons-validator-1.2.0.jar;WEB-INF\lib\dbflute-runtime-0.9.5.1.jar;WEB-INF\lib\dom4j-1.6.1.jar;WEB-INF\lib\fontbox-1.0-20091008.jar;WEB-INF\lib\geronimo-annotation_1.0_spec-1.0.jar;WEB-INF\lib\geronimo-ejb_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-interceptor_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-jpa_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-jta_1.1_spec-1.0.jar;WEB-INF\lib\geronimo-stax-api_1.0_spec-1.0.1.jar;WEB-INF\lib\h2-1.2.128.jar;WEB-INF\lib\icu4j-3.8.jar;WEB-INF\lib\javassist-3.4.ga.jar;WEB-INF\lib\jcl-over-slf4j-1.5.6.jar;WEB-INF\lib\jempbox-0.8.0-20091008.jar;WEB-INF\lib\jstl-1.1.2.jar;WEB-INF\lib\log4j-1.2.14.jar;WEB-INF\lib\lucene-analyzers-2.9.1.jar;WEB-INF\lib\lucene-core-2.9.1.jar;WEB-INF\lib\lucene-highlighter-2.9.1.jar;WEB-INF\lib\lucene-memory-2.9.1.jar;WEB-INF\lib\lucene-misc-2.9.1.jar;WEB-INF\lib\lucene-queries-2.9.1.jar;WEB-INF\lib\lucene-snowball-2.9.1.jar;WEB-INF\lib\lucene-spellchecker-2.9.1.jar;WEB-INF\lib\mobylet-charset-1.0.2.jar;WEB-INF\lib\mobylet-core-1.0.2.jar;WEB-INF\lib\mobylet-s2extension-1.0.2.jar;WEB-INF\lib\mobylet-taglibs-1.0.2.jar;WEB-INF\lib\nekohtml-1.9.13.jar;WEB-INF\lib\ognl-2.6.9-patch-20070908.jar;WEB-INF\lib\ooxml-schemas-1.0.jar;WEB-INF\lib\org.codehaus.woodstox-wstx-asl-3.2.7.jar;WEB-INF\lib\oro-2.0.8.jar;WEB-INF\lib\pdfbox-0.8.0-20091008.jar;WEB-INF\lib\poi-3.5-FINAL.jar;WEB-INF\lib\poi-ooxml-3.5-FINAL.jar;WEB-INF\lib\poi-scratchpad-3.5-FINAL.jar;WEB-INF\lib\s2-extension-2.4.39.jar;WEB-INF\lib\s2-framework-2.4.39.jar;WEB-INF\lib\s2-robot-0.4.0.jar;WEB-INF\lib\s2-robot-db-0.4.0.jar;WEB-INF\lib\s2-robot-db-h2-0.4.0.jar;WEB-INF\lib\s2-robot-dbflute-runtime-0.9.6.jar;WEB-INF\lib\s2-tiger-2.4.39.jar;WEB-INF\lib\s2chronos-core-1.0.0.jar;WEB-INF\lib\s2chronos-extension-1.0.0.jar;WEB-INF\lib\sa-struts-1.0.4-sp7.jar;WEB-INF\lib\serializer-2.7.1.jar;WEB-INF\lib\slf4j-api-1.5.6.jar;WEB-INF\lib\slf4j-log4j12-1.5.6.jar;WEB-INF\lib\solr-commons-csv-1.4.0.jar;WEB-INF\lib\solr-core-1.4.0.jar;WEB-INF\lib\solr-solrj-1.4.0.jar;WEB-INF\lib\standard-1.1.2.jar;WEB-INF\lib\stax-api-1.0.1.jar;WEB-INF\lib\struts-1.2.9.jar;WEB-INF\lib\tika-core-0.5-20091008.jar;WEB-INF\lib\tika-parsers-0.5-20091008.jar;WEB-INF\lib\woodstox-wstx-asl-3.2.7.jar;WEB-INF\lib\xalan-2.7.1.jar;WEB-INF\lib\xercesImpl-2.8.1.jar;WEB-INF\lib\xmlbeans-2.3.0.jar;WEB-INF\cmd\lib\geronimo-servlet_2.4_spec-1.0.jar, >> -Dfess.crawler.process=true, >> -Dsolr.solr.home=C:\fess\fess-server-3.0.0\solr, >> -Dsolr.data.dir=C:\fess\fess-server-3.0.0\solr\core1\data, >> -Dfess.log.file=C:\fess\fess-server-3.0.0\webapps\fess\WEB-INF\logs\fess.out, >> -Djava.awt.headless=true, -server, -XX:+UseGCOverheadLimit, >> -XX:+UseConcMarkSweepGC, -XX:+CMSIncrementalMode, -XX:+UseTLAB, >> -Dpdfbox.cjk.support=true, -Xmx512m, -XX:MaxPermSize=128m, >> jp.sf.fess.exec.Crawler, --sessionId, 20100528100002] >> 2010-05-28 10:00:05,000 [main] INFO >> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >> s2-frameworkのバージョンは2.4.39です。 >> 2010-05-28 10:00:05,000 [main] INFO >> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >> s2-extensionのバージョンは2.4.39です。 >> 2010-05-28 10:00:05,000 [main] INFO >> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >> s2-tigerのバージョンは2.4.39です。 >> 2010-05-28 10:00:08,640 [main] INFO >> jp.sf.fess.db.allcommon.DBFluteInitializer - ...Initializing DBFlute >> components! >> 2010-05-28 10:00:08,640 [main] INFO >> org.seasar.dbflute.s2dao.extension.TnSqlLogRegistry - ...Closing the >> sqlLogRegistry. >> 2010-05-28 10:00:08,671 [main] INFO >> jp.sf.fess.db.allcommon.DBFluteConfig - ...Locking the configuration >> of DBFlute! >> 2010-05-28 10:00:08,765 [main] INFO >> org.seasar.robot.db.allcommon.DBFluteInitializer - ...Initializing >> DBFlute components! >> 2010-05-28 10:00:08,812 [main] INFO >> org.seasar.robot.db.allcommon.DBFluteConfig - ...Locking the >> configuration of DBFlute! >> 2010-05-28 10:00:13,109 [main] INFO >> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >> Running on [ENV]product, [DEPLOY MODE]Cool Deploy >> 2010-05-28 10:00:13,812 [main] INFO jp.sf.fess.exec.Crawler - >> Starting Crawler.. >> 2010-05-28 10:00:14,796 [Robot-20100528100002-1-3] INFO >> org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: >> http://10.nnn.nn.nnn/ >> 2010-05-28 10:00:14,921 [Robot-20100528100002-1-3] INFO >> org.seasar.robot.client.http.CommonsHttpClient - Checking URL: >> http://10.nnn.nn.nnn/robots.txt >> 2010-05-28 10:00:19,359 [Robot-20100528100002-2-4] INFO >> org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: >> http://10.nnn.nn.nnn/ >> 2010-05-28 10:00:19,406 [Robot-20100528100002-2-4] INFO >> org.seasar.robot.client.http.CommonsHttpClient - Checking URL: >> http://10.nnn.nn.nnn/robots.txt >> 2010-05-28 10:00:24,468 [Robot-20100528100002-3-4] INFO >> org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: >> http://150.nn.nn.nnn/oks.htm >> 2010-05-28 10:00:24,500 [Robot-20100528100002-3-4] INFO >> org.seasar.robot.client.http.CommonsHttpClient - Checking URL: >> http://150.nn.nn.nnn/robots.txt >> 2010-05-28 10:00:24,625 [Robot-20100528100002-3-4] INFO >> org.apache.commons.httpclient.HttpMethodDirector - No credentials >> available for DIGEST 'Digest'@150.16.97.150:80 >> 2010-05-28 10:01:14,375 [IndexUpdater] INFO >> jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 3. >> The processing size is 3. The execution time is 16ms. >> 2010-05-28 10:01:14,406 [IndexUpdater] INFO >> jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. >> The processing size is 0. The execution time is 0ms. >> 2010-05-28 10:02:14,359 [IndexUpdater] INFO >> jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. >> The processing size is 0. The execution time is 0ms. >> 2010-05-28 10:02:19,703 [main] INFO jp.sf.fess.helper.WebIndexHelper >> - [EXEC TIME] crawling time: 125641ms >> 2010-05-28 10:03:14,359 [IndexUpdater] INFO >> jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. >> The processing size is 0. The execution time is 0ms. >> 2010-05-28 10:03:14,359 [IndexUpdater] INFO >> jp.sf.fess.solr.IndexUpdater - [EXEC TIME] index update time: 47ms >> 2010-05-28 10:03:14,531 [main] INFO >> jp.sf.fess.helper.FileSystemIndexHelper - No crawling target urls. >> 2010-05-28 10:03:14,562 [main] INFO jp.sf.fess.helper.DataIndexHelper >> - No crawling target data. >> 2010-05-28 10:03:14,750 [main] INFO jp.sf.fess.exec.Crawler - [EXEC >> TIME] index optimize time: 188ms >> 2010-05-28 10:03:14,750 [main] INFO jp.sf.fess.exec.Crawler - Finished Crawler >> 2010-05-28 10:03:17,812 [Thread-16] INFO >> jp.sf.fess.helper.SystemHelper - Crawler: Exit Code=0 - Crawler >> Process Output: >> Processed: C:\fess\fess-server-3.0.0\webapps\fess\WEB-INF\db\robot.h2.db >> WARN: The method class >> org.apache.commons.logging.impl.SLF4JLogFactory#release() was invoked. >> WARN: Please see http://www.slf4j.org/codes.html#release for an explanation. >> >> 以上です。よろしくお願いします。 >> >> 2010年5月28日15:21 Shinsuke Sugaya : >>> 菅谷です。 >>> >>> まず、システム設定のSolrの設定でSolrグループが >>> 有効になっていますでしょうか?あとは、 >>> logs/catalina.out と webapps/fess/WEB-INF/logs/fess.out >>> はクロール時にどのような出力になっているでしょうか? >>> よろしくお願いいたします。 >>> >>> shinsuke >>> >>> >>> 2010年5月28日11:12 kazuto fukuda : >>>> はじめまして、福田と申します。 >>>> >>>> Fessの導入テスト中です。 >>>> イントラネットのサイトが対象なのですが、インデックスが作成されません。 >>>> >>>> ウェブクロールの設定で >>>> URL >>>> http://10.nnn.nn.nnn/ >>>> クロール対象とするURL >>>> http://10.nnn.nn.nnn/.* >>>> >>>> としております。 >>>> 昨日は一度この設定で、一度はインデックスが作成されたのですが、 >>>> 今日、システム設定のSolrアクションで削除してから、クローラープロセスを >>>> 実行したところ、何も作成されませんでした。 >>>> ログファイルも見ましたが、特にエラーは出ていないようです。 >>>> 何が問題なのでしょうか? >>>> >>>> 以上です。よろしくお願いします。 >>>> >>>> _______________________________________________ >>>> Fess-user mailing list >>>> Fess-user @ lists.sourceforge.jp >>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>> >>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user > From kf96614 @ gmail.com Mon May 31 11:22:41 2010 From: kf96614 @ gmail.com (kazuto fukuda) Date: Mon, 31 May 2010 11:22:41 +0900 Subject: [fess-user 224] Re: =?iso-2022-jp?b?RmVzcxskQiRLJEQkJCRGJE48QUxkGyhC?= In-Reply-To: References: Message-ID: 菅谷様 お世話になります。福田です。 調べましたところ、以下の事がわかりました。 URLに指定したフォルダには、検索の始点となるいわばリンク集になる ようなページがあるのですが、拡張子がhtmlではなくhtmで、 どんなファイルか見てみると、MicrosoftWordで作成されたWebページ でした。 これはクロールの対象にはならないですよね。 検索ルールのファイル「s2robot_rule.dicon?」を変更すれば対象には 出来そうな感じですが、単純なテキストファイルではないので、リンク先 を取得するのは難しいでしょうか? 以上です。よろしくお願いします。 2010年5月28日21:54 kazuto fukuda : > 菅谷様 > > 福田です。 > >> robots.txt で除外するルールが記述されているか > > すいません。この部分見落としてました。 > 月曜日に調べてみます。 > > よろしくお願いします。 > > 2010年5月28日18:16 Shinsuke Sugaya : >> 菅谷です。 >> >> 情報をありがとうございます。 >> ログを見ると、3 ドキュメントでインデックスを >> 作られていると思われます。他にもクロール対象と >> なるドキュメントがあるとすると、robots.txt で >> 除外するルールが記述されているか、"No credentials >> available for DIGEST" と言われているので、 >> DIGEST 認証でブロックされているかな気がします。 >> よろしくお願いします。 >> >> shinsuke >> >> 2010年5月28日16:26 kazuto fukuda : >>> 菅谷様 >>> >>> 回答有難うございます。 >>> >>>> まず、システム設定のSolrの設定でSolrグループが >>>> 有効になっていますでしょうか?あとは、 >>> 有効になっています。 >>> >>>> logs/catalina.out と webapps/fess/WEB-INF/logs/fess.out >>>> はクロール時にどのような出力になっているでしょうか? >>> >>> 2010-05-28 09:59:05,453 [main] INFO >>> org.seasar.struts.validator.S2ValidatorPlugIn - Loading validation >>> rules file from '/WEB-INF/validator-rules.xml' >>> 2010-05-28 09:59:06,281 [main] INFO >>> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >>> s2-frameworkのバージョンは2.4.39です。 >>> 2010-05-28 09:59:06,281 [main] INFO >>> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >>> s2-extensionのバージョンは2.4.39です。 >>> 2010-05-28 09:59:06,281 [main] INFO >>> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >>> s2-tigerのバージョンは2.4.39です。 >>> 2010-05-28 09:59:10,046 [main] INFO >>> jp.sf.fess.db.allcommon.DBFluteInitializer - ...Initializing DBFlute >>> components! >>> 2010-05-28 09:59:10,062 [main] INFO >>> org.seasar.dbflute.s2dao.extension.TnSqlLogRegistry - ...Closing the >>> sqlLogRegistry. >>> 2010-05-28 09:59:10,093 [main] INFO >>> jp.sf.fess.db.allcommon.DBFluteConfig - ...Locking the configuration >>> of DBFlute! >>> 2010-05-28 09:59:18,031 [main] INFO >>> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >>> Running on [ENV]product, [DEPLOY MODE]Cool Deploy >>> 2010-05-28 10:00:02,421 [Thread-16] INFO >>> jp.sf.fess.helper.SystemHelper - Crawler: >>> Directory=C:\fess\fess-server-3.0.0\webapps\fess >>> Options=[java, -cp, >>> WEB-INF\cmd\resources;WEB-INF\classes;WEB-INF\lib\antlr-2.7.2.jar;WEB-INF\lib\aopalliance-1.0.jar;WEB-INF\lib\args4j-2.0.12.jar;WEB-INF\lib\asm-3.1.jar;WEB-INF\lib\bcmail-jdk16-1.44.jar;WEB-INF\lib\bcprov-jdk16-1.44.jar;WEB-INF\lib\commons-beanutils-1.7.0.jar;WEB-INF\lib\commons-codec-1.3.jar;WEB-INF\lib\commons-collections-3.2.jar;WEB-INF\lib\commons-compress-1.0.jar;WEB-INF\lib\commons-digester-1.6.jar;WEB-INF\lib\commons-el-1.0.jar;WEB-INF\lib\commons-fileupload-1.2.1.jar;WEB-INF\lib\commons-httpclient-3.1.jar;WEB-INF\lib\commons-io-1.4.jar;WEB-INF\lib\commons-lang-2.3.jar;WEB-INF\lib\commons-logging-1.0.3.jar;WEB-INF\lib\commons-validator-1.2.0.jar;WEB-INF\lib\dbflute-runtime-0.9.5.1.jar;WEB-INF\lib\dom4j-1.6.1.jar;WEB-INF\lib\fontbox-1.0-20091008.jar;WEB-INF\lib\geronimo-annotation_1.0_spec-1.0.jar;WEB-INF\lib\geronimo-ejb_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-interceptor_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-jpa_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-jta_1.1_spec-1.0.jar;WEB-INF\lib\geronimo-stax-api_1.0_spec-1.0.1.jar;WEB-INF\lib\h2-1.2.128.jar;WEB-INF\lib\icu4j-3.8.jar;WEB-INF\lib\javassist-3.4.ga.jar;WEB-INF\lib\jcl-over-slf4j-1.5.6.jar;WEB-INF\lib\jempbox-0.8.0-20091008.jar;WEB-INF\lib\jstl-1.1.2.jar;WEB-INF\lib\log4j-1.2.14.jar;WEB-INF\lib\lucene-analyzers-2.9.1.jar;WEB-INF\lib\lucene-core-2.9.1.jar;WEB-INF\lib\lucene-highlighter-2.9.1.jar;WEB-INF\lib\lucene-memory-2.9.1.jar;WEB-INF\lib\lucene-misc-2.9.1.jar;WEB-INF\lib\lucene-queries-2.9.1.jar;WEB-INF\lib\lucene-snowball-2.9.1.jar;WEB-INF\lib\lucene-spellchecker-2.9.1.jar;WEB-INF\lib\mobylet-charset-1.0.2.jar;WEB-INF\lib\mobylet-core-1.0.2.jar;WEB-INF\lib\mobylet-s2extension-1.0.2.jar;WEB-INF\lib\mobylet-taglibs-1.0.2.jar;WEB-INF\lib\nekohtml-1.9.13.jar;WEB-INF\lib\ognl-2.6.9-patch-20070908.jar;WEB-INF\lib\ooxml-schemas-1.0.jar;WEB-INF\lib\org.codehaus.woodstox-wstx-asl-3.2.7.jar;WEB-INF\lib\oro-2.0.8.jar;WEB-INF\lib\pdfbox-0.8.0-20091008.jar;WEB-INF\lib\poi-3.5-FINAL.jar;WEB-INF\lib\poi-ooxml-3.5-FINAL.jar;WEB-INF\lib\poi-scratchpad-3.5-FINAL.jar;WEB-INF\lib\s2-extension-2.4.39.jar;WEB-INF\lib\s2-framework-2.4.39.jar;WEB-INF\lib\s2-robot-0.4.0.jar;WEB-INF\lib\s2-robot-db-0.4.0.jar;WEB-INF\lib\s2-robot-db-h2-0.4.0.jar;WEB-INF\lib\s2-robot-dbflute-runtime-0.9.6.jar;WEB-INF\lib\s2-tiger-2.4.39.jar;WEB-INF\lib\s2chronos-core-1.0.0.jar;WEB-INF\lib\s2chronos-extension-1.0.0.jar;WEB-INF\lib\sa-struts-1.0.4-sp7.jar;WEB-INF\lib\serializer-2.7.1.jar;WEB-INF\lib\slf4j-api-1.5.6.jar;WEB-INF\lib\slf4j-log4j12-1.5.6.jar;WEB-INF\lib\solr-commons-csv-1.4.0.jar;WEB-INF\lib\solr-core-1.4.0.jar;WEB-INF\lib\solr-solrj-1.4.0.jar;WEB-INF\lib\standard-1.1.2.jar;WEB-INF\lib\stax-api-1.0.1.jar;WEB-INF\lib\struts-1.2.9.jar;WEB-INF\lib\tika-core-0.5-20091008.jar;WEB-INF\lib\tika-parsers-0.5-20091008.jar;WEB-INF\lib\woodstox-wstx-asl-3.2.7.jar;WEB-INF\lib\xalan-2.7.1.jar;WEB-INF\lib\xercesImpl-2.8.1.jar;WEB-INF\lib\xmlbeans-2.3.0.jar;WEB-INF\cmd\lib\geronimo-servlet_2.4_spec-1.0.jar, >>> -Dfess.crawler.process=true, >>> -Dsolr.solr.home=C:\fess\fess-server-3.0.0\solr, >>> -Dsolr.data.dir=C:\fess\fess-server-3.0.0\solr\core1\data, >>> -Dfess.log.file=C:\fess\fess-server-3.0.0\webapps\fess\WEB-INF\logs\fess.out, >>> -Djava.awt.headless=true, -server, -XX:+UseGCOverheadLimit, >>> -XX:+UseConcMarkSweepGC, -XX:+CMSIncrementalMode, -XX:+UseTLAB, >>> -Dpdfbox.cjk.support=true, -Xmx512m, -XX:MaxPermSize=128m, >>> jp.sf.fess.exec.Crawler, --sessionId, 20100528100002] >>> 2010-05-28 10:00:05,000 [main] INFO >>> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >>> s2-frameworkのバージョンは2.4.39です。 >>> 2010-05-28 10:00:05,000 [main] INFO >>> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >>> s2-extensionのバージョンは2.4.39です。 >>> 2010-05-28 10:00:05,000 [main] INFO >>> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >>> s2-tigerのバージョンは2.4.39です。 >>> 2010-05-28 10:00:08,640 [main] INFO >>> jp.sf.fess.db.allcommon.DBFluteInitializer - ...Initializing DBFlute >>> components! >>> 2010-05-28 10:00:08,640 [main] INFO >>> org.seasar.dbflute.s2dao.extension.TnSqlLogRegistry - ...Closing the >>> sqlLogRegistry. >>> 2010-05-28 10:00:08,671 [main] INFO >>> jp.sf.fess.db.allcommon.DBFluteConfig - ...Locking the configuration >>> of DBFlute! >>> 2010-05-28 10:00:08,765 [main] INFO >>> org.seasar.robot.db.allcommon.DBFluteInitializer - ...Initializing >>> DBFlute components! >>> 2010-05-28 10:00:08,812 [main] INFO >>> org.seasar.robot.db.allcommon.DBFluteConfig - ...Locking the >>> configuration of DBFlute! >>> 2010-05-28 10:00:13,109 [main] INFO >>> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >>> Running on [ENV]product, [DEPLOY MODE]Cool Deploy >>> 2010-05-28 10:00:13,812 [main] INFO jp.sf.fess.exec.Crawler - >>> Starting Crawler.. >>> 2010-05-28 10:00:14,796 [Robot-20100528100002-1-3] INFO >>> org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: >>> http://10.nnn.nn.nnn/ >>> 2010-05-28 10:00:14,921 [Robot-20100528100002-1-3] INFO >>> org.seasar.robot.client.http.CommonsHttpClient - Checking URL: >>> http://10.nnn.nn.nnn/robots.txt >>> 2010-05-28 10:00:19,359 [Robot-20100528100002-2-4] INFO >>> org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: >>> http://10.nnn.nn.nnn/ >>> 2010-05-28 10:00:19,406 [Robot-20100528100002-2-4] INFO >>> org.seasar.robot.client.http.CommonsHttpClient - Checking URL: >>> http://10.nnn.nn.nnn/robots.txt >>> 2010-05-28 10:00:24,468 [Robot-20100528100002-3-4] INFO >>> org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: >>> http://150.nn.nn.nnn/oks.htm >>> 2010-05-28 10:00:24,500 [Robot-20100528100002-3-4] INFO >>> org.seasar.robot.client.http.CommonsHttpClient - Checking URL: >>> http://150.nn.nn.nnn/robots.txt >>> 2010-05-28 10:00:24,625 [Robot-20100528100002-3-4] INFO >>> org.apache.commons.httpclient.HttpMethodDirector - No credentials >>> available for DIGEST 'Digest'@150.16.97.150:80 >>> 2010-05-28 10:01:14,375 [IndexUpdater] INFO >>> jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 3. >>> The processing size is 3. The execution time is 16ms. >>> 2010-05-28 10:01:14,406 [IndexUpdater] INFO >>> jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. >>> The processing size is 0. The execution time is 0ms. >>> 2010-05-28 10:02:14,359 [IndexUpdater] INFO >>> jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. >>> The processing size is 0. The execution time is 0ms. >>> 2010-05-28 10:02:19,703 [main] INFO jp.sf.fess.helper.WebIndexHelper >>> - [EXEC TIME] crawling time: 125641ms >>> 2010-05-28 10:03:14,359 [IndexUpdater] INFO >>> jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. >>> The processing size is 0. The execution time is 0ms. >>> 2010-05-28 10:03:14,359 [IndexUpdater] INFO >>> jp.sf.fess.solr.IndexUpdater - [EXEC TIME] index update time: 47ms >>> 2010-05-28 10:03:14,531 [main] INFO >>> jp.sf.fess.helper.FileSystemIndexHelper - No crawling target urls. >>> 2010-05-28 10:03:14,562 [main] INFO jp.sf.fess.helper.DataIndexHelper >>> - No crawling target data. >>> 2010-05-28 10:03:14,750 [main] INFO jp.sf.fess.exec.Crawler - [EXEC >>> TIME] index optimize time: 188ms >>> 2010-05-28 10:03:14,750 [main] INFO jp.sf.fess.exec.Crawler - Finished Crawler >>> 2010-05-28 10:03:17,812 [Thread-16] INFO >>> jp.sf.fess.helper.SystemHelper - Crawler: Exit Code=0 - Crawler >>> Process Output: >>> Processed: C:\fess\fess-server-3.0.0\webapps\fess\WEB-INF\db\robot.h2.db >>> WARN: The method class >>> org.apache.commons.logging.impl.SLF4JLogFactory#release() was invoked. >>> WARN: Please see http://www.slf4j.org/codes.html#release for an explanation. >>> >>> 以上です。よろしくお願いします。 >>> >>> 2010年5月28日15:21 Shinsuke Sugaya : >>>> 菅谷です。 >>>> >>>> まず、システム設定のSolrの設定でSolrグループが >>>> 有効になっていますでしょうか?あとは、 >>>> logs/catalina.out と webapps/fess/WEB-INF/logs/fess.out >>>> はクロール時にどのような出力になっているでしょうか? >>>> よろしくお願いいたします。 >>>> >>>> shinsuke >>>> >>>> >>>> 2010年5月28日11:12 kazuto fukuda : >>>>> はじめまして、福田と申します。 >>>>> >>>>> Fessの導入テスト中です。 >>>>> イントラネットのサイトが対象なのですが、インデックスが作成されません。 >>>>> >>>>> ウェブクロールの設定で >>>>> URL >>>>> http://10.nnn.nn.nnn/ >>>>> クロール対象とするURL >>>>> http://10.nnn.nn.nnn/.* >>>>> >>>>> としております。 >>>>> 昨日は一度この設定で、一度はインデックスが作成されたのですが、 >>>>> 今日、システム設定のSolrアクションで削除してから、クローラープロセスを >>>>> 実行したところ、何も作成されませんでした。 >>>>> ログファイルも見ましたが、特にエラーは出ていないようです。 >>>>> 何が問題なのでしょうか? >>>>> >>>>> 以上です。よろしくお願いします。 >>>>> >>>>> _______________________________________________ >>>>> Fess-user mailing list >>>>> Fess-user @ lists.sourceforge.jp >>>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>>> >>>> >>>> _______________________________________________ >>>> Fess-user mailing list >>>> Fess-user @ lists.sourceforge.jp >>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>> >>> _______________________________________________ >>> Fess-user mailing list >>> Fess-user @ lists.sourceforge.jp >>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>> >> _______________________________________________ >> Fess-user mailing list >> Fess-user @ lists.sourceforge.jp >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > From kf96614 @ gmail.com Mon May 31 11:39:37 2010 From: kf96614 @ gmail.com (kazuto fukuda) Date: Mon, 31 May 2010 11:39:37 +0900 Subject: [fess-user 225] Re: =?iso-2022-jp?b?RmVzcxskQiRLJEQkJCRGJE48QUxkGyhC?= In-Reply-To: References: Message-ID: 菅谷様 お世話になります。福田です。 クロール対象としたいページでリンク先をselect boxで選ぶようになっている 物があります。 onchange="location=this.options[this.selectedIndex].value; "> > > > > > > このリンク先も検索対象にする事は出来るでしょうか? > > 以上です。よろしくお願いします。 > > 2010年5月31日11:22 kazuto fukuda : >> 菅谷様 >> >> お世話になります。福田です。 >> 調べましたところ、以下の事がわかりました。 >> URLに指定したフォルダには、検索の始点となるいわばリンク集になる >> ようなページがあるのですが、拡張子がhtmlではなくhtmで、 >> どんなファイルか見てみると、MicrosoftWordで作成されたWebページ >> でした。 >> これはクロールの対象にはならないですよね。 >> 検索ルールのファイル「s2robot_rule.dicon?」を変更すれば対象には >> 出来そうな感じですが、単純なテキストファイルではないので、リンク先 >> を取得するのは難しいでしょうか? >> >> 以上です。よろしくお願いします。 >> >> 2010年5月28日21:54 kazuto fukuda : >>> 菅谷様 >>> >>> 福田です。 >>> >>>> robots.txt で除外するルールが記述されているか >>> >>> すいません。この部分見落としてました。 >>> 月曜日に調べてみます。 >>> >>> よろしくお願いします。 >>> >>> 2010年5月28日18:16 Shinsuke Sugaya : >>>> 菅谷です。 >>>> >>>> 情報をありがとうございます。 >>>> ログを見ると、3 ドキュメントでインデックスを >>>> 作られていると思われます。他にもクロール対象と >>>> なるドキュメントがあるとすると、robots.txt で >>>> 除外するルールが記述されているか、"No credentials >>>> available for DIGEST" と言われているので、 >>>> DIGEST 認証でブロックされているかな気がします。 >>>> よろしくお願いします。 >>>> >>>> shinsuke >>>> >>>> 2010年5月28日16:26 kazuto fukuda : >>>>> 菅谷様 >>>>> >>>>> 回答有難うございます。 >>>>> >>>>>> まず、システム設定のSolrの設定でSolrグループが >>>>>> 有効になっていますでしょうか?あとは、 >>>>> 有効になっています。 >>>>> >>>>>> logs/catalina.out と webapps/fess/WEB-INF/logs/fess.out >>>>>> はクロール時にどのような出力になっているでしょうか? >>>>> >>>>> 2010-05-28 09:59:05,453 [main] INFO >>>>> org.seasar.struts.validator.S2ValidatorPlugIn - Loading validation >>>>> rules file from '/WEB-INF/validator-rules.xml' >>>>> 2010-05-28 09:59:06,281 [main] INFO >>>>> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >>>>> s2-frameworkのバージョンは2.4.39です。 >>>>> 2010-05-28 09:59:06,281 [main] INFO >>>>> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >>>>> s2-extensionのバージョンは2.4.39です。 >>>>> 2010-05-28 09:59:06,281 [main] INFO >>>>> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >>>>> s2-tigerのバージョンは2.4.39です。 >>>>> 2010-05-28 09:59:10,046 [main] INFO >>>>> jp.sf.fess.db.allcommon.DBFluteInitializer - ...Initializing DBFlute >>>>> components! >>>>> 2010-05-28 09:59:10,062 [main] INFO >>>>> org.seasar.dbflute.s2dao.extension.TnSqlLogRegistry - ...Closing the >>>>> sqlLogRegistry. >>>>> 2010-05-28 09:59:10,093 [main] INFO >>>>> jp.sf.fess.db.allcommon.DBFluteConfig - ...Locking the configuration >>>>> of DBFlute! >>>>> 2010-05-28 09:59:18,031 [main] INFO >>>>> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >>>>> Running on [ENV]product, [DEPLOY MODE]Cool Deploy >>>>> 2010-05-28 10:00:02,421 [Thread-16] INFO >>>>> jp.sf.fess.helper.SystemHelper - Crawler: >>>>> Directory=C:\fess\fess-server-3.0.0\webapps\fess >>>>> Options=[java, -cp, >>>>> WEB-INF\cmd\resources;WEB-INF\classes;WEB-INF\lib\antlr-2.7.2.jar;WEB-INF\lib\aopalliance-1.0.jar;WEB-INF\lib\args4j-2.0.12.jar;WEB-INF\lib\asm-3.1.jar;WEB-INF\lib\bcmail-jdk16-1.44.jar;WEB-INF\lib\bcprov-jdk16-1.44.jar;WEB-INF\lib\commons-beanutils-1.7.0.jar;WEB-INF\lib\commons-codec-1.3.jar;WEB-INF\lib\commons-collections-3.2.jar;WEB-INF\lib\commons-compress-1.0.jar;WEB-INF\lib\commons-digester-1.6.jar;WEB-INF\lib\commons-el-1.0.jar;WEB-INF\lib\commons-fileupload-1.2.1.jar;WEB-INF\lib\commons-httpclient-3.1.jar;WEB-INF\lib\commons-io-1.4.jar;WEB-INF\lib\commons-lang-2.3.jar;WEB-INF\lib\commons-logging-1.0.3.jar;WEB-INF\lib\commons-validator-1.2.0.jar;WEB-INF\lib\dbflute-runtime-0.9.5.1.jar;WEB-INF\lib\dom4j-1.6.1.jar;WEB-INF\lib\fontbox-1.0-20091008.jar;WEB-INF\lib\geronimo-annotation_1.0_spec-1.0.jar;WEB-INF\lib\geronimo-ejb_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-interceptor_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-jpa_3.0_spec-1.0.jar;WEB-INF\lib\geronimo-jta_1.1_spec-1.0.jar;WEB-INF\lib\geronimo-stax-api_1.0_spec-1.0.1.jar;WEB-INF\lib\h2-1.2.128.jar;WEB-INF\lib\icu4j-3.8.jar;WEB-INF\lib\javassist-3.4.ga.jar;WEB-INF\lib\jcl-over-slf4j-1.5.6.jar;WEB-INF\lib\jempbox-0.8.0-20091008.jar;WEB-INF\lib\jstl-1.1.2.jar;WEB-INF\lib\log4j-1.2.14.jar;WEB-INF\lib\lucene-analyzers-2.9.1.jar;WEB-INF\lib\lucene-core-2.9.1.jar;WEB-INF\lib\lucene-highlighter-2.9.1.jar;WEB-INF\lib\lucene-memory-2.9.1.jar;WEB-INF\lib\lucene-misc-2.9.1.jar;WEB-INF\lib\lucene-queries-2.9.1.jar;WEB-INF\lib\lucene-snowball-2.9.1.jar;WEB-INF\lib\lucene-spellchecker-2.9.1.jar;WEB-INF\lib\mobylet-charset-1.0.2.jar;WEB-INF\lib\mobylet-core-1.0.2.jar;WEB-INF\lib\mobylet-s2extension-1.0.2.jar;WEB-INF\lib\mobylet-taglibs-1.0.2.jar;WEB-INF\lib\nekohtml-1.9.13.jar;WEB-INF\lib\ognl-2.6.9-patch-20070908.jar;WEB-INF\lib\ooxml-schemas-1.0.jar;WEB-INF\lib\org.codehaus.woodstox-wstx-asl-3.2.7.jar;WEB-INF\lib\oro-2.0.8.jar;WEB-INF\lib\pdfbox-0.8.0-20091008.jar;WEB-INF\lib\poi-3.5-FINAL.jar;WEB-INF\lib\poi-ooxml-3.5-FINAL.jar;WEB-INF\lib\poi-scratchpad-3.5-FINAL.jar;WEB-INF\lib\s2-extension-2.4.39.jar;WEB-INF\lib\s2-framework-2.4.39.jar;WEB-INF\lib\s2-robot-0.4.0.jar;WEB-INF\lib\s2-robot-db-0.4.0.jar;WEB-INF\lib\s2-robot-db-h2-0.4.0.jar;WEB-INF\lib\s2-robot-dbflute-runtime-0.9.6.jar;WEB-INF\lib\s2-tiger-2.4.39.jar;WEB-INF\lib\s2chronos-core-1.0.0.jar;WEB-INF\lib\s2chronos-extension-1.0.0.jar;WEB-INF\lib\sa-struts-1.0.4-sp7.jar;WEB-INF\lib\serializer-2.7.1.jar;WEB-INF\lib\slf4j-api-1.5.6.jar;WEB-INF\lib\slf4j-log4j12-1.5.6.jar;WEB-INF\lib\solr-commons-csv-1.4.0.jar;WEB-INF\lib\solr-core-1.4.0.jar;WEB-INF\lib\solr-solrj-1.4.0.jar;WEB-INF\lib\standard-1.1.2.jar;WEB-INF\lib\stax-api-1.0.1.jar;WEB-INF\lib\struts-1.2.9.jar;WEB-INF\lib\tika-core-0.5-20091008.jar;WEB-INF\lib\tika-parsers-0.5-20091008.jar;WEB-INF\lib\woodstox-wstx-asl-3.2.7.jar;WEB-INF\lib\xalan-2.7.1.jar;WEB-INF\lib\xercesImpl-2.8.1.jar;WEB-INF\lib\xmlbeans-2.3.0.jar;WEB-INF\cmd\lib\geronimo-servlet_2.4_spec-1.0.jar, >>>>> -Dfess.crawler.process=true, >>>>> -Dsolr.solr.home=C:\fess\fess-server-3.0.0\solr, >>>>> -Dsolr.data.dir=C:\fess\fess-server-3.0.0\solr\core1\data, >>>>> -Dfess.log.file=C:\fess\fess-server-3.0.0\webapps\fess\WEB-INF\logs\fess.out, >>>>> -Djava.awt.headless=true, -server, -XX:+UseGCOverheadLimit, >>>>> -XX:+UseConcMarkSweepGC, -XX:+CMSIncrementalMode, -XX:+UseTLAB, >>>>> -Dpdfbox.cjk.support=true, -Xmx512m, -XX:MaxPermSize=128m, >>>>> jp.sf.fess.exec.Crawler, --sessionId, 20100528100002] >>>>> 2010-05-28 10:00:05,000 [main] INFO >>>>> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >>>>> s2-frameworkのバージョンは2.4.39です。 >>>>> 2010-05-28 10:00:05,000 [main] INFO >>>>> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >>>>> s2-extensionのバージョンは2.4.39です。 >>>>> 2010-05-28 10:00:05,000 [main] INFO >>>>> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >>>>> s2-tigerのバージョンは2.4.39です。 >>>>> 2010-05-28 10:00:08,640 [main] INFO >>>>> jp.sf.fess.db.allcommon.DBFluteInitializer - ...Initializing DBFlute >>>>> components! >>>>> 2010-05-28 10:00:08,640 [main] INFO >>>>> org.seasar.dbflute.s2dao.extension.TnSqlLogRegistry - ...Closing the >>>>> sqlLogRegistry. >>>>> 2010-05-28 10:00:08,671 [main] INFO >>>>> jp.sf.fess.db.allcommon.DBFluteConfig - ...Locking the configuration >>>>> of DBFlute! >>>>> 2010-05-28 10:00:08,765 [main] INFO >>>>> org.seasar.robot.db.allcommon.DBFluteInitializer - ...Initializing >>>>> DBFlute components! >>>>> 2010-05-28 10:00:08,812 [main] INFO >>>>> org.seasar.robot.db.allcommon.DBFluteConfig - ...Locking the >>>>> configuration of DBFlute! >>>>> 2010-05-28 10:00:13,109 [main] INFO >>>>> org.seasar.framework.container.factory.SingletonS2ContainerFactory - >>>>> Running on [ENV]product, [DEPLOY MODE]Cool Deploy >>>>> 2010-05-28 10:00:13,812 [main] INFO jp.sf.fess.exec.Crawler - >>>>> Starting Crawler.. >>>>> 2010-05-28 10:00:14,796 [Robot-20100528100002-1-3] INFO >>>>> org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: >>>>> http://10.nnn.nn.nnn/ >>>>> 2010-05-28 10:00:14,921 [Robot-20100528100002-1-3] INFO >>>>> org.seasar.robot.client.http.CommonsHttpClient - Checking URL: >>>>> http://10.nnn.nn.nnn/robots.txt >>>>> 2010-05-28 10:00:19,359 [Robot-20100528100002-2-4] INFO >>>>> org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: >>>>> http://10.nnn.nn.nnn/ >>>>> 2010-05-28 10:00:19,406 [Robot-20100528100002-2-4] INFO >>>>> org.seasar.robot.client.http.CommonsHttpClient - Checking URL: >>>>> http://10.nnn.nn.nnn/robots.txt >>>>> 2010-05-28 10:00:24,468 [Robot-20100528100002-3-4] INFO >>>>> org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: >>>>> http://150.nn.nn.nnn/oks.htm >>>>> 2010-05-28 10:00:24,500 [Robot-20100528100002-3-4] INFO >>>>> org.seasar.robot.client.http.CommonsHttpClient - Checking URL: >>>>> http://150.nn.nn.nnn/robots.txt >>>>> 2010-05-28 10:00:24,625 [Robot-20100528100002-3-4] INFO >>>>> org.apache.commons.httpclient.HttpMethodDirector - No credentials >>>>> available for DIGEST 'Digest'@150.16.97.150:80 >>>>> 2010-05-28 10:01:14,375 [IndexUpdater] INFO >>>>> jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 3. >>>>> The processing size is 3. The execution time is 16ms. >>>>> 2010-05-28 10:01:14,406 [IndexUpdater] INFO >>>>> jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. >>>>> The processing size is 0. The execution time is 0ms. >>>>> 2010-05-28 10:02:14,359 [IndexUpdater] INFO >>>>> jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. >>>>> The processing size is 0. The execution time is 0ms. >>>>> 2010-05-28 10:02:19,703 [main] INFO jp.sf.fess.helper.WebIndexHelper >>>>> - [EXEC TIME] crawling time: 125641ms >>>>> 2010-05-28 10:03:14,359 [IndexUpdater] INFO >>>>> jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. >>>>> The processing size is 0. The execution time is 0ms. >>>>> 2010-05-28 10:03:14,359 [IndexUpdater] INFO >>>>> jp.sf.fess.solr.IndexUpdater - [EXEC TIME] index update time: 47ms >>>>> 2010-05-28 10:03:14,531 [main] INFO >>>>> jp.sf.fess.helper.FileSystemIndexHelper - No crawling target urls. >>>>> 2010-05-28 10:03:14,562 [main] INFO jp.sf.fess.helper.DataIndexHelper >>>>> - No crawling target data. >>>>> 2010-05-28 10:03:14,750 [main] INFO jp.sf.fess.exec.Crawler - [EXEC >>>>> TIME] index optimize time: 188ms >>>>> 2010-05-28 10:03:14,750 [main] INFO jp.sf.fess.exec.Crawler - Finished Crawler >>>>> 2010-05-28 10:03:17,812 [Thread-16] INFO >>>>> jp.sf.fess.helper.SystemHelper - Crawler: Exit Code=0 - Crawler >>>>> Process Output: >>>>> Processed: C:\fess\fess-server-3.0.0\webapps\fess\WEB-INF\db\robot.h2.db >>>>> WARN: The method class >>>>> org.apache.commons.logging.impl.SLF4JLogFactory#release() was invoked. >>>>> WARN: Please see http://www.slf4j.org/codes.html#release for an explanation. >>>>> >>>>> 以上です。よろしくお願いします。 >>>>> >>>>> 2010年5月28日15:21 Shinsuke Sugaya : >>>>>> 菅谷です。 >>>>>> >>>>>> まず、システム設定のSolrの設定でSolrグループが >>>>>> 有効になっていますでしょうか?あとは、 >>>>>> logs/catalina.out と webapps/fess/WEB-INF/logs/fess.out >>>>>> はクロール時にどのような出力になっているでしょうか? >>>>>> よろしくお願いいたします。 >>>>>> >>>>>> shinsuke >>>>>> >>>>>> >>>>>> 2010年5月28日11:12 kazuto fukuda : >>>>>>> はじめまして、福田と申します。 >>>>>>> >>>>>>> Fessの導入テスト中です。 >>>>>>> イントラネットのサイトが対象なのですが、インデックスが作成されません。 >>>>>>> >>>>>>> ウェブクロールの設定で >>>>>>> URL >>>>>>> http://10.nnn.nn.nnn/ >>>>>>> クロール対象とするURL >>>>>>> http://10.nnn.nn.nnn/.* >>>>>>> >>>>>>> としております。 >>>>>>> 昨日は一度この設定で、一度はインデックスが作成されたのですが、 >>>>>>> 今日、システム設定のSolrアクションで削除してから、クローラープロセスを >>>>>>> 実行したところ、何も作成されませんでした。 >>>>>>> ログファイルも見ましたが、特にエラーは出ていないようです。 >>>>>>> 何が問題なのでしょうか? >>>>>>> >>>>>>> 以上です。よろしくお願いします。 >>>>>>> >>>>>>> _______________________________________________ >>>>>>> Fess-user mailing list >>>>>>> Fess-user @ lists.sourceforge.jp >>>>>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>>>>> >>>>>> >>>>>> _______________________________________________ >>>>>> Fess-user mailing list >>>>>> Fess-user @ lists.sourceforge.jp >>>>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>>>> >>>>> _______________________________________________ >>>>> Fess-user mailing list >>>>> Fess-user @ lists.sourceforge.jp >>>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>>> >>>> _______________________________________________ >>>> Fess-user mailing list >>>> Fess-user @ lists.sourceforge.jp >>>> http://lists.sourceforge.jp/mailman/listinfo/fess-user >>>> >>> >> > _______________________________________________ > Fess-user mailing list > Fess-user @ lists.sourceforge.jp > http://lists.sourceforge.jp/mailman/listinfo/fess-user >