Shinsuke Sugaya
shins****@yahoo*****
2010年 7月 18日 (日) 07:48:35 JST
菅谷です。 > (CPU:Core 2 Duo 2GHz、メモリ:1.5GB) この環境ですと、Fess 的には mx を 512m くらいが 上限な気がしますので、1 回あたりの Solr に送る ドキュメント数を下げるのが良い気がします。 webapps/fess/WEB-INF/cmd/resources/app.dicon で <component name="indexUpdater" class="jp.sf.fess.solr.IndexUpdater" instance="prototype"> <property name="maxDocumentCacheSize">5</property> </component> というように maxDocumentCacheSize を下げることが できます。デフォルトでは 1 回で 10 ドキュメントを Solr に送ります。 shinsuke 2010年7月17日11:21 Sugano <ganos****@gmail*****>: > お世話になってます。 > すがのです。 > >> > ご質問があるのですが、クロールで集めた情報(H2DB)を、SolrDBへ >> > 手動で登録する方法(機能など)はありませんでしょうか? >> >> 現状、ないです。クロールデータについては >> パフォーマンスに大きな影響を与えるので >> 消せるときに消す感じにしています。ただ >> 今回のように例外的にクロールを抜けるような >> 場合に残せるかどうかは検討してみます。 > 了解しました。 > 是非、お願いします。 > >> > ※少なくとも、catalina.outにはエラーメッセージなどは出力され >> > ていませんでした。他のログはこれから調べます。 >> >> 最新の環境であれば、fess_crawler.out が >> どうなっているかがポイントになるかと思います。 > fess_crawler.outを調べたところ、添付ファイル(fess_crawler. > outのログを一部抜粋、一部ファイルパスの修正有)のように > OutOfMemory エラーが発生していたことがわかりました。 > > 下記の設定は既にしているのですが、それでも発生するようです。 > http://fess.sourceforge.jp/ja/3.0/config/memory-config.html > > ちなみに、当方の環境・状況は以下のとおりです。 > > ●環境 > ・WindowsXP SP3に搭載して試用・検証中 > (CPU:Core 2 Duo 2GHz、メモリ:1.5GB) > ・JDK 6 Update 21 > ・fess-server-3.1.1 or 4.0.0SNAPSHOT > (どちらでも発生するようです) > ・メモリ関連設定:上記リンクと同じ設定 > > ●クロール設定 > ・対象ドキュメント: ファイルサーバ上のファイル 約6万件 > ・同時実行のクロール設定数:1 > ・ドキュメント数毎にコミット:500 > ・スレッド数:3 > ・間隔:1000ミリ秒 > > ●状況 > 約1万ドキュメントを処理したあたりで、メモリエラー発生 > ※エラー発生後は、延々とクロール処理のみが行われて、 > SolrDBへの登録処理が行われない状態 > ※かなり高い確率(現時点100%)で現象が再発。 > > > 上記、メモリ関連設定の再チューニングなどで回避は可能なのでし > ょうか? > > 以上、よろしくお願いします。 >> ----Original Message---- >> Fri, 16 Jul 2010 06:33:00 +0900 >> From: Shinsuke Sugaya <shins****@yahoo*****> >> Reply-To: fess-****@lists***** >> To: fess-****@lists***** >> Subject: [fess-user 290] Re:インデックスの作成が停止します >> > >> 菅谷です。 >> >> > ご質問があるのですが、クロールで集めた情報(H2DB)を、SolrDBへ >> > 手動で登録する方法(機能など)はありませんでしょうか? >> >> 現状、ないです。クロールデータについては >> パフォーマンスに大きな影響を与えるので >> 消せるときに消す感じにしています。ただ >> 今回のように例外的にクロールを抜けるような >> 場合に残せるかどうかは検討してみます。 >> >> > ※少なくとも、catalina.outにはエラーメッセージなどは出力され >> > ていませんでした。他のログはこれから調べます。 >> >> 最新の環境であれば、fess_crawler.out が >> どうなっているかがポイントになるかと思います。 >> >> よろしくお願いいたします。 >> >> shinsuke >> >> >> 2010年7月16日1:17 Sugano <ganos****@gmail*****>: >> > 初めまして、すがのと申します。 >> > >> > ご質問があるのですが、クロールで集めた情報(H2DB)を、SolrDBへ >> > 手動で登録する方法(機能など)はありませんでしょうか? >> > (クロール実行中もしくはクロール停止時に手動実行) >> > >> > というのも、私のところでも桑田さんとほぼ同様の現象が発生して >> > おり、 >> >> クローラープロセスが実行中にも関わらず、ドキュメント数が増 >> >> 加しなくなります。 >> >> システム設定画面で何度が停止->実行を繰り返しましたが状況が >> >> 変わりません。 >> > >> > 具体的には、以下2つの現象のいずれかが発生することが多く、 >> > >> > 事象1.クローラプロセスが稼働中にもかかわらず、クローラ側DB >> > (\webapp\fess\WEB-INF\db)やSolrDBへの登録が行われない。 >> > >> > 事象2.クローラ側DB(\webapp\fess\WEB-INF\db)への登録はされ >> > 続けるが、SolrDBへの登録が行われなず、クローラ側DBのみが増え >> > 続ける。 >> > >> > 上記の現象発生後に、クローラで収集したSolrDBへの未登録情報を >> > 破棄するのはもったいないので、収集した情報をSolrDBへ手動登録 >> > する手段を知りたいと考えております。 >> > (クロールを再度起動すると、前回収集した情報がすべて消えてし >> > まい、事象2で数万件分の情報が溜まっていたとしても全てクリア >> > されてしまうため、クリアされずにDB登録する方法が知りたいで >> > す。) >> > >> > ちなみに、本現象の原因については、下記を参考にして現在調査中 >> > ですが、現時点では原因は特定できていません。 >> >> おそらく crawler.out か catalina.out などに出力されて >> >> いるかと思います。以下を参照してみてください。 >> >> >> >> http://fess.sourceforge.jp/ja/3.0/config/logging.html >> >> >> > ※少なくとも、catalina.outにはエラーメッセージなどは出力され >> > ていませんでした。他のログはこれから調べます。 >> > ※ファイルパスの長さが260字以上(WindowsのMAX_PATH値以上)のデ >> > ィレクトリ・ファイルもあるため、それが原因の一つの可能性も有 >> > り? >> > ※上記、もう少し調べてわからないようであれば、再度詳細な情報 >> > をお知らせします。 >> > >> > 以上、よろしくお願い致します。 >> > >> >> 菅谷です。 >> >> >> >> おそらく crawler.out か catalina.out などに出力されて >> >> いるかと思います。以下を参照してみてください。 >> >> >> >> http://fess.sourceforge.jp/ja/3.0/config/logging.html >> >> >> >> よろしくお願いいたします。 >> >> >> >> shinsuke >> >> >> >> >> >> 2010年7月14日16:53 Tetsutomo Kuwata <fj.kuwata @ gmail. >> >> com>: >> >> 初めまして、桑田と申します。 >> >> >> >> この度始めてFessを導入しインデックス作成を実行しているとこ >> >> ろなのですが >> >> クローラープロセスが実行中にも関わらず、ドキュメント数が増 >> >> 加しなくなります。 >> >> システム設定画面で何度が停止->実行を繰り返しましたが状況が >> >> 変わりません。 >> >> どの辺を調べれば原因がわかりますでしょうか。 >> >> >> >> 環境 >> >> Windows Server 2003 R2 >> >> JDK 6 Update 20 >> >> fess-server-3.1.1(サービスとして登録) >> >> >> >> 対象ドキュメント: ファイルシステム 23万件 >> >> 現在のドキュメント数: 4万件 >> >> >> >> >> >> 以上、よろしくお願い致します。 >> >> >> >> _______________________________________________ >> >> Fess-user mailing list >> >> Fess-****@lists***** >> >> http://lists.sourceforge.jp/mailman/listinfo/fess-user >> >> >> > >> > _______________________________________________ >> > Fess-user mailing list >> > Fess-****@lists***** >> > http://lists.sourceforge.jp/mailman/listinfo/fess-user >> > >> >> _______________________________________________ >> Fess-user mailing list >> Fess-****@lists***** >> http://lists.sourceforge.jp/mailman/listinfo/fess-user > > > _______________________________________________ > Fess-user mailing list > Fess-****@lists***** > http://lists.sourceforge.jp/mailman/listinfo/fess-user > >