Kimura,Ryo
ryo.k****@jp*****
2014年 10月 1日 (水) 12:22:44 JST
Kimuraです。 ここ2か月位の間、社内ポータル用のサイト内検索としてFessを設定していますが、 以前設定していた通りのURLのインデックスができません。 ウェブクロールの設定→URL欄に各htmlページパスを記載しているのですが、4つの内、1つ のページしかインデックスされません。 ActiveDirectoryでネットワークを構成しているため、其々のアクセス権、文字エンコード等も統一していても 常に決まったページしかインデックスされません。 また下記の通り、ヘルプにはクロール後インデックスデータを手動でコミットする必要がないと書かれていますが、 新しいインデックスができるとコミットしないと検索ができない状態になります。 コミットまでのタイミングがあるのでしょうか。 >設定項目 >Solr サーバーへのアクション >特に問題がなければ、手動でコミットや最適化を実行する必要はありません。 【当方の環境】 Fessバージョン:fess-server-9.1.0 JAVAバージョン:jdk1.7.0_65 サーバ環境:OS:Windows Server2008 R2 Standerd 64bit 単独でFessをインストール *サービス起動しない形でtomcat6w.exe 【Log】 2014-09-30 00:00:10,114 [Web Crawling Process] WARN org.seasar.framework.container.assembler.BindingTypeShouldDef - org.seasar.robot.client.FaultTolerantClientのプロパティ(requestListener)が見つからないので設定をスキップします 2014-09-30 00:00:10,146 [Web Crawling Process] INFO jp.sf.fess.helper.WebFsIndexHelper - Target URL: http://ホストA/フォルダーパスA/index.html 2014-09-30 00:00:10,146 [Web Crawling Process] INFO jp.sf.fess.helper.WebFsIndexHelper - Target URL: http:// ホストA/フォルダーパスB/index.html 2014-09-30 00:00:10,146 [Web Crawling Process] INFO jp.sf.fess.helper.WebFsIndexHelper - Target URL: http:// ホストA/フォルダーパスC/index.html 2014-09-30 00:00:10,302 [Data Crawling Process] INFO jp.sf.fess.helper.DataIndexHelper - No crawling target urls. 2014-09-30 00:00:10,538 [Robot-20140930000000-1-2] INFO org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: http://ホスト名/フォルダーパスB/index.html 2014-09-30 00:00:10,538 [Robot-20140930000000-1-2] INFO org.seasar.robot.client.http.HcHttpClient - Checking URL: http://daysysman2/robots.txt 2014-09-30 00:00:10,803 [Robot-20140930000000-1-1] INFO org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: http://ホストA/フォルダパスC/index.html 2014-09-30 00:00:10,803 [Robot-20140930000000-1-3] INFO org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: http://ホストA/フォルダパスB/index.html 2014-09-30 00:00:41,488 [Robot-20140930000000-1-3] INFO org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: http://go.microsoft.com/fwlink/?LinkID=66439 2014-09-30 00:00:41,488 [Robot-20140930000000-1-3] INFO org.seasar.robot.client.http.HcHttpClient - Checking URL: http://go.microsoft.com/robots.txt 2014-09-30 00:00:41,535 [Robot-20140930000000-1-1] INFO org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: http://go.microsoft.com/fwlink/?LinkID=62293&IIS70Error=401,2,0x80070005,7601 2014-09-30 00:00:41,644 [Robot-20140930000000-1-2] INFO org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: http://ホストA/フォルダパスC/index2.html 2014-09-30 00:00:41,676 [Robot-20140930000000-1-2] INFO org.seasar.robot.helper.impl.LogHelperImpl - Not modified URL: http://ホストA/フォルダパスC/index2.html 2014-09-30 00:00:53,547 [Robot-20140930000000-1-3] INFO org.seasar.robot.client.http.HcHttpClient - Could not process http://go.microsoft.com/robots.txt. go.microsoft.com 2014-09-30 00:00:56,215 [Robot-20140930000000-1-3] INFO org.seasar.robot.helper.impl.LogHelperImpl - Failed to access to http://go.microsoft.com/fwlink/?LinkID=66439 2014-09-30 00:00:56,231 [Robot-20140930000000-1-1] INFO org.seasar.robot.helper.impl.LogHelperImpl - Failed to access to http://go.microsoft.com/fwlink/?LinkID=62293&IIS70Error=401,2,0x80070005,7601 2014-09-30 00:01:10,396 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 3. The processing size is 3. The execution time is 94ms. 2014-09-30 00:01:10,739 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. The processing size is 0. The execution time is 16ms. 2014-09-30 00:01:10,739 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - Sending 1 document to a server. 2014-09-30 00:01:10,832 [IndexUpdater] INFO jp.sf.fess.solr.IndexUpdater - Sent 1 documents. The execution time is 93ms.