[fess-user 902] インデックスの作成ができない

Back to archive index

Kimura,Ryo ryo.k****@jp*****
2014年 10月 1日 (水) 12:22:44 JST


Kimuraです。

ここ2か月位の間、社内ポータル用のサイト内検索としてFessを設定していますが、
以前設定していた通りのURLのインデックスができません。
ウェブクロールの設定→URL欄に各htmlページパスを記載しているのですが、4つの内、1つ
のページしかインデックスされません。
ActiveDirectoryでネットワークを構成しているため、其々のアクセス権、文字エンコード等も統一していても
常に決まったページしかインデックスされません。

また下記の通り、ヘルプにはクロール後インデックスデータを手動でコミットする必要がないと書かれていますが、
新しいインデックスができるとコミットしないと検索ができない状態になります。
コミットまでのタイミングがあるのでしょうか。

>設定項目
>Solr サーバーへのアクション
>特に問題がなければ、手動でコミットや最適化を実行する必要はありません。


【当方の環境】
Fessバージョン:fess-server-9.1.0
JAVAバージョン:jdk1.7.0_65
サーバ環境:OS:Windows Server2008 R2 Standerd 64bit
単独でFessをインストール
*サービス起動しない形でtomcat6w.exe

【Log】
2014-09-30 00:00:10,114 [Web Crawling Process] WARN  org.seasar.framework.container.assembler.BindingTypeShouldDef - org.seasar.robot.client.FaultTolerantClientのプロパティ(requestListener)が見つからないので設定をスキップします
2014-09-30 00:00:10,146 [Web Crawling Process] INFO  jp.sf.fess.helper.WebFsIndexHelper - Target URL: http://ホストA/フォルダーパスA/index.html
2014-09-30 00:00:10,146 [Web Crawling Process] INFO  jp.sf.fess.helper.WebFsIndexHelper - Target URL: http:// ホストA/フォルダーパスB/index.html
2014-09-30 00:00:10,146 [Web Crawling Process] INFO  jp.sf.fess.helper.WebFsIndexHelper - Target URL: http:// ホストA/フォルダーパスC/index.html
2014-09-30 00:00:10,302 [Data Crawling Process] INFO  jp.sf.fess.helper.DataIndexHelper - No crawling target urls.
2014-09-30 00:00:10,538 [Robot-20140930000000-1-2] INFO  org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: http://ホスト名/フォルダーパスB/index.html
2014-09-30 00:00:10,538 [Robot-20140930000000-1-2] INFO  org.seasar.robot.client.http.HcHttpClient - Checking URL: http://daysysman2/robots.txt
2014-09-30 00:00:10,803 [Robot-20140930000000-1-1] INFO  org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: 
http://ホストA/フォルダパスC/index.html
2014-09-30 00:00:10,803 [Robot-20140930000000-1-3] INFO  org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL:
 http://ホストA/フォルダパスB/index.html
2014-09-30 00:00:41,488 [Robot-20140930000000-1-3] INFO  org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: http://go.microsoft.com/fwlink/?LinkID=66439
2014-09-30 00:00:41,488 [Robot-20140930000000-1-3] INFO  org.seasar.robot.client.http.HcHttpClient - Checking URL: http://go.microsoft.com/robots.txt
2014-09-30 00:00:41,535 [Robot-20140930000000-1-1] INFO  org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: http://go.microsoft.com/fwlink/?LinkID=62293&IIS70Error=401,2,0x80070005,7601
2014-09-30 00:00:41,644 [Robot-20140930000000-1-2] INFO  org.seasar.robot.helper.impl.LogHelperImpl - Crawling URL: 
http://ホストA/フォルダパスC/index2.html
2014-09-30 00:00:41,676 [Robot-20140930000000-1-2] INFO  org.seasar.robot.helper.impl.LogHelperImpl - Not modified URL:
 http://ホストA/フォルダパスC/index2.html
2014-09-30 00:00:53,547 [Robot-20140930000000-1-3] INFO  org.seasar.robot.client.http.HcHttpClient - Could not process http://go.microsoft.com/robots.txt. go.microsoft.com
2014-09-30 00:00:56,215 [Robot-20140930000000-1-3] INFO  org.seasar.robot.helper.impl.LogHelperImpl - Failed to access to http://go.microsoft.com/fwlink/?LinkID=66439
2014-09-30 00:00:56,231 [Robot-20140930000000-1-1] INFO  org.seasar.robot.helper.impl.LogHelperImpl - Failed to access to http://go.microsoft.com/fwlink/?LinkID=62293&IIS70Error=401,2,0x80070005,7601
2014-09-30 00:01:10,396 [IndexUpdater] INFO  jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 3. The processing size is 3. The execution time is 94ms.
2014-09-30 00:01:10,739 [IndexUpdater] INFO  jp.sf.fess.solr.IndexUpdater - The number of a crawled document is 0. The processing size is 0. The execution time is 16ms.
2014-09-30 00:01:10,739 [IndexUpdater] INFO  jp.sf.fess.solr.IndexUpdater - Sending 1 document to a server.
2014-09-30 00:01:10,832 [IndexUpdater] INFO  jp.sf.fess.solr.IndexUpdater - Sent 1 documents. The execution time is 93ms.



Fess-user メーリングリストの案内
Back to archive index