[Tep-j-general] Re: Yahoo 検索について (ページのインデックス化)

Back to archive index

TAMURA Toshihiko tamur****@bitsc*****
2004年 7月 14日 (水) 16:35:49 JST


こんにちは、田村です。

# 永島さん、お久しぶりです。
# ご無沙汰しています。


YSTでインデックス化されているURLのリストを作成して、
インデックス化の傾向を確認してみました。
同一のサイトで、次のような比較しやすいリンク構造がありました。

(1) osCommerce標準のカテゴリーのページ遷移
    トップページ
      ↓
    default.php?cPath=100&osCsid=XXX     ...第1階層(1-1)
      ↓
    default.php?cPath=200&osCsid=XXX     ...第2階層(1-2)

(2) 商品一覧ページ(カスタマイズ)のページ遷移
    トップページ
      ↓
    c1.php                               ...第1階層(2-1)
      ↓
    c2.php                               ...第2階層(2-2)

(1)と(2)は、URLパラメータの有無だけが異なっていて、
ページ内のリンク数などは似通っています。
1-1, 1-2, 2-1, 2-2 がインデックス化されている割合を比較すると、
次のようになりました。

  1-1 : 100% (14/14)
  1-2 :   4% (9/250)
  2-1 : 100% (1/1)
  2-2 : 100% (14/14)

これを見ると、パラメータ付きURLへの第1リンクはインデックス化するけれども、
それに続く第2リンクをインデックス化する率が低いようです。
この結論として、やはり次の2つは利用すべきですね。

  o サーチエンジン対策のURLを使用
  o Spiderkiller

ただし、これらを利用してもインデックス化されるページとされないページが
できるようですので、次はこれらの傾向が知りたいですね。

============================================================
ちなみに、次のような手順でYSTに記録されているURLのリストを
抽出できますので、試してみてください。

1) 次のURLのドメイン部分を変更してクリックして、
   YSTのインデックスページを表示し、HTMLを保存します。
   ページ数が多くなるときは、下のURLの"b="を301,401...と書き換えます。
http://search.yahoo.co.jp/bin/query?p=www.example.com&n=100
http://search.yahoo.co.jp/bin/query?p=www.example.com&n=100&hc=0&hs=1&&b=101&h=p
http://search.yahoo.co.jp/bin/query?p=www.example.com&n=100&hc=0&hs=1&&b=201&h=p

  HTMLを y1.html y2.html y3.html ... のようなファイル名で保存したとします。

2) 下のようなperlのスクリプトgetystlinks.plを用意して、
   次のコマンドでYSTに記録されているURLを抽出します(Linuxで実行した例)。

   $ cat y?.html | ./getystlinks.pl | sort > list.txt

------------------------------------------------------------
#!/usr/bin/perl
# getystlinks.pl : YST の検索結果からリンクを抽出する。
while (<>) {
  if (/[0-9]\/\*-(http:\/\/[^\"]*)/) {
      print $1,"\n";
  }
}
------------------------------------------------------------


SEOについては、基礎知識がないと話についていけないということを
言われることがあります。
私は「検索にガンガンヒットするホームページの作り方」(翔泳社)などを
参考にしています。

-- 
田村敏彦 / 株式会社ビットスコープ
E-mail:tamur****@bitsc*****
http://www.bitscope.co.jp/





Tep-j-general メーリングリストの案内
Back to archive index