プログラマ ずんべ の日記

zunbe

プログラマ ずんべ の日記
プログラマ ずんべ の日記

探し物は見つかりましたか? サイト内検索を試してください。

hi-hoからのメール hi-hoからのメール (その14) 書式と表示 (その14) 書式と表示

2005/09/22

【サービス】Technoratibot がやってくる

Technoratibot って何でしょう?
何者なのか、ずんべも知らなかったのだが、どうもブログ専門の検索エンジンらしい。

 Technorati

このロボットは、検索キーワードの取得方法が、ブログならではの方式になっている。
Google や Yahoo などの一般的な検索エンジンでは、HTML上のリンクをたどりながら、ページをクロールしていく。
ところが、Technoratibot ではHTMLのリンクをたどる事はしないようだ。
アクセスログを見ると、atom.xmlindex.rdfindex.xml などのRSS情報を拾っていっている。
一応、/ も拾っているようだが、HTMLのリンクをたどった形跡はない。

これなら、ブログの記事だけを拾い集め、ページにくっついているバナーなどの余計な情報はカットできる。なるほど。
一応、/ も拾っているのは、ページの名称とか、<META>を拾うためだろう。
これはぜひ、Google や Yahoo でも採用してほしい実装だ。

ただ、RSS情報だけを拾っているという事は、古い記事は検索情報として登録されない点は不満が残るところか。

まだ登録されているサイトが少ないせいだろうか、データベースへの登録も早い。
アクセスログでは、2005/09/22 にクロールされた事が記録されているが、今(2005/09/22)にサイトにアクセスして検索すると、もうヒットする。



このエピソードはいかがでしたか?

投稿者 zunbe : 2005/09/22 08:56:39


コメント

コメントしてください






保存しますか?


スパム対策:
この入力フィールドに「103」と入力してください。


プログラマ ずんべ の日記:ずばヒット アマゾン