プログラマ ずんべ の日記

zunbe

プログラマ ずんべ の日記
プログラマ ずんべ の日記

探し物は見つかりましたか? サイト内検索を試してください。

サイト内検索 サイト内検索 Googleローカルが更新されたのだが…(その2) Googleローカルが更新されたのだが…(その2)

2006/04/20

【技術開発】古い検索情報対策

Googleの検索結果には、かなり古いページが削除されずに残っている。
こんなページ。

 プログラマ ずんべ の日記:古い検索結果
 古い検索結果

各ページのURLを見ると、ファイル名が「~.html」になっている。
当初、このブログのHTMLファイルは、すべて「~.html」であったが、後にSSIを使用する様に切り替えた際、ファイル名をすべて「~.shtml」に変更した。
その名残が今でも残っているのであるが、もちろん、検索結果のリンクをクリックしても 404 Not Found になってしまう。
せっかく検索結果として表示されているのに、このブログの実際のページに誘導できないのは悔しいので、サーバの設定を少し変更して、「~.html」を「~.shtml」にリダイレクトする様にした。
設定と言っても、以下の1行をバーチャルサーバの設定に書き加えただけ。

 RedirectMatch ^(/archives/.*)\.html$ $1.shtml

これで、検索結果のリンクを現在の新しいページに誘導できる。

しかし、Googleは、古いページの再探索や、逆に存在しないページの削除に、特別なルールがあるのだろうか。
もし、自動的にサイト内を再探索をして、最新情報を収集してくれないと、リニューアル時にページ構成をごっそり変えたりしたときなどに、いつまでも古いページがヒットしてしまい、よろしくないのだが…まだまだGoogleなどの検索エンジンの動作には謎が多い。
何か対策を考えないといけないな。

■参考文献

Google hacks
Google hacks
GOOGLEポケットガイド
GOOGLEポケットガイド
Apacheハンドブック
Apacheハンドブック
Apacheセキュリティ
Apacheセキュリティ



このエピソードはいかがでしたか?

投稿者 zunbe : 2006/04/20 17:16:32


トラックバック 〔http://blog.zunbe.com/mt/mt-tb.cgi/346〕

コメント

コメントしてください






保存しますか?


スパム対策:
この入力フィールドに「444」と入力してください。


プログラマ ずんべ の日記:ずばヒット アマゾン