2006/04/20
Googleの検索結果には、かなり古いページが削除されずに残っている。
こんなページ。
古い検索結果
各ページのURLを見ると、ファイル名が「~.html」になっている。
当初、このブログのHTMLファイルは、すべて「~.html」であったが、後にSSIを使用する様に切り替えた際、ファイル名をすべて「~.shtml」に変更した。
その名残が今でも残っているのであるが、もちろん、検索結果のリンクをクリックしても 404 Not Found になってしまう。
せっかく検索結果として表示されているのに、このブログの実際のページに誘導できないのは悔しいので、サーバの設定を少し変更して、「~.html」を「~.shtml」にリダイレクトする様にした。
設定と言っても、以下の1行をバーチャルサーバの設定に書き加えただけ。
RedirectMatch ^(/archives/.*)\.html$ $1.shtml
これで、検索結果のリンクを現在の新しいページに誘導できる。
しかし、Googleは、古いページの再探索や、逆に存在しないページの削除に、特別なルールがあるのだろうか。
もし、自動的にサイト内を再探索をして、最新情報を収集してくれないと、リニューアル時にページ構成をごっそり変えたりしたときなどに、いつまでも古いページがヒットしてしまい、よろしくないのだが…まだまだGoogleなどの検索エンジンの動作には謎が多い。
何か対策を考えないといけないな。
■参考文献
| Google hacks | | GOOGLEポケットガイド | | Apacheハンドブック | | Apacheセキュリティ | |
投稿者 zunbe : 2006/04/20 17:16:32
トラックバック
|
〔http://blog.zunbe.com/mt/mt-tb.cgi/346〕
|
|