![]() |
zunbe |
![]() |
|
![]() |
2005年8月 | 2005年10月 | ![]() |
| [<<先頭] [<前へ] [ 1 2 3 4 5 6 7 8 9 10 11 ] [次へ>] [最後>>] | ||
2005/09/21
|
記事を公開するときに、ping サーバにも発信するように設定を変えてみた。
とりあえず設定したのは、こちらのサーバ。
goo BLOG
cocolog-nifty
PING.BLOGGERS.JP
Myblog JAPAN
weblogs.com
ping を送ってみた。
今のところ、掲載が確認できたのは weblogs.com だけ。
あとのサイトは…ちっとも見えん。
登録に失敗しているのか、埋もれてしまっているのか…。
正直言って、ping を送信してもアクセス向上の効果は期待できない。
あまりにも更新数が多くて、どんどん流れていってしまい、まったく新着情報として機能していない。
だらだらと流しているだけって感じ。
カテゴリ別に分類するとか工夫されていないと、見る気になれないな。
このエピソードはいかがでしたか? ![]() ![]() | ![]() |
投稿者 zunbe : 2005/09/21 11:45:56 | コメント (0)
|
高機能アクセス解析CGI Standard版 Ver 3.8.1 をインストールしてみた。
CGI/Perl専門サイト - futomi's CGI Cafe
以前から知人に紹介してもらっていたCGIで、なかなかインストールして試せずにいたのだが、このブログのアクセス解析をしようとインストールしてみた。
インストール自体は、パッケージ展開→パーミッション設定→若干の動作設定 のみなので、簡単に動作させる事ができた。
各ページへのコードの埋め込みも、MOVABLETYPE のテンプレートを変更後、再構築をかけるだけで全ページに反映されるので、それほど面倒な事はない。
ただ、インストール時に気になる点がいくつか。
■デフォルトのパーミッション
元のプログラムは Windows で作成されているのだろうか、パッケージを展開すると、CGIも画像ファイルもディレクトリも、パーミッションがすべて 777 。
いくらなんでも、CGIファイルとかが 777 では怖いので、インストール手順にある通りのパーミッションを設定した後、CGIや画像ファイルのパーミッションを安全なように設定し直した。
■CGIの漢字コードがSJIS
これも、元が Windows で作成されているためだと思うが、CGI自体の漢字コードが SJIS だった。
一般的に、UNIX上の perl は EUC でないと正常に動作しない。
正規表現などが正常に機能しないのである。
CGI自体の漢字コードが SJIS であることを前提にプログラムが作成されているので、EUC に変換して動かそうとすると、出力が文字化けしてしまう。
ちょっといただけない。
■解析結果が文字化け
ソースコードを覗くと、漢字コードのコンバータに jcode.pl を使用していた。
このブログは、基本設定を utf-8(UNICODE)に設定して稼動させているが、残念なことに jcode.pl は utf-8 をサポートしていない。
これでは文字化けしてしまうので、Jcode.pm をインストールし、utf-8 を変換できるように調整した。
最近、ブログの世界では utf-8 を使う事が増えてきているので、対応してほしいところ。
■変換せずにタイトル抽出
ソースコードを覗いてみると、ページ別集計を作成するとき、ページのタイトルを表示するために、サーバ上のファイルを実際に開いて、HTMLの<TITLE>タグを拾っているようだ。
しかし、ファイルを読み込んだ後、漢字コードの変換を行わないまま、正規表現で<TITLE>の切り出しを行っている。
基本的には、英字のみで正規表現をかけているので、そう問題にはならないと思うが、やはり、読み込んだファイルの漢字コードは適切に変換してから以降の処理を行うべきではないだろうか。
管理画面にアクセスして解析結果を見てみる。
まだデータが少ないせいかもしれないが、さくさく動く。
データが大きくなったとき、どのくらいの速度になるか心配だが、以前、知人に見せてもらった時には、目に見えて遅いという事はないようなので、きっと大丈夫だろう。
しばらくアクセス動向を見てみよう。
このエピソードはいかがでしたか? ![]() ![]() | ![]() |
投稿者 zunbe : 2005/09/21 03:48:22 | コメント (0)
|
アクセスログをよく見ると、Googlebot よりも Yahoo! Slurp の方が、アクセス頻度が高いようだ。
2005/09/09以降、毎日3回~5回のアクセスがある。
近々だと、こんな感じ。
2005/09/17 01:29:41
2005/09/17 02:37:07
2005/09/17 08:26:00
2005/09/17 15:21:50
2005/09/18 01:33:35
2005/09/18 04:16:35
2005/09/18 17:08:06
2005/09/18 18:00:30
2005/09/19 06:02:57
2005/09/19 19:26:17
2005/09/20 03:49:24
2005/09/20 20:29:17
Googlebot と同じく、毎日来るクローラは、/ しか拾っていかない。
が、頻繁にアクセスは来るものの、肝心の検索データベースへの登録は鈍いようだ。
今(2005/09/21時点)、Yahoo! でこのサイトを検索して、トップページの更新日付を見ると、2005/09/08 となっている。
キャッシュを覗いてみると、確かにこの日付のページがキャッシュされている。
毎日クロールに来るのに、なぜか反映されていない。
ところが、もう少しキーワードを加えて検索してみると、少し事情が違う様だ。
「プログラマずんべの日記 我が子」で検索すると…
→ 2005/09/15 に書いた「我が子 初公開」がヒットする。
「プログラマずんべの日記 税務調査」で検索すると…
→ 2005/09/03 に書いた「務調査 2日目」にヒットする。
最新情報が反映されていれば、後者の検索では 2005/09/16 に書いた「税務調査 その後」にヒットするはずであるが、ヒットしない。
つまり、検索データベースには、2005/09/15 にクロールした情報までが反映されているという事になる。
どうも、クロールしてから検索データベースに反映するまで、かなり時間がかかっているようだ。
これでは、毎日クロールに来ても、ぜんぜん意味がないのではないだろうか。
いったい何のために毎日クロールしているのだろう?
Yahoo! Slurp と挙動と検索データベースへの登録ルールが、イマイチよくわからない。
このエピソードはいかがでしたか? ![]() ![]() | ![]() |
投稿者 zunbe : 2005/09/21 00:18:23 | コメント (0)
2005/09/20
|
ここ数日、えらくマメに Googlebot がやってくる。
2005/09/11以降、こんな感じに、結構な頻度だ。
2005/08/12
2005/09/11
2005/09/13
2005/09/14
2005/09/20
今(2005/09/20時点)、Google でこのサイトを検索して、トップページのキャッシュを覗いてみると、2005/09/14 の記事がキャッシュに入っていたので、冷やかし(?)ではなく、ちゃんとデータを持っていっているようだ。
ただ、ちょっと気になる事がある。
2005/08/12以前のアクセスでは /archives の配下も探索してデータを拾ってくれていた。
しかし、2005/09/11以降のアクセスでは、/ しか拾っていっていない。
これはどうした事なんだろう。
以下、推測…。
Googlebot には、2種類あると聞いている(真実は知らない)。
ひとつは、通常のサイトを探索するタイプで、1ヶ月に1回くらいの頻度でクロールが来る。
もうひとつは、ニュースサイトなどを探索するタイプで、結構な頻度でクロールが来る。
アクセス状況を見る限り、Google はこのブログをニュースサイトとして判断し、後者の Googlebot で探索するようにセットされたように見える。
だとすると嬉しい事のような気はするが、/archives 配下を拾ってくれないのはちょっと痛い。
ニュースサイトと判断された場合、トップページの記事しか探索対象にならないのだろうか。
トップページは高頻度、枝葉ページは1ヶ月に一回、の両方がクロールに来てくれるのだと期待しよう。
■参考資料
![]() Google hacks |
このエピソードはいかがでしたか? ![]() ![]() | ![]() |
投稿者 zunbe : 2005/09/20 07:54:39 | コメント (0)
2005/09/19
|
「積木くずし 親と子の二百日戦争」を読んだ。
実はこの本、有名な本であるのにこれまで読んだ事がなかった。
テレビドラマにも、映画にもなったと思うが、これまで見た事もなかった。
先日、テレビで「積木くずし真相 ~あの家族、その後の悲劇~」が放送されていて、ふと読みたくなり、会社の近所にある古本屋で買ってきて読んでみた。
仕事の休憩にと読み始めたら止まらなくなり、二時間も仕事をサボってしまった。
最後には涙が出てきた。
「由香里の死そして愛 積木くずし終章」も買って読んでみるかな。
そして、我が子は非行に走らず、素直に育って欲しいと願う。
![]() 積木くずし 親と子の二百日戦争 | ![]() 由香里の死そして愛 積木くずし終章 |
このエピソードはいかがでしたか? ![]() ![]() | ![]() |
投稿者 zunbe : 2005/09/19 11:49:16 | コメント (0)
| [<<先頭] [<前へ] [ 1 2 3 4 5 6 7 8 9 10 11 ] [次へ>] [最後>>] | ||