プログラマ ずんべ の日記

zunbe

プログラマ ずんべ の日記
プログラマ ずんべ の日記

探し物は見つかりましたか? サイト内検索を試してください。

Yahoo! Slurp がやってくる Yahoo! Slurp がやってくる ping サーバ ping サーバ

2005/09/21

【ソフトウェア】高機能アクセス解析CGI

高機能アクセス解析CGI Standard版 Ver 3.8.1 をインストールしてみた。

 CGI/Perl専門サイト - futomi's CGI Cafe

以前から知人に紹介してもらっていたCGIで、なかなかインストールして試せずにいたのだが、このブログのアクセス解析をしようとインストールしてみた。

インストール自体は、パッケージ展開→パーミッション設定→若干の動作設定 のみなので、簡単に動作させる事ができた。
各ページへのコードの埋め込みも、MOVABLETYPE のテンプレートを変更後、再構築をかけるだけで全ページに反映されるので、それほど面倒な事はない。

ただ、インストール時に気になる点がいくつか。

■デフォルトのパーミッション
元のプログラムは Windows で作成されているのだろうか、パッケージを展開すると、CGIも画像ファイルもディレクトリも、パーミッションがすべて 777 。
いくらなんでも、CGIファイルとかが 777 では怖いので、インストール手順にある通りのパーミッションを設定した後、CGIや画像ファイルのパーミッションを安全なように設定し直した。

■CGIの漢字コードがSJIS
これも、元が Windows で作成されているためだと思うが、CGI自体の漢字コードが SJIS だった。
一般的に、UNIX上の perl は EUC でないと正常に動作しない。
正規表現などが正常に機能しないのである。
CGI自体の漢字コードが SJIS であることを前提にプログラムが作成されているので、EUC に変換して動かそうとすると、出力が文字化けしてしまう。
ちょっといただけない。

■解析結果が文字化け
ソースコードを覗くと、漢字コードのコンバータに jcode.pl を使用していた。
このブログは、基本設定を utf-8(UNICODE)に設定して稼動させているが、残念なことに jcode.pl は utf-8 をサポートしていない。
これでは文字化けしてしまうので、Jcode.pm をインストールし、utf-8 を変換できるように調整した。
最近、ブログの世界では utf-8 を使う事が増えてきているので、対応してほしいところ。

■変換せずにタイトル抽出
ソースコードを覗いてみると、ページ別集計を作成するとき、ページのタイトルを表示するために、サーバ上のファイルを実際に開いて、HTMLの<TITLE>タグを拾っているようだ。
しかし、ファイルを読み込んだ後、漢字コードの変換を行わないまま、正規表現で<TITLE>の切り出しを行っている。
基本的には、英字のみで正規表現をかけているので、そう問題にはならないと思うが、やはり、読み込んだファイルの漢字コードは適切に変換してから以降の処理を行うべきではないだろうか。

管理画面にアクセスして解析結果を見てみる。
まだデータが少ないせいかもしれないが、さくさく動く。
データが大きくなったとき、どのくらいの速度になるか心配だが、以前、知人に見せてもらった時には、目に見えて遅いという事はないようなので、きっと大丈夫だろう。

しばらくアクセス動向を見てみよう。



このエピソードはいかがでしたか?

投稿者 zunbe : 2005/09/21 03:48:22


コメント

コメントしてください






保存しますか?


スパム対策:
この入力フィールドに「97」と入力してください。


プログラマ ずんべ の日記:ずばヒット アマゾン