プログラマ ずんべ の日記

zunbe

プログラマ ずんべ の日記
プログラマ ずんべ の日記

探し物は見つかりましたか? サイト内検索を試してください。

「スズカ4時間エンデューロ」にエントリー 「スズカ4時間エンデューロ」にエントリー 市民サイクルパラダイス in 日間賀島 市民サイクルパラダイス in 日間賀島

2008/05/21

【技術開発】簡易スパム対策プログラム

最近、スパム・メールの受信数が急激に増加している。
仕事柄、メールアドレスをたくさん持っているせいもあって、スパム・メールが山ほど来る。
多い日だと10000通以上、少ない日でも8000通は来る。
うっとうしくて仕方がない。
メーラの削除済みフォルダも、あっという間にいっぱいになってしまう。

プロバイダやレンタル・サーバのスパム・フィルタなどを契約すれば、かなり楽になるとは思うのだが、いかんせん、メールアドレスの数が多いので、すべてのメールアドレスにスパム・フィルタをセットするのはコスト的もけっこうな負担になるので避けたい。
とは言え、毎日10000通近いスパム・メールを削除するのは苦痛で仕方がないので、簡易スパム対策プログラムを作ってみた。
こんな感じのプログラム。

 ・定期的にメールサーバにアクセスし、特定の条件に合致するメールを排除する。
 ・特定の条件は、現在のところ、以下の通り。
   サブジェクトがASCIIのみで、かつ、本文もASCIIのみ。
   要するに、英文だけのメールはスパムとして捨ててしまう事にする。
 ・サブジェクトがMIMEエンコードされている場合は、デコードして検査する。
 ・本文がMIMEエンコードされている場合は、(今回は手を抜いて(^^;)検査しない。
 ・排除するメールは、特定のディレクトリ配下にファイルとして書き出しておく。
 ・更に、書き出したファイルは、一定期間が経過したら tar + gzip で固める。
 ・更に、tar + gzip で固めたファイルは、一定期間が経過したら削除する。

サーバサイドで処理を行うわけではないので、メーラで送受信を行うタイミングによっては、スパムと判定されるべきファイルも受信してしまうが、今回はヨシとする。
ASCII以外を含むメールは排除されないが、とりあえず、ASCIIだけのメールを排除するだけで、目に入るスパム・メールは半減するので、これでヨシとする。

まずは朝一番にメールを受信した時に、「どばぁ~」っとスパム・メールが着信すると精神衛生的にもよくないので、これで少しはよくなるだろう。
日本語を判定して排除するのは簡単ではないと思うが、なにか排除ルールを考えて実装したいな。



このエピソードはいかがでしたか?

投稿者 zunbe : 2008/05/21 19:04:01


トラックバック 〔http://blog.zunbe.com/mt/mt-tb.cgi/838〕

コメント

スパムはほんと鬱陶しいだけですよねぇ。。。

ずんべさんほどの数ではないですが、私のところもやはり相当数やってきます。会社のMailサーバーで設定されているフィルタと、プロバイダのフィルタでかなりはじかれてますが、それでも数百通は抜けてきます。

たまに必要なMailまでフィルタにひっかかって弾かれてしまうので、サブジェクトの目視チェックとフィルタ設定の更新は時々はしてやらないといけない。。。

スパムがあると、しなくていい作業が増えるのがイヤ過ぎ(==;

投稿者 NOBU! : 2008/05/23 01:50:42

●NOBU!さん

プロバイダのフォルタを抜けてくるのが数百通だと、実際には、やはり数千通は来ているでしょうね。
いやですねぇ、ホント。

> スパムがあると、しなくていい作業が増えるのがイヤ過ぎ(==;

そうそう、まったく無駄な作業ですからね。
トータルすると、かなりの時間をこの無駄な作業に費やしているので、ホント、なんとかならないかと思います。

投稿者 ずんべ : 2008/05/23 02:51:33

勉強してないので適当な事言ってそうなんだけど、
スパムとして処理したメールについて、
Daemon使ってそんなメルアドありません。とか、受け取り拒否っぽいものを送り主にReternすれば、送り主もうっとおしいメールを受け取る事になるので、スパムメールのメーリングリストから外してくれたり…しないかなぁ?

投稿者 ひこ : 2008/05/23 23:28:57

●ひこさん

どうなんでしょうね。
スパマーによるとは思いますが、多くはFROMを偽造して発信して来ているように思いますので、エラーメールを返しても、おそらくスパマーの元には届かないような気がします。
でも、わかんない。
実際のところ、どうなんでしょうね。

投稿者 ずんべ : 2008/05/25 00:10:12

お元気?>ひこさん

>多くはFROMを偽造
その通りで、身に覚えのある広告Mailに関しては別として、SPAMに関してはFromやReplyToからは本当の発信元は判別できないのがほぼ全てと考えてよいでしょう。そのほとんどが本文中で怪しいURLに誘導する様になってます。なのでFromやReturnToアドレスにReturnしてしまうと、そのReturnそのものもSPAM化してしまうのでReturnしないほうがよいです。

betterな対策(bestではない)は「無視」しかないのが現状かと思います。

先ごろ、SPAM発信者が逮捕されたりしていますから、厳罰化されていくと若干は減るのかな・・・。減って欲しいな・・・。

投稿者 NOBU! : 2008/05/25 02:18:22

●NOBU!さん

> 厳罰化されていくと若干は減るのかな・・・。減って欲しいな・・・。

ホント、減ってほしいですね。
以前に施行された「未承諾広告※」みたいな、何の役にも立たない法律制定ではなく、抜本的な法律制定をしてほしいですよね。

投稿者 ずんべ : 2008/05/26 00:35:12


コメントしてください






保存しますか?


スパム対策:
この入力フィールドに「936」と入力してください。


プログラマ ずんべ の日記:ずばヒット アマゾン