[mew-dist 23664] Re: about SPAM filtering

Kazu Yamamoto ( 山本和彦 ) kazu at example.com
2003年 5月 22日 (木) 12:02:52 JST


From: NINOMIYA Hideyuki <nin at example.com>
Subject: [mew-dist 23663] about SPAM filtering

> http://www.geocities.co.jp/SiliconValley-PaloAlto/7043/#spamfilter.el
> というのを某所で教えてもらいました。

とりあえず、今考えていることを書いておきます。

POP でも IMAP でも、サーバ側に filter を仕掛けられる人:(*1)
	bogofilter で十分
	Mew は対応している

POP でも IMAP でも、サーバ側に filter を仕掛けられない人:
	inc/scan 時に判断する場合: (*2)
		コマンドを呼び出すのは、刺さるので現実的ではない
		Emacs Lisp で書くべき
		Mew はまだ対応していない
	Summary モードから対話的に処理する場合: (*3)
		bogofilter で十分
		Mew はまだ対応していない

なので、問題は (*2) です。(URL に書いてある使い方は (*3))

Mew は最近、inc/scan 時に本文を処理するので、本文の先頭数行を Bayesian
filter 風に処理するといいかなぁと思っています。

でも、昨日いくつかスパムを眺めていて
	本文の base64 をほどくのは嫌だなぁ
	HTML の tag 以外を取り出す作業も面倒だなぁ
と感じ、少し憂鬱になっています。

#ハングルのこととか考えると bigram はよい考えかもなぁ。

P.S.

ところで、Bayesian 統計の厳密な定義ってだれか知っていますか? (聞けば、
「あ、それのことなの」と思う程度らしいという噂もあります。)

--かず



Mew-dist メーリングリストの案内