[mew-dist 23664] Re: about SPAM filtering
Kazu Yamamoto ( 山本和彦 )
kazu at example.com
2003年 5月 22日 (木) 12:02:52 JST
From: NINOMIYA Hideyuki <nin at example.com>
Subject: [mew-dist 23663] about SPAM filtering
> http://www.geocities.co.jp/SiliconValley-PaloAlto/7043/#spamfilter.el
> というのを某所で教えてもらいました。
とりあえず、今考えていることを書いておきます。
POP でも IMAP でも、サーバ側に filter を仕掛けられる人:(*1)
bogofilter で十分
Mew は対応している
POP でも IMAP でも、サーバ側に filter を仕掛けられない人:
inc/scan 時に判断する場合: (*2)
コマンドを呼び出すのは、刺さるので現実的ではない
Emacs Lisp で書くべき
Mew はまだ対応していない
Summary モードから対話的に処理する場合: (*3)
bogofilter で十分
Mew はまだ対応していない
なので、問題は (*2) です。(URL に書いてある使い方は (*3))
Mew は最近、inc/scan 時に本文を処理するので、本文の先頭数行を Bayesian
filter 風に処理するといいかなぁと思っています。
でも、昨日いくつかスパムを眺めていて
本文の base64 をほどくのは嫌だなぁ
HTML の tag 以外を取り出す作業も面倒だなぁ
と感じ、少し憂鬱になっています。
#ハングルのこととか考えると bigram はよい考えかもなぁ。
P.S.
ところで、Bayesian 統計の厳密な定義ってだれか知っていますか? (聞けば、
「あ、それのことなの」と思う程度らしいという噂もあります。)
--かず
Mew-dist メーリングリストの案内