[mew-dist 27060] 長いヘッダ(?)とmew-summary-auto-refile

Eijiro Sumii eijiro.sumii at example.com
2006年 6月 29日 (木) 18:38:12 JST


はじめまして、東北大学の住井と申します。MewやEmacsにはあまり詳しくない
のですが、よろしくお願いします。

早速の質問で恐縮なのですが…

Debian SargeのEmacs 21.4.1でMew 4.2を使用しているのですが、どうも
mew-summary-auto-refile(サマリーモードのM-o)が長いへッダを終わりまで
読んでくれないようで悩んでいます。マニュアル等を見て.emacsで

(setq mew-header-max-length 1000000)
(setq mew-header-max-depth 1000000)
(setq mew-pop-size 100000000)
(setq mew-refile-guess-control
  '(mew-refile-guess-by-alist
    mew-refile-ctrl-auto-boundary))
(setq mew-refile-guess-alist
  '(("List-Id"
     ("US-CERT" . "+CERT")
...中略...
    ("X-Spam"
     ("yes; " . "+junk"))
    (nil . "+done")))

のように設定して、describe-variableなどで値も確認し、へッダが短いメッ
セージは正しくrefileされています。しかし、へッダが長い(と思われる)メッ
セージは、X-Spamがyesでもjunkではなくdoneにrefileされます。
mew-summary-analyze-again(サマリーモードの.など)で一回解析して解析結
果がキャッシュされればjunkにrefileされるのですが、そもそもスパムは表示
しないでjunkにrefileしたいという意図です。

参考までに、末尾にanalyze-againしないとauto-refileされないへッダの一例
を添付します。(X-ECEI-*というフィールドは、自分で管理していないサーバ
のスパムフィルタが勝手につけているのですが、false positiveが多いので私
のmewでは見ないことにしています。)

mewのソースコードを読んで調べようと試みたのですが、呼び出しが深くて、
私の力では追い切れませんでした。本当に「へッダが長い」せいなのか、ある
いは何か別の原因があるのか断定できないのですが、過去のアーカイブなどを
検索してもわからなかったので、もしご存じの方がいらしたら教えていただけ
たら助かります。

漠然とした質問で恐縮ですが、宜しくお願い致します。

--
東北大学大学院情報科学研究科
住井英二郎 (http://www.kb.ecei.tohoku.ac.jp/~sumii/)
E-Mail: sumii at example.com

**********************************************************************

Return-Path: <oio.t203 at example.com>
X-Original-To: sumii at example.com
Delivered-To: sumii at example.com
Received: from eimail.ecei.tohoku.ac.jp (eimail.ecei.tohoku.ac.jp [130.34.195.2])
	by qube3.kb.ecei.tohoku.ac.jp (Postfix) with ESMTP id 5A23F8EE5
	for <sumii at example.com>; Thu, 29 Jun 2006 14:03:24 +0900 (JST)
Received: by eimail.ecei.tohoku.ac.jp (Postfix)
	id 3F682ABDE6; Thu, 29 Jun 2006 14:03:24 +0900 (JST)
Delivered-To: sumii at example.com
Received: from eimail.ecei.tohoku.ac.jp (localhost [127.0.0.1])
	by localhost.ecei.tohoku.ac.jp (Postfix) with ESMTP id 19272ABDF9
	for <SUMII at example.com>; Thu, 29 Jun 2006 14:03:24 +0900 (JST)
Received: by eimail.ecei.tohoku.ac.jp (Postfix, from userid 206)
	id F2FFCABDE6; Thu, 29 Jun 2006 14:03:23 +0900 (JST)
X-ECEI-Spam-Flag: YES
X-ECEI-Spam-Checker-Version: SpamAssassin 3.1.0 (2005-09-13) on 	eimail.ecei.tohoku.ac.jp
X-ECEI-Spam-Level: **************************************************
X-ECEI-Spam-Status: Yes, score=80.3 required=8.0 tests=BAYES_99,	CHARSET_FARAWAY_HEADER,CNCGROUP,CNCJP,CONTENT_TYPE_PRESENT,FORGED99,	FORGED_MUA_OUTLOOK,HAISHINTEISHI,HTML_70_80,HTML_IMAGE_ONLY_20,	HTML_MESSAGE,HTML_OBFUSCATE_05_10,HTML_SHORT_LINK_IMG_3,	ISO2022JP_BODY,MIMEQENC,MSGID_FROM_MTA_ID,MTAIDRBLJP,MURYOU,QENCPTR1,	QENCPTR2,RCVD_IN_BLARS,RCVD_IN_BLARS_SPAM,RCVD_IN_NJABL_DUL,	RCVD_IN_SBL,SBL99,SURBL99,URIBLSBL99,URIBL_AB_SURBL,URIBL_JP_SURBL,	URIBL_OB_SURBL,URIBL_SBL,URIBL_SC_SURBL,URIBL_WS_SURBL,URLBL_RBLJP,	X_MAILER_PRESENT autolearn=spam version=3.1.0
X-ECEI-Spam-Report: 	* -0.1 CONTENT_TYPE_PRESENT exists:Content-Type	*  0.1 X_MAILER_PRESENT exists:X-Mailer	*  3.5 CNCGROUP Japanese spammer's footstool: CNCGROUP	*  1.4 MSGID_FROM_MTA_ID Message-Id for external message added locally	*  3.2 CHARSET_FARAWAY_HEADER A foreign language charset used in headers	* -0.1 ISO2022JP_BODY BODY: ISO-2022-JP message	*  0.5 MURYOU BODY: Muryou	*  1.2 HTML_IMAGE_ONLY_20 BODY: HTML: images with 1600-2000 bytes of words	*  1.4 HTML_OBFUSCATE_05_10 BODY: Message is 5% to 10% HTML obfuscation	*  1.0 HTML_MESSAGE BODY: HTML included in message	*  1.0 HTML_70_80 BODY: Message is 70% to 80% HTML	*  7.5 BAYES_99 BODY: Bayesian spam probability is 99 to 100%	*      [score: 1.0000]	*  0.8 HAISHINTEISHI RAW: Haishin (no) Teishi	*  0.2 QENCPTR2 FULL: Quoted-Printable mime pattern	*  0.2 QENCPTR1 FULL: Quoted-Printable mime pattern	*  0.2 MIMEQENC FULL: Quoted-Printable mime definition	*  0.5 RCVD_IN_BLARS RBL: BLARS: in Blacklist / Blocklist block.blar
 s.org	*      [221.212.244.134 listed in block.blars.org]	*  1.5 RCVD_IN_SBL RBL: Received via a relay in Spamhaus SBL	*      [221.212.244.134 listed in sbl-xbl.spamhaus.org]	*  1.5 RCVD_IN_NJABL_DUL RBL: NJABL: dialup sender did non-local SMTP	*      [221.212.244.134 listed in combined.njabl.org]	*  0.5 RCVD_IN_BLARS_SPAM RBL: BLARS: Spam sending domain in Blacklist /	*      Blocklist block.blars.org	*      [221.212.244.134 listed in block.blars.org]	*  2.0 URIBL_SBL Contains an URL listed in the SBL blocklist	*      [URIs: nanpara6.net]	*  3.8 URIBL_AB_SURBL Contains an URL listed in the AB SURBL blocklist	*      [URIs: utfk.com]	*  1.0 URIBL_JP_SURBL Has URI in JP at http://www.surbl.org/lists.html	*      [URIs: nanpara6.net utfk.com]	*  1.0 URIBL_WS_SURBL Contains an URL listed in the WS SURBL blocklist	*      [URIs: nanpara6.net utfk.com]	*  3.0 URIBL_OB_SURBL Contains an URL listed in the OB SURBL blocklist	*      [URIs: nanpara6.net utfk.com]	*  5.0 URLBL_RBLJP Has URI
  in url.rbl.jp	*      [URIs: nanpara6.net utfk.com]	*  4.5 URIBL_SC_SURBL Contains an URL listed in the SC SURBL blocklist	*      [URIs: nanpara6.net utfk.com]	*  3.0 URIBLSBL99 URIBL_SBL && BAYES_99	*  0.9 HTML_SHORT_LINK_IMG_3 HTML is very short with a linked image	*  3.5 SBL99 RCVD_IN_SBL && BAYES_99	*  5.5 SURBL99 URIBL_??_SURBL && BAYES_99	*  7.0 MTAIDRBLJP MSGID_FROM_MTA_ID && URLBL_RBLJP	*  5.0 CNCJP CNCGROUP && (ISO2022JP_BODY || SJIS_BODY)	*  4.1 FORGED_MUA_OUTLOOK Forged mail pretending to be from MS Outlook	*  5.0 FORGED99 FORGED_* && BAYES_99
Received: from ocn.ne.jp (unknown [221.212.244.134])
	by eimail.ecei.tohoku.ac.jp (Postfix) with ESMTP id 13E14ABDE6
	for <SUMII at example.com>; Thu, 29 Jun 2006 14:03:17 +0900 (JST)
Received: from xpnfeo5 (unknown [165.39.16.190])
	by smtp37 (Coremail) with SMTP id mZHWNznaf2f3B8qW.1
	for <sumii at example.com>; Thu, 29 Jun 2006 13:03:17 +0800 (CST)
X-Originating-IP: [165.39.16.190]
MIME-Version: 1.0
X-Priority: 3
X-MSMail-Priority: Normal
X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2800.1807
Message-Id: <20060629050317.13E14ABDE6 at example.com>
X-Spam: yes; 1.00; 開催:01 開催:01 男性:98 fernridge:98 女性会員:98 都道府県:98 乱交:98 女性会員:98 男性:98 配信不要:98 迄:98 送信不需:98 都道府県:98 乱交:98 配信不要:98 
X-Attachments: cset="iso-2022-jp" cset="iso-2022-jp" type="image/jpeg" name="14.jpg" type="image/gif" name="b016icn.gif" type="image/gif" name="b016icn.gif" type="image/gif" name="u008icn.gif" 
X-UIDL: U$]!!j$,#!(QG"!kU0"!
Content-Type: multipart/related;
	boundary="----=_NextPart_000_000D_01C685C1.E7854110";
Subject: 男性が不足しています。
From: (一応削除)
To: <sumii at example.com>
Date: Thu, 29 Jun 2006 14:03:17 +0900 (JST)
X-Mailer: Microsoft Outlook Express 6.00.2800.1478
X-Mew: X-Spam: has raw text strings.
X-Mew: Text/Plain in Multipart/Alternative as a singlepart

**********************************************************************



Mew-dist メーリングリストの案内