[Mew-dist 03999] Re: charset=shift_jis
Nagae Hidetake
nagae at example.com
1998年 2月 26日 (木) 22:38:23 JST
お久しぶりです.「古いメール」を書いた永江@九工大です.
From: SAKAI Kiyotaka <ksakai at example.com>
Subject: [Mew-dist 03964] Re: charset=shift_jis
Date: Wed, 25 Feb 1998 11:50:59 +0900
> >> In article <19980224212809D.kazu at example.com>, Kazu Yamamoto (山本和彦) <Kazu at example.com> writes:
> > imls はヘッダも本文も含めて、Shift_JIS や EUC-JP を ISO-2022-JP に直す
> > べきです。この辺りは酒井さんがやってくれたんですけど、ここまで厳密に対
> > 応していましたっけ? > 酒井さん
>
> 僕が作業したのは、とりあえず iso-8859-? と euc-kr, cn-gb だけです。
> sjis や euc-jp は考えていませんでした。
ありがたいことです.早速試用させていただいたのですが,ちょっと問題が
残っていました.Perl には詳しくない上に,ラクダさんが近くにいないので,
とりあえずレポートのみでお許しください.
decode は encoded word 単位ではなく,subject なら subject を一括して
処理していませんか.複数の coding system が混在していると,最後に出て
くる coding system で全体が書かれているものと判断するようです.例えば
Subject: =?euc-kr?B?x9Gx2w==?=
=?iso-2022-jp?B?IBskQiRSJGkkLCRKGyhC?=
とあると,EUC-KR の部分も含めて,全体を ISO-2022-JP として処理している
ようです.
# 最初じゃなくて最後なんですねぇ?
> euc-jp は euc-kr, cn-gb と共通のコードを使えるので容易ですが、sjis は
> jis への変換ルーチンを書かなければいけないので、少し面倒ですね。
1line じゃ難しいかもしれません.公式自体は,その手の本に載っていると
思います.
----
九州工業大学大学院 情報工学研究科 情報科学専攻 博士前期 2 年
知能分野 情報処理機構講座 有田研究室
永江 英武 mailto:nagae at example.com
Nagae Hidetake http://www.tk.airnet.ne.jp/nagae/
Mew-dist メーリングリストの案内