[Mew-dist 03999] Re: charset=shift_jis

Nagae Hidetake nagae at example.com
1998年 2月 26日 (木) 22:38:23 JST


  お久しぶりです.「古いメール」を書いた永江@九工大です.

From: SAKAI Kiyotaka <ksakai at example.com>
Subject: [Mew-dist 03964] Re: charset=shift_jis
Date: Wed, 25 Feb 1998 11:50:59 +0900

> >> In article <19980224212809D.kazu at example.com>, Kazu Yamamoto (山本和彦) <Kazu at example.com> writes:

> > imls はヘッダも本文も含めて、Shift_JIS や EUC-JP を ISO-2022-JP に直す
> > べきです。この辺りは酒井さんがやってくれたんですけど、ここまで厳密に対
> > 応していましたっけ? > 酒井さん
> 
> 僕が作業したのは、とりあえず iso-8859-? と euc-kr, cn-gb だけです。
> sjis や euc-jp は考えていませんでした。

  ありがたいことです.早速試用させていただいたのですが,ちょっと問題が
残っていました.Perl には詳しくない上に,ラクダさんが近くにいないので,
とりあえずレポートのみでお許しください.

  decode は encoded word 単位ではなく,subject なら subject を一括して
処理していませんか.複数の coding system が混在していると,最後に出て
くる coding system で全体が書かれているものと判断するようです.例えば

	Subject: =?euc-kr?B?x9Gx2w==?=
	 =?iso-2022-jp?B?IBskQiRSJGkkLCRKGyhC?=

とあると,EUC-KR の部分も含めて,全体を ISO-2022-JP として処理している
ようです.

# 最初じゃなくて最後なんですねぇ?

> euc-jp は euc-kr, cn-gb と共通のコードを使えるので容易ですが、sjis は
> jis への変換ルーチンを書かなければいけないので、少し面倒ですね。

  1line じゃ難しいかもしれません.公式自体は,その手の本に載っていると
思います.
----
九州工業大学大学院 情報工学研究科 情報科学専攻 博士前期 2 年
  知能分野 情報処理機構講座 有田研究室
   永江   英武     mailto:nagae at example.com
  Nagae Hidetake   http://www.tk.airnet.ne.jp/nagae/



Mew-dist メーリングリストの案内