[Mew-dist 2864] Re: charset=unknown
Kazu Yamamoto ( 山本和彦 )
Kazu at example.com
1997年 10月 31日 (金) 20:43:06 JST
From: Takeshi Chiba <chiba at example.com>
Subject: [Mew-dist 2863] charset=unknown
Date: Fri, 31 Oct 1997 20:16:58 +0900 (JST)
> Conten-Type の話題が出ていますが、先程 Mew-1.92.1 を使ってい
> て、以下のようなヘッダを持つメールを出してしまいました。
いい加減なコードでごめんなさい。
まず、神戸さんとの議論でも言ったように、charset=unknown というメールを送
信すべきではありません。現在の Mew では charset が分からない場合、とりあ
えず unknown という文字列を返しています。ここでユーザに、「こんなメール
は送れないよ」と警告を出すべきですが、まだ実装していません。すみません。
> 確か昔は、ISO-2022-JP-2 などとなっていたような気がしましたが
> 最近のバージョンで変わったのでしょうか?
まず、半角カタカナを運ぶ charset はどこにも定義されていません。それで、
半角カタカナがある場合は、例えば全角カタカナに直すような処置が必要です。
現在 ISO-2022-JP を定めている RFC 1468 の改定版を書いているところです。
(もう 2 ヵ月も作業しているので、そろそろ出したいです。) それには、以下の
ように書いてあります。
Please note that best strategy for interoperability is TO BE LIBERAL
IN WHAT YOU RECEIVE AND CONSERVATIVE IN WHAT YOU SEND.
JIS X 0201 Kana set MUST NOT be used in ISO-2022-JP text. It may
erroneously appear in ISO-2022-JP text with the following sequences:
<8-bit Kana set char>
SO <7-bit Kana set char> SI
SO <8-bit Kana set char> SI
ESC ( I <7-bit Kana set char> ESC ( B
ESC ) I <8-bit Kana set char>
JIS X 0212 1990 MUST NOT be embedded in ISO-2022-JP text. It may
erroneously appear following "ESC $ ( D" in ISO-2022-JP text. To
embed JIS X 0212 1990, other charsets such as
ISO-2022-JP-2[ISO-2022-JP-2] SHOULD be used.
IMPLEMENTATION NOTE: Even if a message composer does not provide any
input method for character sets which is not used in ISO-2022-JP,
such as JIS X 0201 Kana set and JIS X 0212 1990, there are
possibilities to include them by accident. Typical cases are citing
and forwarding a message including JIS X 0201 Kana set and/or JIS X
0212 1990 but labeled as ISO-2022-JP.
IMPLEMENTATION NOTE ON CITATION: If JIS X 0201 Kana set is cited, it
MUST be removed anyway. One possible deletion is to convert the
characters to corresponding characters in JIS X 0208 1983. Please
note that as of this writing there doesn't exist a charset to
contain JIS X 0201 Kana. If JIS X 0212 1990 is cited, it MUST be
removed to be labeled as ISO-2022-JP. Otherwise, label it as charset
which can contain other rich such as ISO-2022-JP-2.
IMPLEMENTATION NOTE ON FORWARDING: Since this memo talks about
ISO-2022-JP text only, forwarding an entire message is outside the
scope. But MIME composers are REQUIRED to forward valid messages in
the context of MIME. Mismatch between the charset parameter and its
content body MUST be eliminated. Situation would be mixed up when
the invalid message was digitally signed. But again, procedures to
create valid messages are outside the scope of this memo.
さまざまな問題が複雑に絡み合っているので、実装にはもう少し時間がかかりま
す。
--かず@来年まで人生をあきらめているやつ
Mew-dist メーリングリストの案内