[Mew-dist 2864] Re: charset=unknown

Kazu Yamamoto ( 山本和彦 ) Kazu at example.com
1997年 10月 31日 (金) 20:43:06 JST


From: Takeshi Chiba <chiba at example.com>
Subject: [Mew-dist 2863] charset=unknown
Date: Fri, 31 Oct 1997 20:16:58 +0900 (JST)

> Conten-Type の話題が出ていますが、先程 Mew-1.92.1 を使ってい
> て、以下のようなヘッダを持つメールを出してしまいました。

いい加減なコードでごめんなさい。

まず、神戸さんとの議論でも言ったように、charset=unknown というメールを送
信すべきではありません。現在の Mew では charset が分からない場合、とりあ
えず unknown という文字列を返しています。ここでユーザに、「こんなメール
は送れないよ」と警告を出すべきですが、まだ実装していません。すみません。

> 確か昔は、ISO-2022-JP-2 などとなっていたような気がしましたが
> 最近のバージョンで変わったのでしょうか?

まず、半角カタカナを運ぶ charset はどこにも定義されていません。それで、
半角カタカナがある場合は、例えば全角カタカナに直すような処置が必要です。

現在 ISO-2022-JP を定めている RFC 1468 の改定版を書いているところです。
(もう 2 ヵ月も作業しているので、そろそろ出したいです。) それには、以下の
ように書いてあります。

    Please note that best strategy for interoperability is TO BE LIBERAL
    IN WHAT YOU RECEIVE AND CONSERVATIVE IN WHAT YOU SEND.

    JIS X 0201 Kana set MUST NOT be used in ISO-2022-JP text. It may
    erroneously appear in ISO-2022-JP text with the following sequences:

        <8-bit Kana set char>
        SO <7-bit Kana set char> SI
        SO <8-bit Kana set char> SI
        ESC ( I <7-bit Kana set char> ESC ( B
        ESC ) I <8-bit Kana set char>

    JIS X 0212 1990 MUST NOT be embedded in ISO-2022-JP text. It may
    erroneously appear following "ESC $ ( D" in ISO-2022-JP text. To
    embed JIS X 0212 1990, other charsets such as
    ISO-2022-JP-2[ISO-2022-JP-2] SHOULD be used.

    IMPLEMENTATION NOTE: Even if a message composer does not provide any
    input method for character sets which is not used in ISO-2022-JP,
    such as JIS X 0201 Kana set and JIS X 0212 1990, there are
    possibilities to include them by accident. Typical cases are citing
    and forwarding a message including JIS X 0201 Kana set and/or JIS X
    0212 1990 but labeled as ISO-2022-JP.

    IMPLEMENTATION NOTE ON CITATION: If JIS X 0201 Kana set is cited, it
    MUST be removed anyway. One possible deletion is to convert the
    characters to corresponding characters in JIS X 0208 1983. Please
    note that as of this writing there doesn't exist a charset to
    contain JIS X 0201 Kana. If JIS X 0212 1990 is cited, it MUST be
    removed to be labeled as ISO-2022-JP. Otherwise, label it as charset
    which can contain other rich such as ISO-2022-JP-2.

    IMPLEMENTATION NOTE ON FORWARDING: Since this memo talks about
    ISO-2022-JP text only, forwarding an entire message is outside the
    scope. But MIME composers are REQUIRED to forward valid messages in
    the context of MIME. Mismatch between the charset parameter and its
    content body MUST be eliminated. Situation would be mixed up when
    the invalid message was digitally signed. But again, procedures to
    create valid messages are outside the scope of this memo.


さまざまな問題が複雑に絡み合っているので、実装にはもう少し時間がかかりま
す。

--かず@来年まで人生をあきらめているやつ




Mew-dist メーリングリストの案内