[Mew-dist 355] Re: JIS subject ?
Kazuhiko Yamamoto 山本和彦
kazu at example.com
1996年 12月 27日 (金) 14:18:13 JST
ごめんなさい、長旅と Hydrangea(IPv6 for BSD/OS) のリリースのため、ほと
んどメールが読めていませんでした。12月の Mew のメールは、帰省してから
読みます。(_ _)
さて、ヘッダに JIS を入れてよいかという議論で、こうゆう疑問を投げかけ
る人が共通して理解できてきない、そして、解説するほうもちゃんと説明して
いない点をみつけました。議論が明確になることを願って、ここに書いておき
ます。
仕様では通常、シンタックスとセマンティクスを定義します。これまでは、シ
ンタックス上の議論だけに陥っているように思います。
RFC822 では、ヘッダのセマンティクスもボディのセマンティクスも ASCII と
定めています。ASCII とは、0-127 の範囲を ASCII 表にある文字として解釈
するというセマンティクスです。ただ、RFC822 の執筆当時 Dave が気が付い
ていた犯しやすいシンタックス上の問題点(単一の CR など)は明確に排除しま
した。
日本で本文に ISO-2022-JP を入れたのは、シンタックス上は問題ありません
が、セマンティクスを破っています。ASCII 文字列中に ESC シーケンスが現
れても、それは単なる ESC シーケンスですから、日本語として取り扱われま
せん。また、ヨーロッパでは、本文に 0-255 までを許し、これを Latin-1 と
解釈することにしました。これはシンタックスもセマンティックスも破ってい
ます。しかし、所詮、日本で ISO-2022-JP を利用しようとした背景は、ヨー
ロッパが 8bit 領域を使っていたからにほかなりません。日本でも EUC Japan
を標準に選ぶ可能性はあったということです。
MIME では、明示的に RFC822 のシンタックスもセマンティクスも変えないと
言っています。しかし、本文を再定義すると書かれています。MIME のシンタッ
クスでは本文に 0-255 までの値を格納できます。そして、そのセマンティク
スは(charset も含めた) CT: で与えられます。
また、MIME の拡張として、ヘッダのセマンティクスを拡張しました。=? ? ?=
という文字列は符号化されているという意味が与えられています。復号後のセ
マンティクスは、=? ? ?= のセマンティクスを解釈することにより与えられま
す。この規定は、header ならびに content-header に及びます。これが、CD:
に ASCII 以外の文字列は符号化して格納する必要がある理由です。
--かず
Mew-dist メーリングリストの案内