[mew-dist 19193] Re: mew-mime-content-type

Kazu Yamamoto ( 山本和彦 ) kazu at example.com
2001年 10月 5日 (金) 15:50:41 JST


From: SAITO Atsunori <sai at example.com>
Subject: [mew-dist 19191] Re: mew-mime-content-type

> あまり詳しくないですが、Byte Order Mark の略(のはず)で、
> UTF-16のByte Orderを指定するために、ファイルの先頭に fffe
> (little), feff (big) が入ります。

BOM が付くのは一般的なのでしょうか? そうは思えませんが。

> そうでした。良く考えたらmewは対応していないのでした。
> # charset=utf-16なんてのがあるかどうかも知らないのですが...

うーん。なんかみなさんちゃんと分ってなくて、直感だけでおしゃっているよ
うに聞こえます。

Unicode の 0 面、は UTF-8 で表現すると、1 〜 3 バイトになります。

Unicode の 1 〜 16 面は、UTF-16 (サロゲート)で表現すると、0 面の0xD800 
〜 0xDFFF になります。4 バイトです。ここを、UTF-8 で表現すると、4 バイ
トです。(なかなかうまく考えられているでしょう。)

UTF-16 という charset はなく、UTF-8 の範疇で処理できます。(ええ、名前
が悪くてみんな混乱するんです。)

--かず



Mew-dist メーリングリストの案内