[Mew-dist 2275] Re: Read Chinese on Mew
Yan HUANG
huangyan at example.com
1997年 9月 29日 (月) 13:32:42 JST
黄 です。こんにちは。
At Fri, 26 Sep 1997 04:08:11 +0900
Kazu Yamamoto (山本和彦) <Kazu at example.com> wrote:
> RFC 1922 を読んで、実際に中国/台湾付近で使われているコードはなにか教えて
> 頂けますか? RFC は、ftp://ds.internic.net/rfc から入手できます。
恐縮しながら、上記の RFC を読んで以下のことが分かりました。
現在、中国本土、Singaporeでは、GB コード(GB2312.1980 or
GB2312.80&GB8565.88)が使われており、台湾では Big5 コードが使われていま
す。香港では GB コードおよび Big5 コードの両方も使用されているらしい。
Internet 上に使われている中国語関係の encoding 方式は主に二つの種類が
あります。一つは 7-bit の iso-2022-cn (iso-2022-jp と iso-2022-kr と似
ている)および iso-2022-cn-extで、もう一つは 8-bit の CN-GB と CN-Big5
です。
8-bit の CN-GB と CN-Big5 については次のような説明があります。
2.1 CN-GB
E-mail using CN-GB characters is sent in this way:
GB 2312-80 characters are used with ASCII characters, not GB 1988-89
[GB-1988].
GB 2312-80 is also 7-bit, to avoid conflicting with ASCII. If the
character is from GB 2312-80, the MSB (bit-8) of each byte is set to
1, and therefore becomes a 8-bit character. Otherwise, the byte is
interpreted as ASCII. This constructs a character set named "GB
Internal Code".
2.2 CN-Big5
Big5 is a two-byte character set of traditional Chinese characters,
widely used in Taiwan and overseas. E-mail of CN-Big5 is sent in
this way:
Big5 is used with ASCII. The MSB of ASCII characters is always 0.
The MSB of the first byte of a Big5 character is always 1; this
distinguishes it from an ASCII character. The second byte has 8
significant bits. Therefore, CN-Big5 is an 8-bit encoding with a
15-bit codespace.
8-bit の CN-GB と CN-Big5 メールを送信するには、"base64" または
"quoted-printable"を使わなければなりません。
ご参考になれば幸いです。
--- Yan
Mew-dist メーリングリストの案内