[Mew-dist 2275] Re: Read Chinese on Mew

Yan HUANG huangyan at example.com
1997年 9月 29日 (月) 13:32:42 JST


黄 です。こんにちは。

At Fri, 26 Sep 1997 04:08:11 +0900
Kazu Yamamoto (山本和彦) <Kazu at example.com> wrote:

  > RFC 1922 を読んで、実際に中国/台湾付近で使われているコードはなにか教えて
  > 頂けますか? RFC は、ftp://ds.internic.net/rfc から入手できます。

恐縮しながら、上記の RFC を読んで以下のことが分かりました。

現在、中国本土、Singaporeでは、GB コード(GB2312.1980 or
GB2312.80&GB8565.88)が使われており、台湾では Big5 コードが使われていま
す。香港では GB コードおよび Big5 コードの両方も使用されているらしい。

Internet 上に使われている中国語関係の encoding 方式は主に二つの種類が
あります。一つは 7-bit の iso-2022-cn (iso-2022-jp と iso-2022-kr と似
ている)および iso-2022-cn-extで、もう一つは 8-bit の CN-GB と CN-Big5 
です。

8-bit の CN-GB と CN-Big5 については次のような説明があります。

 2.1 CN-GB

   E-mail using CN-GB characters is sent in this way:

   GB 2312-80 characters are used with ASCII characters, not GB 1988-89
   [GB-1988].

   GB 2312-80 is also 7-bit, to avoid conflicting with ASCII.  If the
   character is from GB 2312-80, the MSB (bit-8) of each byte is set to
   1, and therefore becomes a 8-bit character.  Otherwise, the byte is
   interpreted as ASCII.  This constructs a character set named "GB
   Internal Code".

 2.2 CN-Big5

   Big5 is a two-byte character set of traditional Chinese characters,
   widely used in Taiwan and overseas.  E-mail of CN-Big5 is sent in
   this way:

   Big5 is used with ASCII.  The MSB of ASCII characters is always 0.
   The MSB of the first byte of a Big5 character is always 1; this
   distinguishes it from an ASCII character.  The second byte has 8
   significant bits.  Therefore, CN-Big5 is an 8-bit encoding with a
   15-bit codespace.
	

8-bit の CN-GB と CN-Big5 メールを送信するには、"base64" または 
"quoted-printable"を使わなければなりません。


ご参考になれば幸いです。


--- Yan




Mew-dist メーリングリストの案内