[Mew-Win32 02009] Re: about charactor code

YAMAGUCHI Shuhei yamagus at example.com
1999年 9月 20日 (月) 16:07:01 JST


>>>>> In [Mew-Win32 : No.02008] 
>>>>>	Hideyuki SHIRAI (白井秀行) <shirai at example.com> wrote:

白井> # しかし、あくまで推測なので違うかもしれないです。

佐古田> ^B`^B5^B1^Bl......

白井> もしかして、SJIS の MSB 落ちの様な気もしなくはないです。これだと
白井> 無理です。例えば、

白井> # EUC-JP かもしれないし。

ほんとうにこれだけ頻度が高く ^B が出現するなら、MSB 落ちは正しいと仮定
した場合、やっぱり SJIS じゃないですかね。
MSB 落ちした EUC で `^' +`B' がそんなにたくさん出てくる文章は想像でき
ませんが、かといって、0x02 が出てくることはあり得ないですし。
一方、MSB 落ちした SJIS であれば、0x02 がたくさん出てくるのも納得でき
ます。

しかし、ここまで推測できても、SJIS の 2 バイト目を考えると、選択肢が 2
文字あるものが多いので、機械的に元に戻すのは難しいでしょう。
たとえば ^B` の場合は 0x82 0x5F と 0x82 0xDF が考えられます。
#実際には 0x82 0x5F には文字が割り当てられていないので、一意に 0x82
#0xDF すなわち「め」に定まりますが…。

でわでわ
-- 
yamagus at example.com / やまぐち@ねっとらぴゅたの住人
  yamagus at example.com / 山口 修平
PGP-Fingerprint: 25 0F 6F E1 57 AD 56 08  3A BC D0 9B 48 AF 31 7A



Mew-win32 メーリングリストの案内