[mew-dist 22549] Re: http://www.mew.org/release/info/ の文字化け

Kazu Yamamoto ( 山本和彦 ) kazu at example.com
2002年 12月 11日 (水) 10:40:29 JST


From: Shun-ichi TAHARA (田原 俊一) <jado at example.com>
Subject: [mew-dist 22548] Re: http://www.mew.org/release/info/ の文字化け

> そういえば大昔、EUCやSJISだと自動推測に失敗しやすいので、HTMLはJISで書
> け、みたいな話を聞いたことがありますね。

これは「日本語」の自動判定という意味においてのことですか?

確かに言語(文字コードの集合の意味)を制限しないと、推測はできません。

でも、日本語という制約があるなら、100% に近い確率で EUC-JP と 
Shift_JIS を判定できると思いますよ。なんといっても、「ひらがな」の部分
は、両者で重ならない領域に割り当てられていますから。

# 256 x 256 の図を書いてみると、よく分ります。

重なっている部分だけを使った文章って、実際問題としてはほとんど存在しな
いと思います。

--かず



Mew-dist メーリングリストの案内