[mew-dist 22549] Re: http://www.mew.org/release/info/ の文字化け
Kazu Yamamoto ( 山本和彦 )
kazu at example.com
2002年 12月 11日 (水) 10:40:29 JST
From: Shun-ichi TAHARA (田原 俊一) <jado at example.com>
Subject: [mew-dist 22548] Re: http://www.mew.org/release/info/ の文字化け
> そういえば大昔、EUCやSJISだと自動推測に失敗しやすいので、HTMLはJISで書
> け、みたいな話を聞いたことがありますね。
これは「日本語」の自動判定という意味においてのことですか?
確かに言語(文字コードの集合の意味)を制限しないと、推測はできません。
でも、日本語という制約があるなら、100% に近い確率で EUC-JP と
Shift_JIS を判定できると思いますよ。なんといっても、「ひらがな」の部分
は、両者で重ならない領域に割り当てられていますから。
# 256 x 256 の図を書いてみると、よく分ります。
重なっている部分だけを使った文章って、実際問題としてはほとんど存在しな
いと思います。
--かず
Mew-dist メーリングリストの案内