[Mew-dist 2251] Re: Read Chinese on Mew

Kazumasa Utashiro utashiro at example.com
1997年 9月 26日 (金) 20:49:45 JST


From: Kazu Yamamoto (山本和彦) <Kazu at example.com>
Subject: [Mew-dist 2246] Re: Read Chinese on Mew
Date: Fri, 26 Sep 1997 09:33:52 +0900

> > EUC だから imls で化けるのは仕方ないと思いますが,
> 
> これは IM の方を改造して、EUC-KR を ISO-2022-JP-2 にするようにします。こ
> ちらはちょっと時間がかかります。
> 
> 担当の歌代さんは、やる時間がありますか?

うーむ、それは substr_safe はもはや他の人には読めなかろうという意味だ
ろうか? アルゴリズムはほとんどいじってないつもりなんだけど。

何が必要とされているのか、今一つ正確に把握できていないんだけど、

    while (length($_) && $count < $len) {

	   if (s/(^$SI)//o)	{ $charset = $G0; }
	elsif (s/(^$SO)//o)	{ $charset = $G1; $shift_in = $SI; }
	elsif (s/(^$SS2)//o)	{ $charset = $G2; $shift_in = $SI; }
	# This is verbose if SS3 appears only in ISO-2022-CN-EXT
	elsif (s/(^$SS3)//o)	{ $charset = $G3; $shift_in = $SI; }

	elsif (m/(^[\200-\377]+)/o) {
		$_ = join('',
			"KR のエスケープシークエンス",
			"$1 から MSB 落した奴",
			"現在の $charset に対応するシークエンス",
			$_,
		);
		redo;
	}
	elsif (m/(^[^\e$SI$SO]+)/o) {

みたいなコードを追加すればいいのかな?

MSB が立っていたら何のコードだとみなすかというヒントが必要な気がします。

--utashiro



Mew-dist メーリングリストの案内