[Mew-dist 04070] Re: charset=shift_jis

Kazumasa Utashiro utashiro at example.com
1998年 3月 3日 (火) 18:35:21 JST


From: SAKAI Kiyotaka <ksakai at example.com>
Subject: [Mew-dist 04067] Re: charset=shift_jis
Date: Tue, 3 Mar 1998 16:02:51 +0900

> > で、作りながら考えたのですが、日本語の文字列の前後を designator で囲ん
> > で、その中ではコードの指示は行わないというのが、わりときれいでわかりや
> > すいような気がしてきました。最初と最後に必要に応じて G0 と G1 の一方あ
> > るいは両方を切り替えるわけです。これを実装してみたのが2番目です。
> 
> これだと、
> 
> > とすると、仮名が終わった後で G1 に Latin-1 を designate して、次にまた
> > 仮名が出て来た時に X0201 を designate するのが冗長になるわけですが、こ
> > れは気にしないか、その方がいいという判断ですね。
> 
> の問題は解決できないのではないでしょうか。

はい。僕自身はこれは問題だとは考えていなくて、どちらかと言えばその方が
いいかとも思っています。上で書いたのは確認の意味で、もし非難していると
感じられていたらごめんなさい。

> 先のパッチでは「もし仮名があれば、最初の仮名の前に "\e\)I" を挿入し、
> 最後の仮名の後に "\e-A" を挿入する」ということをやっていますが、入力が
> SJIS で行をまたがないことを仮定できるのであれば、これで充分だと思いま
> す。

行末に置くか、最後の仮名の後に置くかという違いはありますが、基本的に 
Mule の実装と同じですね。「日本語」にこだわらずに、独立したコードとし
て考えるとすれば、それがもっとも素直な実装だと思います。

どれがいいのかは、よくわかりません。jcode.pl で ctext をサポートすると
すれば、mule に合わせるのが一番だとは思うのですが、必ずしも行単位で処
理されるわけではないので、ライブラリレベルで制御はできないのが問題です。

--utashiro



Mew-dist メーリングリストの案内