[Mew-dist 03586] Re: EUC code to imput

1998年 1月 30日 (金) 12:11:06 JST

>>>>> On Fri, 30 Jan 1998 12:01:34 +0900, SAKAI Kiyotaka <ksakai at example.com> said:

ksakai> Japanese.pm で、/^($C_ascii$C_SorE)+$C_ascii$/ という正規表現
ksakai> に「もういわないからよく聞けよ」という文字列をマッチさせると、
ksakai> ものすごく時間がかかってしまうのが原因ですね。

ksakai> とりあえず、以下のように正規表現にマッチさせる順序を変更したら
ksakai> 時間がかからなくなりましたが、

うーん。SJIS と EUC の共通部分だけを使っている行である(つまり、その
行だけ見ても、どちらのコードを使っているかを特定できない)ことを
判定するために SorE のチェックが最初にあるので、それを後ろに動かして
しまうと、意味がなくなってしまいます。

ksakai> 正規表現の内容を変更するのが本当のような気もします。

そう思います。どうするのがいいでしょうか?

- motonori