[Mew-dist 03264] Re: mew-summary-search で漢字検索

Kazumasa Utashiro utashiro at example.com
1997年 12月 25日 (木) 02:43:42 JST


From: SAKAI Kiyotaka <ksakai at example.com>
Subject: [Mew-dist 03257] Re: mew-summary-searchで漢字検索
Date: Wed, 24 Dec 1997 11:21:19 +0900

> >> そうです。imgrep が (まだ?) 漢字の検索に対応していないためです。
> 
> > 正直いってどう実装すればいいかわかりません。日本語だけでいいのでしょうか。
> > ASCII JIS まじり文とかはどうするんでしょう。引数のコードとか、折り返しと
> > か、ヘッダは encode されていたりして。
> 
> そういえば、歌代さんの作った perl script に mg というのがあって、漢字
> の検索や行の折り返しにも対応していますが、これを参考にする (コードを貰
> う?) のが手かもしれません。

やっていることは正規表現を作ってサーチしているだけなので、その部分を流
用するのは簡単だと思います。ただ、複数行に渡るパターンを検索するために
は、行単位の処理を行なっていたのでは駄目です。全部読み込めばいいのです
が、超巨大なファイルを検索するときなどはちょっと困ったことになるかもし
れません。というような部分で結構苦労しています。

> encode されたヘッダは decode してしまえばいいのではないでしょうか。

じつは mg にはすでにそういうオプションがあったりして :-)

さらに -00 というオプションを付けるとヘッダだけを検索するので、そのま
までも結構メールの検索用に役立つのでした。

暇ができたらやってもいいんだけどね。正月休みにできるかなあ。

--utashiro



Mew-dist メーリングリストの案内