[mew-dist 29554] Re: 添付テキストファイルの文字コード

Ryo Furue furue at example.com
2013年 1月 23日 (水) 20:06:58 JST


みなさま

いろいろ教えて下さってありがとうございます!

>> となります。それを自分自身に送り受け取ると
>> 
>>   Text/Plain(iso-2022-jp-3)
>> 
>> として添付されていました。これを utf-8 で送り出すように変更する
>> 方法を探しています。

鯉江さんが教えて下さった

  `C'     Text/* 型の出力 coding-system を指定する。

で、送信の文字コードを変更することができました。

当面はこれでしのげますが、出来たら何もしないで utf-8 に
なってくれるに越したことはありません。

それに関して、かずさんの

> 僕が試すと utf-8 になりました。
> 
> 僕は以下の設定を入れています。
> 
> (prefer-coding-system 'utf-8)
> (set-clipboard-coding-system 'utf-8)
> (set-default-coding-systems 'utf-8)
> (set-file-name-coding-system 'utf-8)
> (set-keyboard-coding-system 'utf-8)
> (set-terminal-coding-system 'utf-8)

を試してみました。結果は変わらず、iso-2022-jp で
送り出されてしまいました。(set-language-environment")は
無効のまま、emacsは再起動してあります。

それ以外に何か言語やコーディングに関するものがないか .emacs
と .mew.el を上から下まで眺めてみましたが、見つかりませんでした。
(目が節穴であるという可能性はあります。)
また、言語に関する環境変数は "LANG=C" だけです。
(関係あるかどうか全然分かりませんが。)

ところで、話がややこしくなるだけで的外れな話だと思いますが、
面白かったので . . . 日本語テキストファイルでなくても、
iso-2022-jp が選択されてしまう例に行き当たりました。
添付のファイルは、

http://en.wikipedia.org/wiki/Mathematical_operators_and_symbols_in_Unicode

から、コピー&ペーストし作成した utf-8 のテキストファイルです。
含まれているのは unicode の数学記号であって、「日本語全角」ものでは
ありません。にも関わらず、先程自分自身に送った時には
iso-2022-jpが選択されました。送られてきたテキストファイルを
ディスクにセーヴして中を見たら、元のファイルとは違い、ターミナルで
cat すると文字化けしていました。(ターミナルはutf-8を正しく表示する
ようになっている。)
(僕は16進ダンプを見てもどのコーディングなのかは分からないので . . .)

emacsは、「日本語だからiso-2022-jp」というよりは、
「iso-2022-jpに変換できるものならしてやろう」という発想
なんでしょうか。あるいは、こういう数学記号の emacs 内部表現が
unicode と「日本語全角」で同じである、とか。
ちなみに、unicodeのギリシャ文字で同様の実験をしてみましたが
iso-2022-jpにはなりませんでした。ということは、unicodeギリシャ文字は
「全角ギリシャ文字」とは別に扱われているということ?

古恵 亮
-------------- next part --------------
∀∂


Mew-dist メーリングリストの案内