[mew-dist 29554] Re: 添付テキストファイルの文字コード
Ryo Furue
furue at example.com
2013年 1月 23日 (水) 20:06:58 JST
みなさま
いろいろ教えて下さってありがとうございます!
>> となります。それを自分自身に送り受け取ると
>>
>> Text/Plain(iso-2022-jp-3)
>>
>> として添付されていました。これを utf-8 で送り出すように変更する
>> 方法を探しています。
鯉江さんが教えて下さった
`C' Text/* 型の出力 coding-system を指定する。
で、送信の文字コードを変更することができました。
当面はこれでしのげますが、出来たら何もしないで utf-8 に
なってくれるに越したことはありません。
それに関して、かずさんの
> 僕が試すと utf-8 になりました。
>
> 僕は以下の設定を入れています。
>
> (prefer-coding-system 'utf-8)
> (set-clipboard-coding-system 'utf-8)
> (set-default-coding-systems 'utf-8)
> (set-file-name-coding-system 'utf-8)
> (set-keyboard-coding-system 'utf-8)
> (set-terminal-coding-system 'utf-8)
を試してみました。結果は変わらず、iso-2022-jp で
送り出されてしまいました。(set-language-environment")は
無効のまま、emacsは再起動してあります。
それ以外に何か言語やコーディングに関するものがないか .emacs
と .mew.el を上から下まで眺めてみましたが、見つかりませんでした。
(目が節穴であるという可能性はあります。)
また、言語に関する環境変数は "LANG=C" だけです。
(関係あるかどうか全然分かりませんが。)
ところで、話がややこしくなるだけで的外れな話だと思いますが、
面白かったので . . . 日本語テキストファイルでなくても、
iso-2022-jp が選択されてしまう例に行き当たりました。
添付のファイルは、
http://en.wikipedia.org/wiki/Mathematical_operators_and_symbols_in_Unicode
から、コピー&ペーストし作成した utf-8 のテキストファイルです。
含まれているのは unicode の数学記号であって、「日本語全角」ものでは
ありません。にも関わらず、先程自分自身に送った時には
iso-2022-jpが選択されました。送られてきたテキストファイルを
ディスクにセーヴして中を見たら、元のファイルとは違い、ターミナルで
cat すると文字化けしていました。(ターミナルはutf-8を正しく表示する
ようになっている。)
(僕は16進ダンプを見てもどのコーディングなのかは分からないので . . .)
emacsは、「日本語だからiso-2022-jp」というよりは、
「iso-2022-jpに変換できるものならしてやろう」という発想
なんでしょうか。あるいは、こういう数学記号の emacs 内部表現が
unicode と「日本語全角」で同じである、とか。
ちなみに、unicodeのギリシャ文字で同様の実験をしてみましたが
iso-2022-jpにはなりませんでした。ということは、unicodeギリシャ文字は
「全角ギリシャ文字」とは別に扱われているということ?
古恵 亮
-------------- next part --------------
∀∂
Mew-dist メーリングリストの案内