[mew-dist 29313] Re: テキスト付きPDFをinlineで読むには

Hideyuki SHIRAI ( 白井秀行 ) shirai at example.com
2011年 1月 25日 (火) 21:05:57 JST


白井です。

From: Harumitsu YOSHITAKE <yositake at example.com> さん曰く
Subject: [mew-dist 29312] テキスト付きPDFをinlineで読むには
Message-ID: <20110124.155953.115217423357281610.yositake at example.com>
Date: Mon, 24 Jan 2011 15:59:53 +0900 (JST)

> Ubuntu Server 10.10 上の mew を ssh 経由で使っています。
>
> メールに添付された Word や Excel の文字情報だけをinline で見
> るのに wvHtml などの設定をして重宝しています。
>
> さて、透明テキスト付きPDFの文字情報を inline で読むためには、
> どのようにプログラムを書けば良いでしょうか?
>
> wvHtml の処理付近を参考にして pdftotext を呼ぶようにすれば可
> 能と思うのですが、私の技量では開発に時間がかかりすぎます。
>
> どなたか、既に、elisp を書かれているようでしたら、公開して頂
> けないでしょうか?

# 自分の環境だけで動かしているだけなので、何なのですが。。

こんなのを使っています。ちょっと環境が古いので今の pdftotext で
動くか分かりません。また、pdf2txt (確か perl script) とかも使っ
ていました。ご参考までに。

ただし、PDF はやっぱりちゃんとした Viewer で見た方が見やすいです
けど。

;; (setq mew-prog-pdf 'mew-mime-application/pdf)
(setq mew-prog-pdf '(nil mew-mime-application/pdf))
(setq mew-prog-application/pdf "pdftotext")

(defvar my-pdftotext-new t)

(defun mew-mime-application/pdf-ext (cache begin end &optional parameter)
  (with-current-buffer (mew-buffer-message)
    (mew-elet
     (mew-erase-buffer)
     (mew-mime-application/pdf cache begin end parameter)
     (mew-summary-display-postscript 'nohook))))

(defun mew-mime-application/pdf (cache begin end &optional parameter)
  (mew-erase-buffer)
  (let ((doit t) file1 file2
	(prog mew-prog-application/pdf))
    (unless (mew-which-exec prog)
      (setq doit nil)
      (mew-elet (insert "Install " prog "\n")))
    (if (not doit)
	(progn
	  (mew-elet (insert "\n"))
	  (mew-mime-part-messages nil))
      (setq file1 (mew-make-temp-name))
      (with-current-buffer cache
	(mew-flet
	 (write-region begin end file1 nil 'no-msg)))
      (setq file2 (mew-make-temp-name))
      (if (string= prog "pdf2txt")
	  (mew-frwlet
	      'shift_jis mew-cs-dummy
	    (call-process prog nil (current-buffer) nil "-s" file1))
	(mew-frwlet
	    'euc-japan mew-cs-dummy
	  (if my-pdftotext-new
	      (call-process prog nil nil nil "-raw" "-enc" "EUC-JP" file1 file2)
	    (call-process prog nil nil nil "-raw" "-eucjp" file1 file2))
	  (if (file-exists-p file2)
	      (insert-file-contents file2)
	    ;; passwd?
	    (mew-frwlet
		'shift_jis mew-cs-dummy
	      (call-process "pdf2txt" nil (current-buffer) nil "-s" file1)))))
      ;; (japanese-hankaku-region (point-min) (point-max) 'ascii)
      (if (file-exists-p file1) (delete-file file1))
      (if (file-exists-p file2) (delete-file file2)))))

-- 
白井秀行 (mailto:shirai at example.com)


Mew-dist メーリングリストの案内