« 足の甲の痛み Main 携帯サイトのアクセスキー設定 »

透明テキスト付き読み取りPDFの解像度変更

画像読み取りした文書に透明テキストを載せたPDFファイルのファイルサイズを小さくしようとdoPDFなどの仮想プリンタツールを試したが、話としては当然なのだろうが、印刷すると透明テキストの情報は消えてしまった。これらの情報を残したまま解像度を変更したりすることはできないのかな。

ちなみに、PDF文書を文字認識しての透明テキストデータへの変換はソースネクストの「いきなりPDF to Data 7」で行なっている。けっこう使いやすい感じ(いま見てみると認識エンジンはパナソニック製らしい)。他のツールとのセットを購入したが、分割だったり統合だったりDataだったり、ツールが個別に分かれてしまっていてどれで何ができるのやらよくわからなくなりがちなので、それを統合した形でのアプリケーションもあるといいのだが。

ところで、この「いきなりPDF」のツール群には種々の機能があるのだが、なぜか「(個別の)ページを回転して保存」というものはなく、to Data でページの向きを読み込み時に自動認識はするオプションもあるのだが、あまりアテにならない。また別で探してもなかなかそれに向くツールはないようだ。

結局、いったん処理したいPDFファイルをビューアで眺め、回転させるページを先にチェックしておいて、後からpdftkを使ってページ番号を指定して変換するのがよさそうとの結論に。

例)4ページと9-10ページのみ右90度回転させる
pdftk foo.pdf cat 1-3 4E 5-8 9-10E 11-end output bar.pdf

catでの各ページ番号の後ろに記すN,E,W,Sで0,90,270,180の回転、L,R,Dで-90,+90,+180の回転を指定する。

後から改めて、「いきなりPDF」のシリーズ間の機能比較表を見ると、結局「PDFから透明テキスト付きPDFを作成」できて、「ページの回転編集」ができて、おそらくファイルサイズの縮小としてやりたいことであろう「画像のダウンサンプリング」も可能なものというと最上位の「いきなりPDF Complete 7」ということになるらしい…。定価が9,850円のところ実質価格は6,330円あたりらしい。ヘタな抱き合わせセット品を買うより、こちらを購入するべきだったか…(購入した電器店にはその購入品あたりはおいてなかったのであるが)。でもやはり機能が統合されているわけではなく、単なるシリーズ品の寄せ集めのような雰囲気。


[追記]
ふと、PDFへの図や文字の記入に使うのに便利でインストールしている「PDF XChange Viewer」のメニューを見ていたら「ドキュメント→ページの回転」が可能なことが判明。「時計回り90度」「反時計まわり90度」に加え、「現在のページ」や「ページ指定」などの細かい指定もできるようだ。ページ回転は見ながらできるしこちらでもいいか。

今回検索すると、「フリー版は商用利用には使えない」と紹介している方が見つかった。

インストール時の条項はきちんと見ていなかったのだが、現在のサイトには「Free for Private and Commercial use,…」とあるので大丈夫そう?上の2007年頃とは条件が変わったのかも?

それはそうと、PDF XChangeシリーズの比較表も「いきなりPDF」と同じような程度に眺めにくい…。PDF関連の製品ってどれもこんな感じにごちゃごちゃ詰め合わせになりやすいのかなぁ…。価格は、今のところ PDF XChange Viewer PROで$34程度のようだ。

あと、透明テキストの関連リンクをいくつか。英語ではhidden textと呼ばれているようだ。あまり新しい情報は見当たらない感じ。

PDF Hacks」って2005年頭頃の本ですが、アップデート版が出ませんかねぇ。

Leave a comment

Your comment