メモ:本をスキャンしたデータから PDF を作る2022/10/13(木)
単行本を図書館で借りてきて、手元に PDF でコピーを残しておきたいとします(当然個人利用に限定)。スキャナの機種にもよりますが、まあだいたいこういう2ページごとのデータになりますね。私の使っているエプソンのスキャナでは、EPSON001.PDF, EPSON002.PDF, ... という連番の PDF ファイルになります。
ここから1ページごとの「普通の」PDF にしたいのです。ツールを書くほどでもないので、ImageMagick を使ってコマンドラインでやってしまいます。
まず、PDF を画像データに変換します。
$ for i in `seq -f %03g 1 23`; do convert -density 400x400 -type Grayscale -colors 256 EPSON$i.PDF -geometry 50% -rotate +90 EPSON$i.png; done
スキャナの解像度は 200 dpi なのですが、200 dpi で png にするとギザギザの「白黒」画像になってしまいます。そこで、400 dpi でサンプリングした後、半分に縮小しています。また、-rotate +90
で画像を上向きにします。
1ページごとに切り出します。ここで jpg に変換しました。画質 (quality) はあまり下げると見苦しいので、まあ 60% ぐらいでしょうか。
$ for i in `seq -f %03g 1 23`; do convert EPSON$i.png -crop 1168x1653+0+0 -quality 60 EPSON$i-1.jpg; convert EPSON$i.png -crop 1168x1653+1168+0 -quality 60 EPSON$i-2.jpg; done
全部まとめて1本の PDF にします。45ページのPDFで、9 MB ぐらいになりました。ちょっとでかいな。
$ convert EPSON???-?.jpg EPSON001-out.pdf
最初のページは前の章なので、プレビュー.app で削りました。