名城大学理工学部応用化学科　永田研究室 | ブログ「天白で有機化学やってます。」: メモ：本をスキャンしたデータから PDF を作る

トップ > ブログ > メモ：本をスキャンしたデータから PDF を作る

< FD学習会「アクティブラーニング型授業としての反転授業」 | ブログトップ | 研究室のファイルサーバが壊れた >

メモ：本をスキャンしたデータから PDF を作る2022/10/13（木）

単行本を図書館で借りてきて、手元に PDF でコピーを残しておきたいとします（当然個人利用に限定）。スキャナの機種にもよりますが、まあだいたいこういう２ページごとのデータになりますね。私の使っているエプソンのスキャナでは、EPSON001.PDF, EPSON002.PDF, ... という連番の PDF ファイルになります。

ここから１ページごとの「普通の」PDF にしたいのです。ツールを書くほどでもないので、ImageMagick を使ってコマンドラインでやってしまいます。

まず、PDF を画像データに変換します。

$ for i in `seq -f %03g 1 23`; do convert -density 400x400 -type Grayscale -colors 256 EPSON$i.PDF -geometry 50% -rotate +90 EPSON$i.png; done

スキャナの解像度は 200 dpi なのですが、200 dpi で png にするとギザギザの「白黒」画像になってしまいます。そこで、400 dpi でサンプリングした後、半分に縮小しています。また、-rotate +90 で画像を上向きにします。

１ページごとに切り出します。ここで jpg に変換しました。画質 (quality) はあまり下げると見苦しいので、まあ 60% ぐらいでしょうか。

$ for i in `seq -f %03g 1 23`; do convert EPSON$i.png -crop 1168x1653+0+0 -quality 60 EPSON$i-1.jpg; convert EPSON$i.png -crop 1168x1653+1168+0 -quality 60 EPSON$i-2.jpg; done

全部まとめて１本の PDF にします。45ページのPDFで、9 MB ぐらいになりました。ちょっとでかいな。

$ convert EPSON???-?.jpg EPSON001-out.pdf

最初のページは前の章なので、プレビュー.app で削りました。

< FD学習会「アクティブラーニング型授業としての反転授業」 | ブログトップ | 研究室のファイルサーバが壊れた >