名城大学理工学部 応用化学科 永田研究室
トップ 教育 研究 プロフィール アクセス リンク キャラクター ブログ
トップ  >  ブログ  >  メモ:本をスキャンしたデータから PDF を作る

 

ブログ「天白で有機化学やってます。」 ブログ「天白で有機化学やってます。」
< FD学習会「アクティブラーニング型授業としての反転授業」 | ブログトップ | 研究室のファイルサーバが壊れた >

メモ:本をスキャンしたデータから PDF を作る2022/10/13(木)

単行本を図書館で借りてきて、手元に PDF でコピーを残しておきたいとします(当然個人利用に限定)。スキャナの機種にもよりますが、まあだいたいこういう2ページごとのデータになりますね。私の使っているエプソンのスキャナでは、EPSON001.PDF, EPSON002.PDF, ... という連番の PDF ファイルになります。

ここから1ページごとの「普通の」PDF にしたいのです。ツールを書くほどでもないので、ImageMagick を使ってコマンドラインでやってしまいます。

まず、PDF を画像データに変換します。

$ for i in `seq -f %03g 1 23`; do convert -density 400x400 -type Grayscale -colors 256 EPSON$i.PDF -geometry 50% -rotate +90 EPSON$i.png; done

スキャナの解像度は 200 dpi なのですが、200 dpi で png にするとギザギザの「白黒」画像になってしまいます。そこで、400 dpi でサンプリングした後、半分に縮小しています。また、-rotate +90 で画像を上向きにします。

1ページごとに切り出します。ここで jpg に変換しました。画質 (quality) はあまり下げると見苦しいので、まあ 60% ぐらいでしょうか。

$ for i in `seq -f %03g 1 23`; do convert EPSON$i.png -crop 1168x1653+0+0 -quality 60 EPSON$i-1.jpg; convert EPSON$i.png -crop 1168x1653+1168+0 -quality 60 EPSON$i-2.jpg; done

全部まとめて1本の PDF にします。45ページのPDFで、9 MB ぐらいになりました。ちょっとでかいな。

$ convert EPSON???-?.jpg EPSON001-out.pdf

最初のページは前の章なので、プレビュー.app で削りました。

< FD学習会「アクティブラーニング型授業としての反転授業」 | ブログトップ | 研究室のファイルサーバが壊れた >