No.478の記事

また違った形での自炊〜書籍の電子化

論文を本格的に書くようになって困ったのが、文献のハードコピーの扱いです。電子ジャーナルはPDFファイルで入手してdropboxというオンラインストレージサービスを介して各パソコン間でフォルダを同期しているので持ち運ぶ必要はないんですが、電子ジャーナルが利用できない文献が欲しい場合は図書館に依頼して紙のコピーを取り寄せなければなりません。特に幾つかの分野にまたがる事を並行してやっている時は、特集してる雑誌を複数持ち歩くハメになったりするので、荷物の重さがとんでもない事になってしまいます。長距離移動が多い自分にとって、荷物が多いのは結構な負担になるんですよね。
そんな中、「自炊」なるものが密かなブームになっているのを知りました。自炊と言っても料理を作る方ではなく、紙媒体をデジタル化する「自炊」の方です。自分はすでにdropboxを使っているので、高速読み取りができるスキャナと教科書や雑誌をぶった切ってくれる裁断機があればすぐにでも始められそうな感じです。

scansnap1500MとPLUS PK-513L
という事でまずtwitterやブログの記載を参考に、スキャナはPFUのscansnap1500M(公式サイト)、裁断機はPLUS PK-513L(公式サイトの製品情報)をamazonで取り寄せてみました。実はこのscansnapには因縁があり、5年ほど前に当時のモデルを買った事があったんですが、この頃は解像度もOCR機能も貧弱で、またPDFを読む側のPDAやパソコンのスペックもイマイチだったので、全く実用にならず売り払ってしまった事がありました。今度はきちんと下調べしてるし大丈夫なはず!と念じつつ、自炊をやっている先駆者のブログの記事こちらこちらを参考に、モードは自動、ファインかスーパーファイン、傾き補正や向き補正はせず、OCR機能もオフにしてコピーされた論文を取り込んでみたところ…おお取り込みが速い!。昔と比べると雲泥の差じゃぁないですか…何か時代の流れを感じます(遠い目)。

scansnap1500Mでいろいろ取り込んでみるscansnap1500Mで読み込んでるの図
何だか取り込むのが楽しくなってきたので、調子にのって医学雑誌のみならずWebサイトデザイン関連のムック本なんかも裁断して取り込んでみることにしました。医学雑誌は紙質が均一なので時折入っている学会費の振込用紙で引っかかる以外ほとんどエラーは出ませんでしたが、Webデザイン関係のムックは表紙が厚かったり裁断しても2枚がくっついていたりして、結構エラーが出てしまいました。なので事前にきちんと切れてるかパラパラめくってみたり、厚さの違う表紙だけ別に読み込ませるなどの工夫が必要でした。ただ実際に読み取ったものを確認すると、エラー感度はやたら高いものの、偽陰性(読めてないのにエラーが出ない)はないので結構安心して読ませられました。あとエラー時に出るダイアログのメッセージ(最後に読み込んだ原稿を削除するか否か等)が分かりにくくて対応に困ることもありましたが、エラーが出る原因数種類くらいしかないので、幾つか経験すればエラー後の対処に困る事はなくなってきます。なので今のところ読み込み時の大きな失敗は、二重になった原稿を読み取る時に原稿を横から固定するガイドが動いてしまい、原稿が激しく斜めになって千切れてしまった事くらいでした。うーん順調順調。

んでいくつかの文献を取り込んだ後、今度は付属のscansnap organizerを使ってOCRをします。このアプリケーションは複数のファイルをバックグラウンドでまとめて処理したりできるので、非常に使い勝手が良いです。まぁ今のところそんなに一度にOCRする事はないので、寝る前に専従処理させておけば朝までに必ず完成できており、自分的にはバックグラウンド処理はあんまり要らないようですけどね。ただ専従処理の場合は読み取り言語を1つ選択しないといけないので、日本語と英語の文献を一度にスキャンした場合は、それぞれ専従処理させる必要があるみたいです(説明書を読み込んでいないのでもしかしたらそうではないのかもしれませんが…)。
読み取ったPDFをdropboxに放り込んでiPhone3GSやパソコンで見てみた所、表示速度も良好ですし検索にもちゃんと反応するので非常に満足です。最近は本棚の雑誌が次々となくなっていき、非常にスッキリした気分になれます。ただノートパソコンやiPhone3GSの小さなモニターで見るには字が小さい文献が多いので、やがてはそれらを読むための専用端末が欲しいなぁと妄想しています。とりあえずiPadあたりで手を打とうかな?。