アナログな書類をPDFで整理

PC上で扱うファイルとしての文書*1 と物理的な印刷された紙という意味での文書との二つを考えたときに、
それぞれの利点を十二分に押さえた上での相互利用の方法論になると思う。
■紙としての文書からデジタルな文書への変換
一番最初に誰でも思いつくのが、
印刷物(手書きを含む)→スキャナーによるスキャンニングということになるだろう。
デジタル化と言っても、出来るファイルは、画像ファイルだ。
ただし、これだと、戸棚がHDになっただけで、デジタル化する意味がほとんどない。
そもそも、せっかくデジタル化させるのであれば、デジタル文書の一番の特色である「再利用・編集・検索」は可能な限り実現させたい。
そこで、OCRという話になるのだが、十年前ほどに私が実験してみた範囲では、当時のOCR技術水準の低さから、日本語でのOCRは使い物にならないという結論を導くのに役立ったのみであった。
データベーステーブルなどで要求される整合性といった意味での厳密な約分までは不要としても、OCR処理の結果の文書の確認修正処理プロセスの手間が、頭っから打ち込む手間と変わらないようでは話にならないのだ。
それだけではない。
当時の一般ユーザー用のスキャナーの読込速度・精度の遅さといったら、とてもではないが、ユーザビリティのカケラも考えられていない代物だった。
今日では、PDFというキーワードも出てきている。
おそらくはこれが、物理的な紙という意味での文書とデジタルな文書との橋渡しとなるのであろう。
ということで、今後の研究課題として、PDF周りを整理方法や生成方法などメソッドを中心に考えてみようと思う。

注1WordファイルやExcelファイルなどに代表される

2チャンネルのMacスレを見ていたときに「iTuneを使ってPDFの整理ができる」というような記述を目にしたので、iTuneだのPDFだのでググって見た。
「itune pdf 整理」でググった結果、TOPになったのが、
知的生産/情報整理 – いろいろな情報整理ツールというページである。
ここに

家庭用のスキャナーの寿命は１万枚程度。精度はどれも似たようなもの。
しかしScansnapは両面同時カラースキャンで、しかも１度に３０枚ぐらいスキャンできるので、物凄く効率がよいです。スキャンしたものをＰＤＦで保管しています。

という記述がある。
そんじゃ・・・と、当該商品のメーカーページへ
http://scansnap.fujitsu.com/jp/

コメント