電子文書化 その2

このための技術:以下、Canonのスキャナ、CanoScan 5400F を利用した場合。

スキャナでの読み取り

文字だけなら、白黒で読み込む 300dpi〜400dpi
グレーの写真などがあったら、グレースケールで読み込む
カラー写真などがあったら、カラーで読み込む

PDFで保存を選択
自動的にOCRで文字を認識し透明テキストを文書画像の上に配置してくれる。

OCR

CanoScan 5400Fに付属しているOCRは、読取革命Lite。Lite版では、機能が制限されており、

  • PDFファイルを文字認識できない点
  • 文字認識後PDF化できない点

がネック。

CanoScan 5400Fでは文字認識後に続けてPDFにする時にだけPDFにできるだけ。したがって、通常の読取革命を購入する必要があるだろう。

検索

Google Desktopで良いと思う。
ファイル管理革命Liteがスキャナに付属しているアプリだけど、慣れるとこれでも良いかも

PDF編集

CanoScanでは、PDFを作成できるだけで編集はほとんどできない。例えば、読み込み時にしか画像の回転が出来ない。そのためPDFを編集して文書を整理するには、別のアプリが必要。

Adobe Acrobatが高機能だとは思うが価格が高すぎる。さまざまなフリーソフトを組み合わせて利用しようと試してみたが、精度と使い勝手とが悪く、継続して利用するのは大変だ。