[ホーム] [索引] [O項へ戻る]
OCRソフトの基本的な操作方法
ここではエー・アイ・ソフトの「読んde!!ココ」を例に基本的な操作方法を紹介するが、
他のソフトでも基本操作の流れは変わらない。
原稿(画像)の取り込み
デジタル化したい紙文書をスキャナーにセットし、OCRソフトの「読み込み」ボタンをクリックして紙文書を
スキャンする。このときスキャナーの読み取り設定画面が表示されるので、読み取り解像度や、
色数などを設定する。読み取り解像度の基本は400dpiで、OCRソフトのほとんどは、読み取り解像度が
600dpiまで対応しているが、400dpiが読み取り速度と認識精度のバランスが良い。
 解像度をできるだけ高めにした方が認識精度が向上する気がするが、実際には紙文書の文字が
特に小さい場合を除けば解像度を上げれば認識精度が上がるというわけではない。
むしろ、解像度が高すぎるとデータ量が増え、認識に時間がかかってしまう。
 紙文書の状態で印刷が薄い原稿はあらかじめドライバーでコントラストを上げておこう。
コントラストを上げることで、文字と文字以外の部分の差が大きくなり認識精度が向上することが多い。
また、OCRソフトは雑誌の切り抜きやチラシなどのカラー原稿も読み取ることができるが、
使用用途がカラーでなければグレースケールに設定しておこう。
画像の修正
スキャン時に原稿が斜めになってしまったり、逆に原稿をセットしてしまった場合などは、
画像の向きや傾きを補正して文字が正しく認識しやすいように修正しておこう。
 スキャンした原稿の一部しか利用しない場合や読み取り結果にノイズが多い場合は
「画像編集」でトリミングしたり、ノイズ除去したりしておく。
領域抽出(レイアウト解析)認識枠を確認
領域抽出で文字や表、図などが領域ごとに自動判別されて文字認識の対象となる認識枠が形成される。
認識枠で囲まれた文字や図形は、各認識枠ごとに個別に言語や種別(表や図など)の認識条件の設定できる。
もちろん、認識条件を設定しなくても認識結果が著しく低下することはないが、少しでも認識精度を
上げるにためにも各認識枠の設定を確認しておいたほうが良い。「読んde!!ココ」では、認識枠を選ぶと、
別ウインドウに設定内容が表示され、種別や言語、飾り文字の認識など詳細な設定ができる。
 解析が終わると文字や表が自動でブロック分けされる。それぞれは個別に文字なのか表なのかといった
「種別」や言語(日本語や英語など)、文字種などが設定可能となっており、
ここをきちんと設定することで認識精度を高められる。
文字認識および修正
[認識]ボタンをクリックして、文字の認識を行う。新たにテキスト画面が表示されるので、
元のスキャン画像と比較して誤認識している個所を修正する。元画像とテキストウインドウはリンクしており、
誤認識された文字をクリックすると元画像の同じ場所に色が付く。
テキストウインドウの下に表示されている文字候補から文字を選ぶこともできる。
 文字認識が終了すると新たに別ウインドウが開き、認識結果が表示される。
認識結果が表示されたウインドウとスキャンしたイメージが表示された画像ウインドウを比較して、
誤認識されたものがあれば文字を修正する。
 修正方法は、一般的なテキストの入力方法と同じく、直接キーボードから入力する方法のほか、
誤字を選択したときに表示される文字候補から選ぶ方法など、いくつかの修正方法がある。
ここで文字の修正行ってOCR作業は終了だ。この後は、WordやExcelといったOfficeソフトとの
連携ボタンをクリックすると、認識結果が読み込まれた状態で連携先のソフトが起動する。

OCRをうまく行うポイントは、いかに認識精度を高くできるかで、そのためには、読み取った原稿の傾きなどの
修正はもちろん、レイアウト解析の後に、種別や言語の設定をきちんと行うことが重要であり、
すべての紙文書を認識できるわけではない。複数回コピーを重ね、文字がつぶれてしまっているものや、
図柄と文字が重なっているようなものは、いくら設定を変更しても、文字をうまく認識できないことが多い。
こうしたものは、OCR機能に固執するよりは手入力で修正したほうが作業が早く済む。




























inserted by FC2 system