OCRの精度を高める6つのコツ
Shuttle Smileは、わずか 1分で 通帳1冊(画像PDFファイル)をExcelファイル化する「通帳 AI-OCRクラウド」です。
今日は、OCR 精度を最大化するために今すぐ試せる 6 つのポイントをまとめました。スキャナーや複合機の設定を少し見直すだけで、修正作業に費やす時間を削減できます。
OCRの精度はとても大切です。なぜなら、誤認識・誤抽出が多量に発生すると、その修正作業量が増えてしまい、業務効率に影響を及ぼすからです。
AI-OCRも含め、複数のOCRサービスを試されている人もおられるのではないかと思います。
精度は、OCRサービス自体の性能によりますが、少しの工夫で改善することも可能です。今日は、手軽にできる改善策を書きます。
精度を左右するスキャナー設定 6 選
画質が悪い状態、例えば、解像度が低い設定のままでスキャンすると、高性能なAI-OCRであっても、誤認識・誤抽出が発生する場合があります。
OCRサービスには、推奨する解像度などが記載されていると思います。
一般的に、AI-OCRは従来のOCRに比較して高性能ですが、AI-OCR、従来のOCRにかかわらず、スキャナー・複合機の設定値は、OCRサービスの推奨値に合わせることが基本的な考え方です。
一度、スキャナー・複合機などの設定情報を確認し、推奨値に従った設定値に変更してみましょう。
以下に各設定値について記載します。文字を主体とした文書を念頭に記載しています。Shuttle Smile の推奨値は太字で示しています。
【ポイント1】 解像度
300 dpi が標準です。200 dpi 以下は文字のドット抜けが発生しやすいため非推奨です。400–600 dpi に上げると 精度が向上しますが、ファイルサイズが増えるため、バランスを見て設定してください。
【ポイント2】色モード
「モノクロ2値」、「カラー」、「グレースケール」が設定できますが、迷ったときは「グレースケール」が無難です。
AI-OCRの種類やスキャンする文書によってはグレースケールではなく、カラーを推奨している場合もありますが、ファイルサイズ増大に注意が必要です。
【ポイント3】圧縮率
低圧縮率、高画質の設定にしましょう。PNG などの可逆圧縮形式がお奨めです。高圧縮は文字エッジが崩れ、AI‑OCR でも誤認識が増える場合があります。
【ポイント4】明るさ・コントラスト
中央 が基本ですが、文字がつぶれる場合は少しマイナス側へ変更してみましょう。かすれる場合は少しプラス側へ変更してみましょう。
【ポイント5】画質モード
機種によって名称は異なりますが、「文字モード」、「文字優先」などのモードがお奨めです。
【ポイント6】画像補正
自動傾き補正、裏写り除去、ノイズ除去などがありますが、何れもONがお奨めです。
Shuttle Smile
Shuttle Smileは、簡単操作の「通帳 AI-OCRクラウド」です。
通帳1冊が1分でExcelファイルに、3秒で会計ソフト取込用CSVファイルになります。
対応する会計ソフトは「弥生会計」、「freee」、「マネーフォワード」、「他」です。
クレジットカード登録不要で「無料トライアル」を今すぐ100頁まで試せます。