OCRの精度を高める6つのコツ

Shuttle Smileは、わずか 1分で 通帳1冊(画像PDFファイル)をExcelファイル化する「通帳 AI-OCRクラウド」です。

今日は、OCR 精度を最大化するために今すぐ試せる 6 つのポイントをまとめました。スキャナーや複合機の設定を少し見直すだけで、修正作業に費やす時間を削減できます。


OCRの精度はとても大切です。なぜなら、誤認識・誤抽出が多量に発生すると、その修正作業量が増えてしまい、業務効率に影響を及ぼすからです。

AI-OCRも含め、複数のOCRサービスを試されている人もおられるのではないかと思います。
精度は、OCRサービス自体の性能によりますが、少しの工夫で改善することも可能です。今日は、手軽にできる改善策を書きます。

精度を左右するスキャナー設定 6 選

画質が悪い状態、例えば、解像度が低い設定のままでスキャンすると、高性能なAI-OCRであっても、誤認識・誤抽出が発生する場合があります。
OCRサービスには、推奨する解像度などが記載されていると思います。

一般的に、AI-OCRは従来のOCRに比較して高性能ですが、AI-OCR、従来のOCRにかかわらず、スキャナー・複合機の設定値は、OCRサービスの推奨値に合わせることが基本的な考え方です。
一度、スキャナー・複合機などの設定情報を確認し、推奨値に従った設定値に変更してみましょう。

以下に各設定値について記載します。文字を主体とした文書を念頭に記載しています。Shuttle Smile の推奨値は太字で示しています。

【ポイント1】 解像度

300 dpi が標準です。200 dpi 以下は文字のドット抜けが発生しやすいため非推奨です。400–600 dpi に上げると 精度が向上しますが、ファイルサイズが増えるため、バランスを見て設定してください。

【ポイント2】色モード

「モノクロ2値」、「カラー」、「グレースケール」が設定できますが、迷ったときは「グレースケール」が無難です。
AI-OCRの種類やスキャンする文書によってはグレースケールではなく、カラーを推奨している場合もありますが、ファイルサイズ増大に注意が必要です。

【ポイント3】圧縮率

低圧縮率高画質の設定にしましょう。PNG などの可逆圧縮形式がお奨めです。高圧縮は文字エッジが崩れ、AI‑OCR でも誤認識が増える場合があります。

【ポイント4】明るさ・コントラスト

中央 が基本ですが、文字がつぶれる場合は少しマイナス側へ変更してみましょう。かすれる場合は少しプラス側へ変更してみましょう。

【ポイント5】画質モード

機種によって名称は異なりますが、「文字モード」「文字優先」などのモードがお奨めです。

【ポイント6】画像補正

自動傾き補正、裏写り除去、ノイズ除去などがありますが、何れもONがお奨めです。


Shuttle Smile

  • Shuttle Smileは、簡単操作の「通帳 AI-OCRクラウド」です。

  • 通帳1冊が1分でExcelファイルに、3秒で会計ソフト取込用CSVファイルになります。

  • 対応する会計ソフトは「弥生会計」、「freee」、「マネーフォワード」、「他」です。

  • クレジットカード登録不要で「無料トライアル」を今すぐ100頁まで試せます。


前へ
前へ

「ワークライフバランス」について思うこと

次へ
次へ

Androidで通帳をPDF化する方法