Shuttle Smileは、様々な知見を活用して、精度向上に取り組んでいます。

先日リリースしたShuttle Smileは、わずか 1分で 通帳1冊をExcelファイル化する「通帳 AI-OCRクラウド」です。

Shuttle Smileは、弊社のこれまでの知見をフルに活用して実現しています。生成AIを活用して通帳画像(PDFファイル)から日付、摘要、入出金、残高を抽出後、Excelファイルとしてダウンロードできるようにしています。


Chat GPTなどの生成AIに通帳の画像ファイルを渡して、「日付、摘要、出金、入金、残高をCSVファイルにしてください」と指示した場合、上手く抽出できることもあれば、そうでないこともあります。たまたま100点満点の抽出結果になる場合もありますし、そうでない場合もあります。しかし、安定して精度を確保できるようにすることは、想像以上に困難です。

▶ 何が精度に影響するのか?
認識・抽出精度に影響する要因は様々です。
・通帳の紙の質、通用をコピーした紙の質
・通帳のレイアウト、印字内容のパターン、背景画像、フォント、印字品質
・スキャナの精度(ハードウェアとしての性能、ソフトウェアとしての性能、各種設定値)
・活用する人工知能モデルの性能・特徴
・プロンプトの内容
・様々な認識・抽出精度向上策

上記の組合せにより、認識・抽出精度は大きく変化します。

認識・抽出精度を向上させるために、プロンプトを数十回程度、試作するくらいでは、安定した精度を確保することはできません。これは医薬論文や臨床検査伝票の世界でも同じなのですが、プロンプトの開発は苦労の連続です。この経験知を文章にすることは難しいのですが、今回のShuttle Smileの開発においても、これまでの経験知が非常に役立ちました。

また、プロンプトだけでは精度の確保は難しい場合もあります。Shuttle Smileにおいても、様々な工夫を行って精度の向上と安定化を実現しています。これも、これまでの経験知や税理士の経験知が非常に役立ちました。

例えば、下図の「日付とハイフンが重なる日付も認識」なども、そういった経験知を活かして認識率の向上を実現しています。


弊社のエンジニアは2019年からAIの活用に取り組んでいます。当時は生成AIという言葉はありませんでした。しかし、Google社のエンジニアが2019年に発表したBERTに将来性を感じて、弊社エンジニアがあるシステムを開発しました。そのシステムの能力の高さに感激したことが、AIに取り組むきっかけとなりました。Shuttle Smile開発のきっかけは、紙の情報を会計ソフトに手入力する苦労話を、弊社代表取締役の娘婿が経営する税理士事務所から聞いたことです。「医薬で培った紙の検査伝票の認識技術」と「最先端人工知能モデル」を活用すれば、劇的に業務が効率化できると考えてクラウドサービスShuttle Smileを開発しました。Shuttle Smileは簡単・高速・高精度・安心価格を追求しています。Shuttle Bros.株式会社は、「あったらいいな」をAIとVision Technologyで実現するテクノロジーカンパニーとして、医薬業界で培った高度な画像認識や自然言語処理技術を活用し、様々な業界のデジタルトランスフォーメーションを支援するソリューションを提供していくことを目指しています。

ご興味がございましたら、お問い合わせください。お問い合わせはこちらから。

では、また

前へ
前へ

使い勝手の良いスキャナとShuttle Smileの活用

次へ
次へ

生成AIを活用して文献にラインマーカーを引くツールを開発してみました。