手書き伝票のAI OCRが失敗する原因と改善策｜非IT担当者向け実務ガイド

2026年4月17日

URLをコピーしました！

「伝票の『0』が『6』に読み違えられて、振込額が60万円もズレた」——AI OCRを導入した現場では、こんな失敗談をよく耳にします。
せっかく高いソフトを入れたのに、結局は人間が読み直している。原因は本当にAIの精度でしょうか。
実は、手書き伝票の誤読は「ソフト」より「紙と書き方」で8割が決まります。この記事では、まず失敗の原因を3つに切り分けて、自社のどこに問題があるのかを見つけていきます。

「0」と「6」が読めない──手書き伝票のAI OCRが失敗する3つの原因

最初に一つだけ、前提を共有させてください。AI OCRでも、個人の極端な癖字やかすれた線は読めません。 AIは「世の中の平均的な字」を学んでいるだけなので、そこから外れた字は「学習していないパターン」として取りこぼす——ここが本記事の核心です。

手書き伝票が読めない原因は、大きく3つしかありません——「書き方」「紙」「スキャン条件」です。この3層で切り分けるだけで、自社の問題がどこにあるか、一気に見えてきます。

[図解] 「書き方」「紙」「スキャン条件」の3つの原因を3つの箱で並べ、それぞれから「誤読」に矢印が伸びている構造図

原因①「書き方」──崩し字・癖字・筆圧ムラで起きる誤読

AIは「世の中の平均的な字」を学習しているので、個人の癖字や走り書きは極端に苦手です。
たとえば「0」の上をきっちり閉じない癖、「1」の頭にハネをつける癖、「7」の横棒を省く癖——こうした個性は、AIから見ると「0か6か分からない字」「1か7か区別できない字」に変わってしまいます。

筆圧ムラも大きな落とし穴です。鉛筆書き、インクが切れかけたボールペン、シャーペンで書かれた数字は、スキャンした瞬間に線がかすれ、「ただの汚れ」と区別がつかなくなります。さらに、枠からはみ出して書かれた文字は、AIが「どの項目の数字か」を判断できず、まるごと読み飛ばすことも珍しくありません。

黒ボールペン＋枠内記入が誤読を減らす最速の対策

鉛筆・シャーペン・薄いインクは原則NG。黒のボールペンで、枠内にしっかり収めて書くだけで誤読は大きく減る。

原因②「紙」──複写式・感圧紙・カーボン紙の裏写り問題

現場で意外と見落とされがちなのが「紙そのものの問題」です。
複写式伝票の2枚目・3枚目は、印字が薄くなるほど読み取り精度が落ちます。カーボン紙の裏写りは、AIから見ると「表の文字と裏の文字が重なった二重の文字」に見えてしまい、誤読の温床になるのです。

スキャンに使うのは必ず『1枚目（原本）』と覚えてください。2枚目以降は複写を重ねるごとに線が薄く、ブレて、別の文字に見えます。どうしても1枚目が手元になく2枚目しか残っていない場合は、スキャナ側で「コントラスト強め」「濃度＋2」程度に設定してから取り込む——それでも薄すぎて数字が判読できないなら、その1枚は自動化対象から外して手入力に回すほうが、誤読の後始末より早く終わります。

感圧紙（書いた圧で色が出る紙）も要注意。時間が経つと発色が薄くなり、人間ならギリギリ読めても、AIには「ほぼ白紙」と認識されてしまうことがあります。PFUのコラムでも、帳票そのものの状態が精度を左右する要素として挙げられています。

原因③「スキャン条件」──解像度・傾き・影が精度を落とす

ソフトの設定をいじる前に、まずは「AIに渡している画像」を見直してください。
スキャンの解像度が低すぎたり、用紙が傾いていたり、複合機のガラス面に影や汚れがあったり、伝票に折り目がついていたり——これらは人間でも読みづらい画像を作り出しています。

「AIが悪い」のではなく、「AIに渡している画像が悪い」。Optimaxの解説記事でも、影や歪みのない撮影・スキャンの基本を整えるだけで精度が大きく改善すると指摘されています。具体的な設定と運用は、このあとの「スキャン時の設定」でまとめて扱います。

スキャン前にやるべきこと──精度の8割は紙と書き方で決まる

ここまで読んで「じゃあ、まずどのソフトを入れ替えるか」と思った方——ちょっと待ってください。3つの原因のうち、「書き方」と「紙」は現場で最も頻繁に起きていて、しかも今日から自分で直せます。
精度を上げたいなら、ソフト設定をいじる前にやるべきことがあります。それは紙のフォーマットと書き方を直すこと。この2つで、手書き伝票の認識精度の8割が決まると言っても過言ではありません。

実際、ソフトのチューニングに2ヶ月かけても精度が出ず断念した事例も報告されています（RPAテクノロジーズ）。順番を間違えると、同じ道をたどりかねません。

ソフトをいじる前に「紙」と「書き方」を直す。この順番を守るだけで、ほぼコストゼロで精度が大きく変わる

伝票フォーマットを見直す──記入枠・区切り線・色の工夫

最も費用対効果が高い改善は、「1文字1マス」の記入枠を作ることです。
つまり、数字を書く欄を1文字ずつ独立したマスに区切ってしまう。金額欄なら7マス、日付欄なら「年」「月」「日」でそれぞれマスを分ける。たったこれだけで、「どの数字とどの数字がくっついているか」という、AIが最も苦手とする判断をまるごとスキップできます。

枠線は太めの黒線で、区切り線ははっきりと。逆に、記入位置を示す「ガイド線」は薄い水色やグレーにするのがコツです。AIは黒い線を文字の一部と誤認しがちなので、ガイド線まで濃く印刷してしまうと、それ自体がノイズになります。

項目	✕ 悪い例	○ 良い例
数字欄	1本の長い横線の上にベタ書き	1文字1マスのマス目
枠線	全部同じ濃さのグレー	記入枠は黒、ガイド線は薄色
項目の区切り	区切り線なし	項目ごとに太い区切り線
背景色	罫線のみ	淡い色の下地で記入欄を明示

[比較図] 左側に「悪い伝票例（1本線の上に数字をベタ書き）」、右側に「良い伝票例（1文字1マスの枠で区切られた記入欄）」を並べた比較図

伝票そのものを作り直すのは大仕事に聞こえますが、Excelや既存テンプレートでマス目を切り直すだけなら半日で終わります。既製の複写式伝票を使っている現場でも、PFUのコラムが指摘するように、「定型化されたフォーマット」に寄せるだけで認識率は確実に底上げされます。

書き手への3つのルール──濃く・大きく・枠内に

フォーマットを直したら、次は書き手側です。
ここで大事なのは、ルールを3つ以上に増やさないこと。「濃く・大きく・枠内に」——この3つに絞ります。4つ5つと増やした瞬間、現場では守られなくなります。

STEP

濃く

黒のボールペン必須。鉛筆・シャーペン・消せるボールペンはNG。
理由はシンプルで、薄い線はスキャン時に「紙の汚れ」と区別がつかなくなるからです。青ボールペンも色によっては読み取り精度が落ちるため、黒に統一するのが鉄則。

STEP

大きく

枠の8割以上を埋める大きさで書く。
小さく書くと線が細くなり、スキャンで潰れます。「枠の真ん中にちょこんと」ではなく、「枠いっぱいに」が正解です。

STEP

枠内に

はみ出し厳禁。数字が枠をまたぐと、AIは「どの項目の数字か」を判断できません。
書き損じた場合は、二重線で消して横に書き直す——枠の上から重ね書きするのは絶対に避けてください。

この3つを、A5サイズのカードにしてラミネート加工し、記入台に置く。これが定着の決め手です。「ルールを紙で渡しただけ」「朝礼で口頭で伝えただけ」では、3日で忘れられてしまいます。記入する場所にモノとして存在させることで、ようやく習慣になります。

ルールは「理由」とセットで伝える──それが現場定着の決め手

ルールを伝えるときは必ず理由もセットで。「鉛筆禁止」だけでなく、「鉛筆で書くと機械が読み取れず、結局あなたが入力し直す羽目になる」まで伝える。人は「自分に関係がある」とわかって初めて動きます。抽象論ではなく、書き手自身の手間が増えるという実害で語るのがポイントです。

スキャン時の設定──300dpi・傾き・裏写りを現場でどう防ぐか

紙と書き方を整えたら、次はスキャナの設定です。難しいチューニングは不要。設定画面でひとつ選び直すのと、日々のちょっとした習慣だけで、誤読は目に見えて減ります。

スキャナ設定は「300」を選ぶ──それだけで誤読が減る理由

複合機やスキャナの設定画面に「200」「300」「600」といった数字が並んでいるはずです。これはdpi——「1インチ（約2.5cm）の中に何個の点で文字を表現するか」という細かさの単位。ここで「300」を選んでください。 それだけでOKです。

200dpi以下だと、手書きの「0」と「6」のような細い線の違いが潰れます。逆に「もっと細かいほうがいいだろう」と600dpi以上を選んでも、認識精度はほぼ変わらず、ファイルサイズだけが2〜4倍に膨らむだけ。Optimaxの解説でも、文字潰れを防ぐ推奨解像度として300dpi前後が挙げられています。「300がちょうどいい」と覚えてしまえば十分です。

スキャナの設定は「300dpi」一択。これより低いと潰れる、高くてもムダに重くなるだけ

傾き・影・裏写りを防ぐスキャナ運用の工夫

設定の次は、日々の運用です。地味ですが、効く3点だけ押さえてください。

STEP

自動傾き補正をONにする

多くの機種に「傾き補正」「自動回転」の設定があります。これをONにするだけで、伝票をまっすぐ置けなかった分のズレを機械が直してくれます。

STEP

ガラス面を週1で拭く

ホコリや指紋がそのまま「黒い点」として写り、AIが「文字の一部」と誤認します。マイクロファイバーのクロスで週1回、5秒で済む作業です。

STEP

複写の2枚目は下に白紙を敷く

カーボン紙や感圧紙の2枚目以降は裏写りで誤読が起きやすいので、スキャン時に白紙を1枚下に敷くと裏側の影が消えて読みやすくなります。

「AIの精度が悪い」と諦める前に、この3点を試してみてください。設定画面とちょっとの習慣だけで、現場の手戻りはぐっと減ります。

スキャン後のリカバリー──「完璧」を諦めて仕組みで減らす

ここまで「紙と書き方とスキャン設定」の話をしてきましたが、それでも誤読はゼロになりません。世界的な調査でも、88%の企業がいまだにデータ抽出エラーに悩み、週6時間以上を「自動化したはずのデータ補正」に費やしていると報告されています（なぜほとんどのAI OCRは失敗するのか – Parseur）。この数字が教えてくれるのは、「精度100%」を目指す運用は最初から無理筋だという現実です。

そもそも、AI OCRの精度は扱うものによって相場がまったく違います。自社の数字がこのレンジのどこにあるかで、打つべき手が見えてきます。

対象	精度の目安
印字（請求書・領収書など活字）	95〜99%程度
丁寧に書かれた手書き（枠内・黒ボールペン）	90〜95%程度
一般的な手書き伝票（癖字・筆圧ムラ混在）	80〜90%程度
悪条件の手書き（複写2枚目・汚れ・かすれ）	60〜80%程度

つまり「100%を目指す」のはそもそも筋が悪く、「90%前後で運用し、残りを人が補う仕組み」をゴールに置くのが現実解です。

本当の自動化は「AIに全部任せる」ことではなく、「どこで人が確認するか」を決めること。確認ポイントの設計が勝ち筋です。

じゃあ何を目指すのか——「怪しいものだけを人間に回し、それ以外は自動で流す」仕組みです。AIに任せきりにせず、かといって全件を人間が見る運用にも戻らない。その中間の設計を、2つ紹介します。

「自信度」のついた結果だけ自動処理する仕組みを作る

主要なAI OCR製品は、読み取った文字と一緒に「自信度スコア」という数字を返してくれます。これは「AIが、この読み取り結果に何%の確信を持っているか」を表す数値です。たとえば「12,500円」という結果に95%とついていれば、AIが「ほぼ間違いない」と判断している、という意味になります。

この数字を使った王道の運用がこれ——「90%以上の項目は自動で業務システムに流し込み、90%未満の項目だけ人間が確認する」。この仕組みを組むだけで、全件を目視する地獄から解放されます。

STEP

今日からできる、自信度スコア活用の最初の一歩

最初の一歩は、AI OCRが吐き出すCSVを開いてみること。そこに「信頼度」「confidence」「スコア」といった列があるかどうか、それだけ確認してください。列があれば、次のセクションの「90%で振り分け」がすぐに組めます。製品名や画面名は後回しでOKです。自社で使っている製品のマニュアルや管理画面で「信頼度」「スコア」を検索すれば、該当する機能がほぼ必ず見つかります（主要製品はDX Suite・Tegaki・CLOVA OCRなど、ほぼ全てに搭載されています）。

IT担当者がいなくても組める「90%で振り分け」の現実解

「API連携」と聞くと身構えてしまいますが、Excelだけでも同じ仕組みはほぼ作れます。自社の状況に合わせて、下の3パターンから始めてください。

レベル	仕組み	必要なもの
初級（Excelだけ）	AI OCRがCSV出力する結果に「自信度」列があるので、Excelの条件付き書式で90%未満のセルを赤く塗る。その行だけ目視確認→転記	Excel、CSV出力機能のあるAI OCR
中級（Excelマクロ／関数）	`IF(自信度<90, "要確認", "OK")` で自動判定列を作り、オートフィルタで「要確認」のみ抽出。担当者はその行だけ開く	ExcelのIF関数
上級（RPA連携）	RPA（UiPath・Power Automateなど）で「自信度≥90なら業務システムに自動投入、<90なら確認用フォルダに振り分け」のフローを組む	RPAツール、システム連携できるAI OCR

いきなり上級を目指さず、初級から1ヶ月試す。これだけで「全件目視」から「2割だけ目視」に減り、残り時間で改善に回せます。閾値も最初から90%にこだわる必要はなく、1ヶ月運用して「95%以上にしたほうが手戻りが少ない」とわかれば上げる、「85%まで下げても品質に問題ない」とわかれば下げる。自社のデータで決めるのが一番確実です。

[図解] スキャン結果から自信度90%以上は自動で業務システムへ、90%未満は人間の確認画面へ、という分岐フローを示す図

誤認識が起きやすい項目だけダブルチェックする

「使っている製品に自信度スコアの機能がない」「あっても使いこなせない」——そんな現場でも、代わりの運用でほぼ同じ効果が出せます。それは、「金額・数量・日付の3項目だけは必ず目視する」というシンプルなルールです。

この3項目を選ぶ理由は明確で、間違えたときの被害が他の項目より桁違いに大きいからです。取引先名が1文字違っていても後から直せますが、金額の桁違いは直接お金が消えます。数量の誤読は誤発注を招き、日付のズレは納期トラブルを起こす。備考欄の多少の誤読とは重みがまるで違います。

目視確認は「金額・数量・日付」の3項目だけに絞る

全件を目視するのではなく、被害の大きい3項目だけに絞る。この引き算ができるかどうかが、運用を続けられるかの分かれ目です。

そして、ここが大事なポイント——この目視確認の作業中に、「誤認識ログ」を1〜2ヶ月つけてみてください。「0が6に読まれた」「1と7を間違えた」「”千”が”干”になった」といった誤読を、Excelでいいので一覧化するだけです。

この誤認識リストが溜まると、面白いことが起きます。「うちの現場では『0』と『6』が一番危ない」という自社固有の傾向が見えてくる。その傾向が見えたら、前のセクションで作った書き手向けの3ルールに「0は必ず下を閉じて書く」という一行を追加する。こうして、現場の失敗データが書き方ルールを鍛え、書き方ルールが誤認識を減らす——この循環が回り始めると、運用は驚くほど安定していきます。

NTT東日本のコラムでも、導入前に自社の実帳票で試し、運用を調整していく重要性が指摘されています。AIを買って終わりではなく、自社のデータでチューニングしていく運用設計こそが、精度を左右する本当の分かれ道です。

それでも精度が足りないなら──OCR製品そのものを見直す

ここまでの改善を一通り試して、それでも精度が足りない——そこで初めて、製品の乗り換えを検討する番です。判断基準はシンプルで、同じ1枚の伝票を使って、複数製品の無料トライアルを並べて試すこと。これ以上の近道はありません。カタログのスペックや導入事例ではなく、自社の実伝票で読めるかどうかが全て。3〜4製品を並行で試せば、1日で決着がつきます。

製品比較は「カタログのスペック」ではなく「自社の実伝票」で判断する。どれだけ高機能でも、手元の伝票で読めなければ意味がない。

「まず紙と書き方を直す。スキャン設定を整える。自信度で振り分ける仕組みを作る。それでダメなら製品を比較する」——この順番で進めれば、遠回りに見えて一番の近道です。明日からできる3ルール（濃く・大きく・枠内に）から、始めてみてください。

よかったらシェアしてね！