サイトへ戻る

AI-OCRとは何か!?紙書類の電子化の加速する最新技術AI-OCRについて解説

昨今のAIブームは以前より少し落ち着いてきたものの、各社のAI導入事例は右肩上がりに増え続けている状況で、AIにより効率化出来る業務、効率化が難しい業務など、その傾向が少しずつ明るみに出てきているのではないかと思います。

今回、そんなAI製品の中の一つである、AI-OCRとは一体どういうものなのか、またその利用シーンについてご紹介していきます。

そもそもOCRとは何か

OCR(Optical Character Recognition)とは、日本語で言うと「光学的文字認識」というものです。簡単に言うと、紙からスキャンされた手書きの文字や、画像から文字を抽出して、テキストデータに変換する技術のことです。

意外にも歴史は古く、今のようにAIブームが来るよりもずっとずっと昔から存在していて、世界初の商用OCRシステムが出荷されたのは1953年までさかのぼります。

日本で最初にOCRシステムが製品化されたのは1968年で、郵便番号を自動的に読み取る仕組みとして導入されました。1980年代になると、大手企業や官公庁での導入事例も増えて、PC周辺機器として普及するようになってきました。

現在では、物理的な機器(ハードウェア)は不要で、ソフトウェア単体でOCR出来るものも増え、無償で利用できるものが数多く存在するようになりました。

OCRはどう便利なのか

例えば手書きの商品アンケートを大量に配布・回収した場合、紙のままではインサイトを分析出来ないので何かしらの手段でデータ化する必要があります。それを全てを手入力でやろうとすると膨大な人手と時間が必要になってしまうので、OCRで自動解析させてしまえば非常に効率的に処理することが出来ます。

それ以外には大量のテストの採点を自動化している例もあります。テストは解答用紙を定型化出来るので、従来のOCR技術でも比較的応用が出来る分野になります。

AI-OCRとは何か

AI-OCRとOCRの違いの定義は、やや曖昧なものですが、OCRに比べて、AI-OCRの方が以下のような特徴を持ちます。

  1. ディープラーニング(深層学習)により文字認識精度が向上されている
  2. 文字認識だけでなく、抽出した文字列が何のデータなのか、構造化した形で取得できる

ときおり「OCRに機械学習の技術を用いたものがAI-OCRである」という記述を目にすることがありますが、従来のOCRでもニューラルネットワークやSVMなどの機械学習の技術が利用されていますので、この定義は誤りです。

AI-OCRの精度はどのくらいか

各社AI-OCR製品は認識精度96〜99%程度を提示していることが多いです。そのまま信用するなら、人間と大差ない精度まで進化してきていると言えます。

その一方で導入を試みた企業の事例の中には、実際の業務で使用されている文書を用いると、高い精度が出せないことも少なくなく、実運用には乗らなかった例もあります。

実は、認識精度は評価方法によってある程度コントロール可能なものです。提供会社にとって都合の良いように作為的に数字を出すことも出来ますし、改善したい業務要件によっても大きく変わってきてしまいます。なので、認識精度を鵜呑みにせず、まずは実際にデモなどを試してみて、改善したい業務にフィットするのかどうか確かめることから始めるのがベターです。

AI-OCRはどんな用途で使われているか

上記で述べた、

文字認識だけでなく、抽出した文字列が何のデータなのか、構造化した形で取得できる

という特徴から、従来のOCRよりも広い範囲で利用が見込めるようになりました。

例えば、営業所と業務センター間で紙でやりとりされていた大量の注文書をAI-OCRで処理することにより、情報のデータ化をしている例や、学校法人が入学願書の読み取りにAI-OCRを利用して入試業務を効率化させている例もあります。

また、請求書の自動処理に使われている事例もあります。請求書は各社バラバラのフォーマットを使っているケースが多く、事前に定型化することが非常に難しく、従来のOCRでは自動処理することが困難でしたが、AI-OCRの登場により、異なる非定形フォーマットの請求書を解析して構造化されたデータとして取得することが可能になり、従来では手入力していた振込業務や会計業務を大幅に効率化することが可能になりました。
 

まとめ

  • OCRは紙や画像に記述されている文字列をテキストデータとして抽出する技術
  • AI-OCRは従来のOCRにディープラーニングの技術を応用して、精度を上げたり、構造化されたデータを抽出可能にする技術
  • 文字認識精度は96〜99%と提示されているが、精度に惑わされず、実際の業務で試してみて判断しよう

AI-OCRより低コストで実現!

バラバラのフォーマットの請求書を自動解析して振込データを一発抽出。振込業務自動化サービス「Toriders」

すべての投稿
×

もう少しで完了します。

あなたのメールアドレスにメールを送信しました。 読者登録の承認のため、届いたメールのリンクをクリックください。

OK