サイトへ戻る

無料でPDFファイルをOCR出来るソフト・サービス5選

2020年10月に改正・施工される電子帳簿保存法により、これまでより請求書や契約書などの国税関係帳簿書類を紙ではなく電子データとして保存し、ペーパーレス化が推進することが予想されます。

すると、必然的に紙で受領した書類をスキャナにかけて電子データ(PDF)に変換するというオペレーションが増えていきますが、スキャンされたPDFファイルにはテキストデータが付与されていないため、実際に振込処理や会計処理を行うタイミングでどうしても手入力しなければならず、せっかく電子データ化しても、こういった非生産的な業務が残されてしまいます。

今回は、無料でPDFファイルにOCR(光学的文字認識)をかけてテキストを抜き出すことが出来るソフトを5つ紹介します。海外製のWEBサービスが多いので、コンプライアンスを鑑みて、ご利用は自己責任でお願いいたします。

解析に使用する請求書(PDFファイル)

PDF Candy

https://pdfcandy.com/jp/pdf-ocr.html

  • 複数ファイル一括でOCRすることは出来ない
  • 日本語以外にも、英語をはじめ、ドイツ語やフランス語など主要な外国語も対応している
  • 紙からスキャンされたPDFファイルの解析精度は低い
  •  Icecream Appsというところが提供しているサービス。WEBサイトを見てもどこの国の企業なのか分からなかったが、PDFファイルに関するソフトや、ビデオ編集などのをソフトを提供している。特に怪しい印象もなく、個人レベルで使う分には差し支えなさそう。
  • 設立5期目前後の企業

PDF解析結果

20ー9年06月 25日
請求番号: 20ー90625-027
請求害
` 払 s: 株式会社m。fm。f
件名: ヒツジのぬいぐるみ製造費用 稟蓋纂窪暑』桜丘M]0
下記のとぉりご請求申 し上げます。 渋谷〕_プ4。3
お支払い期限 : 20ー9年07月 20 日












髑髏 nun
—"
—--m
_mmm
—---
—---
—---
—---
—---
—---
—---
_-
_-
ぉ振込先‥
三菱UFJ銀行 赤羽駅前支店(ー77)普通2222222 もふもふ株式会社

Toriders

https://lp.toriders.app/

  • ただOCRをかけるのではなく、請求書に特化して、PDFファイルから自動的に振込データに変換出来るサービス。
  • 無料トライアル期間もあるので、無料で試してみることが出来る。
  • 日本の企業であるmofmof inc.が運営しているサービス。海外製ではないので安心して利用できる。
  • 口座情報や金額など、振込に関係する情報の解析精度は最も高い

PDF24 Tools

https://tools.pdf24.org/ja/ocr-pdf

  • 複数ファイルを一括でOCRできたが、かなり処理に時間がかかった。
  • 言語設定は日本語縦書きを含め、かなりの数の外語語に対応している。パッと見で100は超えている。
  • OCRした結果をテキストとして出力してくれる方式ではなく、テキスト情報を付与したPDFファイルを出力してくれる。つまりスキャンした書類を検索可能なPDFファイルにしてくれる。
  • しかし、OCRの過程で単語間にスペースが入ったりしていて、思うように検索出来る形ではなかった。
  • 運営している企業はドイツにあるpdf24.orgという会社で、PDFクリエイターというツールや、オンラインでPDFの編集や圧縮、編集などが出来るツールを提供している。
  • The PDF Sheepという可愛い(?)羊のマスコットがいる。
  • 特に怪しい印象はなかったので、個人利用する分には問題なさそう。
  • 精度は微妙なところ。

PDF解析結果(PDFファイルのテキスト部分をコピー)

株式 会社林 1人mofmf 件名 : ヒツジのぬい ぐる み製造費用 東和区本14.10 下記のと お り ご 請求申し 上げま す 。 洪谷 コー プ03 ご請求金額 \3,250,800- お支払い期: 2019年07月20 日 2019年06月25 日 請求番号: 20190625-027 品番 ・ 品名 数量 単価 金額 設計費 1 式 1,000,000 1.000,000 製造費 1.000 個 2.000 2.000,000 配送費 1 式 10,000 10,000 小計 3,010,000 消費(8%) 240,800 合計 3,250,800 お振込 : 三菱UFJ銀行 赤羽駅前支店(177) 普通 2222222 もふもふ株式会社

Adobe Acrobat Pro DC

https://acrobat.adobe.com/jp/ja/acrobat/how-to/ocr-software-convert-pdf-to-text.html

  • クラウドではなくデスクトップアプリケーションなので、事前にインストールが必要
  • 無料版のAcrobat DCだとOCR機能が使えないので、Acrobat Pro DCが必要。7日間無料で体験出来る。
  • 7日の体験期間中に解約しないと費用がかかってしまうで注意が必要。
  • こちらもPDF内のテキストを出力するのではなく、PDFファイル自体にテキスト情報を付与する方式。
  • 上記のPDF24 Toolsではうまく解析出来なかった部分もきっちり解析出来ている。さすがは有償ツール。
  • 直接PDFファイルからテキストだけを抜き出すという仕組みは見当たらなかった。
  • 精度はかなり高い。一部シャープ記号が入り込んでいたり、小さく表示されているロゴの部分はうまく解析出来ていないが、他に比べると優秀だと思う。

PDF解析結果

## ほげほげ株式会社様
件名:ヒッジのぬいぐるみ製造費用
下記のとおりご請求申し上げます。
# 請求書
株式会社### mofmof
〒150-0031
東京都渋谷区桜丘14-10
渋谷コープ403
### ご請求金額
## ¥ 3,250,800 -
お支払い期限: 2019年07月20日
品蕃・品名数量
設計費1式
製造費1,000個
配送費1式
小計
消費税(8%)
合計
お振込先:
三菱UFJ銀行赤羽駅前支店(177)普通2222222もふもふ株式会社
2019年06月25日
請求番号: 20190625-027
単価金額
1,000,000 1,000,000
2,000 2,000,000
10,000 10,000
3,010,000
240,800
3,250,800
鬱MISOCa 請求●作成サーピス

ONLINE OCR

  • サインアップするとZIPファイル形式のアップロードすることで、一括で解析出来るようになる。
  • 同様にサインアップすると、複数ページを含むPDFファイルも対応可能になる。
  • 対応言語数はそこそこで46言語に対応している。もちろん日本語も。
  • 出力形式は、docx, xlsx, txtの3種類が選択できる。
  • PDFファイルだけでなく、PNGやJPEGなどの画像形式のファイルでも対応している。
  • 精度は微妙なところ。表形式の部分が苦手。
  • 利用規約にもプライバシーポリシーにも、誰が運営しているかは明記されておらず、素性が分からなかった。あんまり積極的に利用しない方が懸命。

PDF解析結果

2019年06月25日 請求番号:20190625-027
請求書

株式会社mofmof
件名:ヒツジのぬいぐるみ製造費用
下記のとおりご請求申し上げます。
〒150-0031 東京都渋谷区桜丘14-10 渋谷コープ403
ご請求金額 お支払い期限:2019年07月20日
¥3,250,800-
品番・品名 数量 単価 金“1 設計費 1式 1,000,000 0 0 0 』一 0 0 0 1山 製造費 1,000個 2,000 0 0 0 曲一 0 0 0 1山 配送費 1式 10,000 0 0 0 』J 0 1 」 」 I)、計 0 0 0 『J 0 1 0 っ-I 消費税(8%) 0 0 8 』J 0 4 2 合計 3,250,800
お振込先: 三菱UFJ銀行赤羽駅前支店(177}普通2222222 もふもふ株式会社
P MISaCa.鵬求t作成サービス

PDFelement

https://pdf.wondershare.jp/

  • クラウドサービスではないので事前にインストールが必要。
  • 無料で使い続けることは出来るが、保存したPDFファイルに透かしが入る。
  • 十分に利用するには無料でユーザー登録する必要がある。
  • テキストのコピーが出来なかったのでテキストは貼れないが、精度はかなり高い。Acrobat Reader同様、小さいロゴ部分以外はほぼ正確に抽出出来ている。

PDFの請求書を自動解析、振込業務自動化サービスToriders

Toridersは、支払い業務を自動化してくれるクラウドサービスです。PDFの請求書をアップロードするだけでAIが自動解析し、振込に必要な口座情報や金額を自動抽出してくれるため、手入力の必要がなくなり、大幅な業務効率化を実現します。

すべての投稿
×

もう少しで完了します。

あなたのメールアドレスにメールを送信しました。 読者登録の承認のため、届いたメールのリンクをクリックください。

OK