/ 記事 光学文字認識へのガイド




ご関心をお寄せいただき、ありがとうございます。 当社のインサイトをご覧ください。

You may not know it, but you have been playing a key role in helping experts decipher old and even ancient historical texts. Every time you fill out a Captcha on a website to prove that you are human, you contribute to this valuable project. Moreover, you participate in a modern text conversion technology called optical character recognition (OCR). But what is OCR? What other hidden roles does it play in your life? Here's what you need to know about this crucial cutting-edge technology.

Optical character recognition is a state-of-the-art technology that underpins dozens of tools that you use every day. Put simply, it is a type of software that "translates" scanned documents into a format that your computer can read.

Without OCR, your computer perceives each document you scan as a single image, the way we see photographs or pieces of art. In that format, your computer cannot recognize individual letters, words, or phrases. This limits the ways that your computer, and therefore you and other users, can interact with the document.

OCR scan software allows your computer to "see" a scanned document the same way it sees text-based documents you might create in Word, Excel, or equivalent programs. This enables your computer and, as a result, you to engage with scanned documents the same way that you would with original digital documents. This includes:

  • Using search functions
  • Editing
  • Using comparison and analysis tools
  • Processing, storing, retrieving, and sharing information

Optical character recognition can be used to translate text that is printed, and includes two related processes designed to capture handwriting and human-marked data:

  • Intelligent character recognition (ICR): The process of capturing and translating hand-printed and written characters such as on structured forms
  • Optical mark recognition (OMR): The process of capturing human-marked data from document forms such as multiple-choice surveys, questionnaires, and tests in the form of lines or shaded areas

Together, these recognition software solutions are useful in a wide array of applications and situations.


1. 拡張機能
OCRソフトウェアがドキュメントを間違いなく翻訳できるように、業界をリードするKodak Alaris のパーフェクトページテクノロジーなどの画像エンハンスソフトウェアが、まずスキャンを「クリーンアップ」し、ドキュメント上の不要なノイズを低減し、データを増強します。画像が鮮明であればあるほど、翻訳は良いものかつ正確なものとなるため、パーフェクトページテクノロジーは以下のような一般的なスキャンおよびドキュメントのエラーまたは問題を自動的に見つけたり訂正したりします。

  • 傾いたまたは歪んだスキャンの調整
  • コンピュータの「表示」で点、線、およびその他の印刷上の欠陥を取り除く
  • 染みおよびその他の印刷されないページ上の欠陥を補う
  • 欄、画像、表、およびその他のフィーチャーのレイアウトを分析

パーフェクトページテクノロジーはKodak Alarisスキャナーのポートフォリオに組み込まれており、可能な限り小さなファイルサイズを作成する一方で、データの明瞭さを最適化しOCR精度を最大化します。その結果、Kodak Alarisのスキャナーは競合相手より20~70%速い* OCR読み取り速度を提供し、競合デバイスのおよそ半分のファイルサイズを作成します。

2. 分類

OCR、ICR、およびOMRにより、Kodak Capture ProおよびKodak Info Input Solutionなどのキャプチャソフトウェアがどの種類のドキュメントが取り込まれたのかを判断できます。続いて、ソフトウェアは画像を取得してドキュメントの内容、ドキュメントのレイアウト、バーコード、またはインデックス作成データに基づいて分類規則を実施します。

分類は、ドキュメントが例えば、請求書、患者記録、融資ファイル、または納税記録かどうかを判断します。そして、当社のInfo Input Solutionは、ドキュメントの分類が「できるように」たった1つまたは2つのサンプルで高度なドキュメントキャプチャを行うことができます。

Kodak Alarisは、特許を取得した機械学習アルゴリズムを通じてこれを達成しました。システムは、コンテンツ、画像、バーコードの検索、および1つのドキュメントのマージなどデータを分類するために様々な技法を使用します。分類する何らかのドキュメントにおけるシステムの信頼性が低い場合、確認のために人間のオペレーターを要請することができます。これはちょうどコンピューターがCaptchaを使用して解読できない古いテキストを確認するよう要請されるようなものです。

3. データの抽出
OCR プロセスにおける最後の手順は、データの抽出です。


Kodak Alarisのソフトウェアソリューションは、パターンおよびフィーチャー認識機能を使用して文書内のテキストを特定することができます。スキャン中の言語を特定し、テキストを個々の文字、単語、文章、および段落にソートします。



Why OCR Matters

OCR technology offers reams of benefits in both the personal and professional spheres. Optical character recognition software makes it possible to translate printed text from almost any material and:

    Search your documents, including scanned copies of out-of-print books and other texts
  • Analyze, edit, and compare scanned documents quickly and accurately
  • Share information that you otherwise could not
  • Apply text-to-speech software to scanned documents, making them accessible to audiences that otherwise could not read them
  • Store documents in more compact forms and keep inexpensive digital backups of important documents
  • Process documents digitally in real-time for security and authentication purposes
  • Reduce the need for time-consuming and error-prone data entry in the workplace
  • Upload historical documents to searchable genealogy databases online

Whether you realize it or not, you use many of these functionalities each day. You also benefit from other people and organizations applying it, as well. For example, police use of OCR technology to identify license plates helps them keep us safe. Banks' use of digital signature recognition, a form of OCR, prevents would-be identity thieves from accessing and spending your money.

Service providers in a range of industries can offer you better pricing and faster service because they are able to use OCR to scan, upload, compare, and edit contracts instead of paying individual people to do each of those steps. Whenever you use an app such as Google Translate to translate a sign or label while traveling, you benefit from OCR.

OCR in the Workplace

OCR can be particularly beneficial in the workplace. For example, companies can scan existing documents through OCR software and instantly turn them into formats compatible with text-to-speech programs.

This can help businesses meet ADA compliance standards without needing years of time and tremendous amounts of money and staff hours to get there. It also enables companies to meet the needs of sight-impaired customers in real time.

In other industries, such as health care, OCR technology can literally save lives. Scan software for OCR can make the enormous amount of information in a patient's medical history savable, searchable, and verifiable in ways that improve accessibility and prevent dangerous errors.

Kodak AlarisとOCR

Kodak Alarisは、個人用であれ専門家用であれ、ドキュメントのスキャンにおいてOCRが果たす重要な役割を理解しています。そのため、すべてのスキャナーに無料で高度なOCRソフトウェアを提供しています。


Kodak AlarisのOCRスキャンソフトウェアは、以下のことに対してお客様を支援してきました。

  • ビジネスの成長
  • 革新
  • 節約
  • 効率を上げる
  • サービスと顧客満足度を向上させる
  • 環境フットプリントを最小限に抑える

当社の技術は、一流の技術支援プログラムに支えられ、購入によって毎回最大限のメリットを得られるようになっています。Kodak Alarisの個人向けまたは専門家向けアプリケーションに関心があるかどうかにかかわらず、当社は適切なハードウェアソフトウェア、およびサポートソリューションを提供します。


Learn More

Optical character recognition software from Kodak Alaris takes your scanning from basic to brilliant. Visit a local reseller partner to learn more about what software and scanners from Kodak Alaris can offer you today.

*Based on 3rd Party testing performed by BLI and commissioned by Kodak Alaris. Test was designed by Kodak Alaris with all devices tested in similar operational conditions and where tested with similar operational methods.


Alaris Capture Pro

Capture Pro ソフトウェア

  • 紙を多用するビジネスでの用途に最適
  • ECMシステムとの広範囲にわたる統合
  • ネットワークモジュールおよびインポートモジュールが利用可能
smart touch

Smart Touch Technology

  • ワンタッチのシンプルさで複雑な複数の手順のスキャンプロセスを排除
  • 特定のスキャンニーズに合わせて最大20の異なる機能を設定
  • ドキュメントをファイルの場所または一般的なクラウドサービスに簡単にスキャン
Info Input Screen

Info Input Solution

  • エンタープライズ規模の大企業のお客様に最適
  • ビジネスアプリケーションとの統合
  • モバイルモジュールのオプション



Kodak Alarisのプライバシーポリシーを見る