/ 記事 光学文字認識へのガイド

OCRとは何か、その仕組み、そしてOCRが私たちの私生活および職業生活に非常に重要である理由を学びましょう。

他に何が必要ですか?

フォームに記入し、完全な洞察を表示します。

ご関心をお寄せいただき、ありがとうございます。 当社のインサイトをご覧ください。

You may not know it, but you have been playing a key role in helping experts decipher old and even ancient historical texts. Every time you fill out a Captcha on a website to prove that you are human, you contribute to this valuable project. Moreover, you participate in a modern text conversion technology called optical character recognition (OCR). But what is OCR? What other hidden roles does it play in your life? Here's what you need to know about this crucial cutting-edge technology.

Optical character recognition is a state-of-the-art technology that underpins dozens of tools that you use every day. Put simply, it is a type of software that "translates" scanned documents into a format that your computer can read.

Without OCR, your computer perceives each document you scan as a single image, the way we see photographs or pieces of art. In that format, your computer cannot recognize individual letters, words, or phrases. This limits the ways that your computer, and therefore you and other users, can interact with the document.

OCR scan software allows your computer to "see" a scanned document the same way it sees text-based documents you might create in Word, Excel, or equivalent programs. This enables your computer and, as a result, you to engage with scanned documents the same way that you would with original digital documents. This includes:

  • Using search functions
  • Editing
  • Using comparison and analysis tools
  • Processing, storing, retrieving, and sharing information

Optical character recognition can be used to translate text that is printed, and includes two related processes designed to capture handwriting and human-marked data:

  • Intelligent character recognition (ICR): The process of capturing and translating hand-printed and written characters such as on structured forms
  • Optical mark recognition (OMR): The process of capturing human-marked data from document forms such as multiple-choice surveys, questionnaires, and tests in the form of lines or shaded areas

Together, these recognition software solutions are useful in a wide array of applications and situations.

OCRの動作

1. 拡張機能
OCRソフトウェアがドキュメントを間違いなく翻訳できるように、業界をリードするKodak Alaris のパーフェクトページテクノロジーなどの画像エンハンスソフトウェアが、まずスキャンを「クリーンアップ」し、ドキュメント上の不要なノイズを低減し、データを増強します。画像が鮮明であればあるほど、翻訳は良いものかつ正確なものとなるため、パーフェクトページテクノロジーは以下のような一般的なスキャンおよびドキュメントのエラーまたは問題を自動的に見つけたり訂正したりします。

  • 傾いたまたは歪んだスキャンの調整
  • コンピュータの「表示」で点、線、およびその他の印刷上の欠陥を取り除く
  • 染みおよびその他の印刷されないページ上の欠陥を補う
  • 欄、画像、表、およびその他のフィーチャーのレイアウトを分析

パーフェクトページテクノロジーはKodak Alarisスキャナーのポートフォリオに組み込まれており、可能な限り小さなファイルサイズを作成する一方で、データの明瞭さを最適化しOCR精度を最大化します。その結果、Kodak Alarisのスキャナーは競合相手より20~70%速い* OCR読み取り速度を提供し、競合デバイスのおよそ半分のファイルサイズを作成します。

2. 分類
データが変換されてエンハンスされると、OCRプロセスの次の手順は、どのドキュメントの種類がシステムに入っているのかを理解し、そのドキュメントの種類に対する次の手順を決定することです。

OCR、ICR、およびOMRにより、Kodak Capture ProおよびKodak Info Input Solutionなどのキャプチャソフトウェアがどの種類のドキュメントが取り込まれたのかを判断できます。続いて、ソフトウェアは画像を取得してドキュメントの内容、ドキュメントのレイアウト、バーコード、またはインデックス作成データに基づいて分類規則を実施します。

分類は、ドキュメントが例えば、請求書、患者記録、融資ファイル、または納税記録かどうかを判断します。そして、当社のInfo Input Solutionは、ドキュメントの分類が「できるように」たった1つまたは2つのサンプルで高度なドキュメントキャプチャを行うことができます。

Kodak Alarisは、特許を取得した機械学習アルゴリズムを通じてこれを達成しました。システムは、コンテンツ、画像、バーコードの検索、および1つのドキュメントのマージなどデータを分類するために様々な技法を使用します。分類する何らかのドキュメントにおけるシステムの信頼性が低い場合、確認のために人間のオペレーターを要請することができます。これはちょうどコンピューターがCaptchaを使用して解読できない古いテキストを確認するよう要請されるようなものです。

3. データの抽出
OCR プロセスにおける最後の手順は、データの抽出です。

メタデータまたはインデックスデータとしてドキュメントから最も重要な情報を抽出することは、検索および処理にとって極めて重要です。規則に基づいた自動分類は、どの主要情報が文書内に存在すべきで、多くの場合、この情報がどこに配置されるべきかをシステムに伝達します。

Kodak Alarisのソフトウェアソリューションは、パターンおよびフィーチャー認識機能を使用して文書内のテキストを特定することができます。スキャン中の言語を特定し、テキストを個々の文字、単語、文章、および段落にソートします。

次に、その情報を展開しコピーを作成して、プロセスの次の段階のメタデータとして使用します。ドキュメントの場合、メタデータはドキュメントを整理、検索、および/または別の種類の業務システムに給紙するために使用できます。

これらのソリューションを使用して、データベースの検索を通じて企業が必要とする業務上の規則および情報に基づいてデータを抽出することができます。インデクシングプロセスをセットアップして、ドキュメントから主要データを自動的に抽出し(バーコード、OCR、ICR、またはOMRを使用)、処理時間を短縮することができます。

Why OCR Matters

OCR technology offers reams of benefits in both the personal and professional spheres. Optical character recognition software makes it possible to translate printed text from almost any material and:

    Search your documents, including scanned copies of out-of-print books and other texts
  • Analyze, edit, and compare scanned documents quickly and accurately
  • Share information that you otherwise could not
  • Apply text-to-speech software to scanned documents, making them accessible to audiences that otherwise could not read them
  • Store documents in more compact forms and keep inexpensive digital backups of important documents
  • Process documents digitally in real-time for security and authentication purposes
  • Reduce the need for time-consuming and error-prone data entry in the workplace
  • Upload historical documents to searchable genealogy databases online

Whether you realize it or not, you use many of these functionalities each day. You also benefit from other people and organizations applying it, as well. For example, police use of OCR technology to identify license plates helps them keep us safe. Banks' use of digital signature recognition, a form of OCR, prevents would-be identity thieves from accessing and spending your money.

Service providers in a range of industries can offer you better pricing and faster service because they are able to use OCR to scan, upload, compare, and edit contracts instead of paying individual people to do each of those steps. Whenever you use an app such as Google Translate to translate a sign or label while traveling, you benefit from OCR.

OCR in the Workplace

OCR can be particularly beneficial in the workplace. For example, companies can scan existing documents through OCR software and instantly turn them into formats compatible with text-to-speech programs.

This can help businesses meet ADA compliance standards without needing years of time and tremendous amounts of money and staff hours to get there. It also enables companies to meet the needs of sight-impaired customers in real time.

In other industries, such as health care, OCR technology can literally save lives. Scan software for OCR can make the enormous amount of information in a patient's medical history savable, searchable, and verifiable in ways that improve accessibility and prevent dangerous errors.

Kodak Alaris and OCR

Kodak Alaris understands the critical role OCR plays in scanning your documents, be they personal or professional. That's why we provide free and advanced OCR software with every scanner.

Our scanners are designed to integrate seamlessly with your other digital tools. From smart devices to apps to old standbys like email, our programs work with all of your digital infrastructures. We make it easy to move, store, and share information, no matter how or where it enters your system.

OCR scanning software from Kodak Alaris has helped our clients:

  • Grow their businesses
  • Innovate
  • Save money
  • Increase efficiency
  • Improve service and customer satisfaction rates
  • Minimize their environmental footprints

 

Our technology is backed by our top-notch technical assistance program, ensuring that you get the most out of your purchase every time. Whether you are interested in Kodak Alaris for personal or professional applications, we have the right hardware, software, and support solutions for you.

Related: How Alaris Innovates With Scanning Technology

Learn More

Optical character recognition software from Kodak Alaris takes your scanning from basic to brilliant. Visit a local reseller partner to learn more about what software and scanners from Kodak Alaris can offer you today.

*Based on 3rd Party testing performed by BLI and commissioned by Kodak Alaris. Test was designed by Kodak Alaris with all devices tested in similar operational conditions and where tested with similar operational methods.

関連ソリューション

Alaris Capture Pro

Capture Pro ソフトウェア

  • 紙を多用するビジネスでの用途に最適
  • ECMシステムとの広範囲にわたる統合
  • ネットワークモジュールおよびインポートモジュールが利用可能
smart touch

Smart Touch Technology

  • ワンタッチのシンプルさで複雑な複数の手順のスキャンプロセスを排除
  • 特定のスキャンニーズに合わせて最大20の異なる機能を設定
  • ドキュメントをファイルの場所または一般的なクラウドサービスに簡単にスキャン
Info Input Screen

Info Input Solution

  • エンタープライズ規模の大企業のお客様に最適
  • ビジネスアプリケーションとの統合
  • モバイルモジュールのオプション

連絡先

お問い合わせは、下記の情報リクエストフォームにご記入ください。すぐにご連絡いたします。

Kodak Alarisのプライバシーポリシーを見る