/ Artikel Leitfaden für die optische Zeichenerkennung (OCR):

Erfahren Sie, was OCR ist, wie es funktioniert und warum es für unser privates und berufliches Leben so wichtig ist.

Sie möchten noch mehr?

Füllen Sie dieses Formular aus, um mehr zu erfahren.

Vielen Dank für Ihr Interesse. Profitieren Sie von unserem Wissen.

You may not know it, but you have been playing a key role in helping experts decipher old and even ancient historical texts. Every time you fill out a Captcha on a website to prove that you are human, you contribute to this valuable project. Moreover, you participate in a modern text conversion technology called optical character recognition (OCR). But what is OCR? What other hidden roles does it play in your life? Here's what you need to know about this crucial cutting-edge technology.

Optical character recognition is a state-of-the-art technology that underpins dozens of tools that you use every day. Put simply, it is a type of software that "translates" scanned documents into a format that your computer can read.

Without OCR, your computer perceives each document you scan as a single image, the way we see photographs or pieces of art. In that format, your computer cannot recognize individual letters, words, or phrases. This limits the ways that your computer, and therefore you and other users, can interact with the document.

OCR scan software allows your computer to "see" a scanned document the same way it sees text-based documents you might create in Word, Excel, or equivalent programs. This enables your computer and, as a result, you to engage with scanned documents the same way that you would with original digital documents. This includes:

  • Using search functions
  • Editing
  • Using comparison and analysis tools
  • Processing, storing, retrieving, and sharing information

Optical character recognition can be used to translate text that is printed, and includes two related processes designed to capture handwriting and human-marked data:

  • Intelligent character recognition (ICR): The process of capturing and translating hand-printed and written characters such as on structured forms
  • Optical mark recognition (OMR): The process of capturing human-marked data from document forms such as multiple-choice surveys, questionnaires, and tests in the form of lines or shaded areas

Together, these recognition software solutions are useful in a wide array of applications and situations.

Wie funktioniert OCR?

1. Verbesserung
Damit eine OCR-Software ein Dokument erfolgreich übersetzen kann, wird eine Bildverbesserungssoftware wie die branchenführende Perfect Page Technologie von Kodak Alaris Ihre Scans zunächst „bereinigen“, um unnötiges Farbrauschen auf einem Dokument zu reduzieren und die Daten klarer darszustellen. Je sauberer das Bild, desto besser und genauer die Übersetzung. Daher sucht und korrigiert die Perfect Page Technologie automatisch gängige Scan- und Dokumentenfehler oder Probleme wie z. B.:

  • Abgleich für schräge oder verzerrte Scans
  • Entfernen von Flecken, Linien und anderen Druckfehlern nach „Ansicht“ des Computers
  • Kompensieren von Flecken und anderen nicht gedruckten Unregelmäßigkeiten auf der Seite
  • Analysieren des Layouts von Spalten, Bildern, Tabellen und anderen Funktionen

Die Perfect Page Technologie ist in das Kodak Alaris Portfolio von Scannern integriert ist, um die Datenklarheit zu optimieren und die OCR-Genauigkeit zu maximieren, während gleichzeitig die kleinstmöglichen Dateigrößen erzeugt werden. Das Ergebnis: Scanner von Kodak Alaris bieten eine um 20-70 % bessere* OCR-Leserate als die Konkurrenz und erzeugen Dateigrößen, die fast halb so groß sind wie die von Konkurrenzgeräten.

2. Klassifizierung:
Sobald die Daten konvertiert und erweitert sind, besteht der nächste Schritt im OCR-Prozess darin, zu erkennen, welcher Dokumententyp in das System gelangt ist, und den nächsten Schritt für diesen Dokumententyp zu bestimmen.

OCR, ICR und OMR ermöglichen es Erfassungssoftware wie Kodak Capture Pro und Kodak Info Input Solution zu bestimmen, welche Art von Dokument eingelesen wurde. Dann kann die Software die Bilder nehmen und Klassifizierungsregeln auf der Basis von Dokumenteninhalt, Dokumentenlayout, Barcodes oder Indexierungsdaten durchsetzen.

Anhand der Klassifizierung wird ermittelt, ob es sich bei einem Dokument z. B. um eine Rechnung, eine Patientenakte, eine Darlehensakte oder einen Steuerdatensatz handelt. Unsere Info Input Solution kann zudem eine erweiterte Dokumentenerfassung mit nur einer oder zwei Vorlagen durchführen, um die Klassifizierung der Dokumente zu „erlernen“.

Kodak Alaris erreicht dies über patentierte maschinelle Lernalgorithmen. Das System nutzt eine Vielzahl von Techniken zur Klassifizierung der Daten: Suchinhalte, Bilder, Barcodes und die Zusammenführung zu einem Dokument. Wenn das System nur ein geringes Vertrauen in ein Dokument hat, das es zu klassifizieren versucht, kann der Prozess einen menschlichen Bediener zur Bestätigung heranziehen - so wie wir aufgefordert werden, alte Texte, die Computer nicht entziffern können, mit Captcha zu verifizieren.

3. Datenextraktion
Der letzte Schritt im OCR-Prozess ist die Datenextraktion.

Das Extrahieren der wichtigsten Informationen aus einem Dokument für deren Verwendung als Metadaten oder Indexdaten ist von entscheidender Bedeutung für das Abrufen und Verarbeiten. Eine automatisierte, auf Regeln basierende Klassifizierung informiert das System darüber, welche Schlüsselinformationen in einem Dokument vorhanden sein sollten und häufig auch darüber, wo diese Informationen zu finden sein sollten.

Softwarelösungen von Kodak Alaris können den Text in Ihrem Dokument mithilfe von Muster- und Merkmalserkennung identifizieren. Sie identifizieren die Sprache des zu scannenden Dokuments und sortieren den Text in einzelne Buchstaben, Wörter, Sätze und Absätze.

Danach extrahiert die Software die Informationen und erstellt eine Kopie davon, um sie als Metadaten für die nächste Phase des Prozesses zu verwenden. Im Falle von Dokumenten können Metadaten verwendet werden, um Dokumente zu sortieren, zu suchen und/oder in eine andere Art von Geschäftssystem einzuspeisen.

Mit diesen Lösungen können Sie die Daten auf der Grundlage von Geschäftsregeln und Informationen, die ein Unternehmen benötigt, durch Datenbankabfragen extrahieren. Benutzer können den Indexierungsprozess so einrichten, dass Schlüsseldaten automatisch aus Dokumenten extrahiert werden (über Strichcode, OCR, ICR oder OMR), wodurch die Verarbeitungszeit verkürzt wird.

Why OCR Matters

OCR technology offers reams of benefits in both the personal and professional spheres. Optical character recognition software makes it possible to translate printed text from almost any material and:

    Search your documents, including scanned copies of out-of-print books and other texts
  • Analyze, edit, and compare scanned documents quickly and accurately
  • Share information that you otherwise could not
  • Apply text-to-speech software to scanned documents, making them accessible to audiences that otherwise could not read them
  • Store documents in more compact forms and keep inexpensive digital backups of important documents
  • Process documents digitally in real-time for security and authentication purposes
  • Reduce the need for time-consuming and error-prone data entry in the workplace
  • Upload historical documents to searchable genealogy databases online

Whether you realize it or not, you use many of these functionalities each day. You also benefit from other people and organizations applying it, as well. For example, police use of OCR technology to identify license plates helps them keep us safe. Banks' use of digital signature recognition, a form of OCR, prevents would-be identity thieves from accessing and spending your money.

Service providers in a range of industries can offer you better pricing and faster service because they are able to use OCR to scan, upload, compare, and edit contracts instead of paying individual people to do each of those steps. Whenever you use an app such as Google Translate to translate a sign or label while traveling, you benefit from OCR.

OCR in the Workplace

OCR can be particularly beneficial in the workplace. For example, companies can scan existing documents through OCR software and instantly turn them into formats compatible with text-to-speech programs.

This can help businesses meet ADA compliance standards without needing years of time and tremendous amounts of money and staff hours to get there. It also enables companies to meet the needs of sight-impaired customers in real time.

In other industries, such as health care, OCR technology can literally save lives. Scan software for OCR can make the enormous amount of information in a patient's medical history savable, searchable, and verifiable in ways that improve accessibility and prevent dangerous errors.

Kodak Alaris und OCR

Kodak Alaris weiß um die entscheidende Rolle, die OCR beim Scannen Ihrer Dokumente spielt, seien sie privat oder beruflich. Deshalb liefern wir mit jedem Scanner eine kostenlose und erweiterte OCR-Software.

Unsere Scanner sind so konzipiert, dass sie sich nahtlos in Ihre anderen digitalen Werkzeuge integrieren lassen. Von intelligenten Geräten über Apps bis hin zu alten Klassikern wie E-Mail - unsere Programme arbeiten mit all Ihren digitalen Infrastrukturen. Wir machen es Ihnen leicht, Informationen zu verschieben, zu speichern und weiterzugeben, ganz gleich, wie oder wo sie in Ihr System gelangen.

OCR-Scansoftware von Kodak Alaris hat unseren Kunden geholfen:

  • ihr Unternehmen wachsen zu lassen
  • bei innovativen Themen
  • Kosten einzusparen
  • die Effizienz zu erhöhen
  • Service und Kundenzufriedenheit zu verbessern
  • ihren ökologischen Fußabdruck zu minimieren

Unsere Technologie wird durch unser erstklassiges technisches Hilfsprogramm unterstützt, das sicherstellt, dass Sie jedes Mal das Beste aus Ihrem Kauf herausholen. Egal, ob Sie sich für Kodak Alaris für private oder professionelle Anwendungen interessieren, wir haben die richtige Hardware, Software und Support-Lösungen für Sie.

Hierzu: Wie Alaris für Innovationen in der Scantechnologie sorgt

Learn More

Optical character recognition software from Kodak Alaris takes your scanning from basic to brilliant. Visit a local reseller partner to learn more about what software and scanners from Kodak Alaris can offer you today.

*Based on 3rd Party testing performed by BLI and commissioned by Kodak Alaris. Test was designed by Kodak Alaris with all devices tested in similar operational conditions and where tested with similar operational methods.

Verwandte Lösungen

Alaris Capture Pro

Capture Pro Software

  • Ideal für papierintensive Geschäftsanwendungen
  • Umfassende Integration in ECM-Systeme
  • Netzwerk- und Importmodule verfügbar
smart touch

Smart Touch-Technologie

  • Komplizierte Multi-Step-Scan-Prozesse mit One-Touch-Einfachheit beseitigen
  • Konfigurierung von bis zu 20 verschiedene Funktionen, um Ihre spezifischen Scananforderungen zu erfüllen
  • Einfaches Einscannen von Dokumenten an einen Speicherort oder gängige Cloud-Dienste
Info Input Screen

Info Input Solution

  • Ideal für große Unternehmen
  • In Geschäftsanwendungen integrierbar
  • Mobile Moduloption

Kontakt

Um uns zu kontaktieren, füllen Sie unser unten stehendes Informationsanforderungsformular aus und wir werden uns in Kürze mit Ihnen in Verbindung setzen.

Datenschutzrichtlinie von Kodak Alaris anzeigen