Erfahren Sie, was OCR ist, wie es funktioniert und warum es für unser privates und berufliches Leben so wichtig ist.
Füllen Sie dieses Formular aus, um mehr zu erfahren.
You may not know it, but you have been playing a key role in helping experts decipher old and even ancient historical texts. Every time you fill out a Captcha on a website to prove that you are human, you contribute to this valuable project. Moreover, you participate in a modern text conversion technology called optical character recognition (OCR). But what is OCR? What other hidden roles does it play in your life? Here's what you need to know about this crucial cutting-edge technology.
Optical character recognition is a state-of-the-art technology that underpins dozens of tools that you use every day. Put simply, it is a type of software that "translates" scanned documents into a format that your computer can read.
Without OCR, your computer perceives each document you scan as a single image, the way we see photographs or pieces of art. In that format, your computer cannot recognize individual letters, words, or phrases. This limits the ways that your computer, and therefore you and other users, can interact with the document.
OCR scan software allows your computer to "see" a scanned document the same way it sees text-based documents you might create in Word, Excel, or equivalent programs. This enables your computer and, as a result, you to engage with scanned documents the same way that you would with original digital documents. This includes:
Optical character recognition can be used to translate text that is printed, and includes two related processes designed to capture handwriting and human-marked data:
Together, these recognition software solutions are useful in a wide array of applications and situations.
1. Verbesserung
Damit eine OCR-Software ein Dokument erfolgreich übersetzen kann, wird eine Bildverbesserungssoftware wie die branchenführende Perfect Page Technologie von Kodak Alaris Ihre Scans zunächst „bereinigen“, um unnötiges Farbrauschen auf einem Dokument zu reduzieren und die Daten klarer darszustellen. Je sauberer das Bild, desto besser und genauer die Übersetzung. Daher sucht und korrigiert die Perfect Page Technologie automatisch gängige Scan- und Dokumentenfehler oder Probleme wie z. B.:
Die Perfect Page Technologie ist in das Kodak Alaris Portfolio von Scannern integriert ist, um die Datenklarheit zu optimieren und die OCR-Genauigkeit zu maximieren, während gleichzeitig die kleinstmöglichen Dateigrößen erzeugt werden. Das Ergebnis: Scanner von Kodak Alaris bieten eine um 20-70 % bessere* OCR-Leserate als die Konkurrenz und erzeugen Dateigrößen, die fast halb so groß sind wie die von Konkurrenzgeräten.
2. Klassifizierung:
Sobald die Daten konvertiert und erweitert sind, besteht der nächste Schritt im OCR-Prozess darin, zu erkennen, welcher Dokumententyp in das System gelangt ist, und den nächsten Schritt für diesen Dokumententyp zu bestimmen.
OCR, ICR und OMR ermöglichen es Erfassungssoftware wie Kodak Capture Pro und Kodak Info Input Solution zu bestimmen, welche Art von Dokument eingelesen wurde. Dann kann die Software die Bilder nehmen und Klassifizierungsregeln auf der Basis von Dokumenteninhalt, Dokumentenlayout, Barcodes oder Indexierungsdaten durchsetzen.
Anhand der Klassifizierung wird ermittelt, ob es sich bei einem Dokument z. B. um eine Rechnung, eine Patientenakte, eine Darlehensakte oder einen Steuerdatensatz handelt. Unsere Info Input Solution kann zudem eine erweiterte Dokumentenerfassung mit nur einer oder zwei Vorlagen durchführen, um die Klassifizierung der Dokumente zu „erlernen“.
Kodak Alaris erreicht dies über patentierte maschinelle Lernalgorithmen. Das System nutzt eine Vielzahl von Techniken zur Klassifizierung der Daten: Suchinhalte, Bilder, Barcodes und die Zusammenführung zu einem Dokument. Wenn das System nur ein geringes Vertrauen in ein Dokument hat, das es zu klassifizieren versucht, kann der Prozess einen menschlichen Bediener zur Bestätigung heranziehen - so wie wir aufgefordert werden, alte Texte, die Computer nicht entziffern können, mit Captcha zu verifizieren.
3. Datenextraktion
Der letzte Schritt im OCR-Prozess ist die Datenextraktion.
Das Extrahieren der wichtigsten Informationen aus einem Dokument für deren Verwendung als Metadaten oder Indexdaten ist von entscheidender Bedeutung für das Abrufen und Verarbeiten. Eine automatisierte, auf Regeln basierende Klassifizierung informiert das System darüber, welche Schlüsselinformationen in einem Dokument vorhanden sein sollten und häufig auch darüber, wo diese Informationen zu finden sein sollten.
Softwarelösungen von Kodak Alaris können den Text in Ihrem Dokument mithilfe von Muster- und Merkmalserkennung identifizieren. Sie identifizieren die Sprache des zu scannenden Dokuments und sortieren den Text in einzelne Buchstaben, Wörter, Sätze und Absätze.
Danach extrahiert die Software die Informationen und erstellt eine Kopie davon, um sie als Metadaten für die nächste Phase des Prozesses zu verwenden. Im Falle von Dokumenten können Metadaten verwendet werden, um Dokumente zu sortieren, zu suchen und/oder in eine andere Art von Geschäftssystem einzuspeisen.
Mit diesen Lösungen können Sie die Daten auf der Grundlage von Geschäftsregeln und Informationen, die ein Unternehmen benötigt, durch Datenbankabfragen extrahieren. Benutzer können den Indexierungsprozess so einrichten, dass Schlüsseldaten automatisch aus Dokumenten extrahiert werden (über Strichcode, OCR, ICR oder OMR), wodurch die Verarbeitungszeit verkürzt wird.
OCR technology offers reams of benefits in both the personal and professional spheres. Optical character recognition software makes it possible to translate printed text from almost any material and:
Whether you realize it or not, you use many of these functionalities each day. You also benefit from other people and organizations applying it, as well. For example, police use of OCR technology to identify license plates helps them keep us safe. Banks' use of digital signature recognition, a form of OCR, prevents would-be identity thieves from accessing and spending your money.
Service providers in a range of industries can offer you better pricing and faster service because they are able to use OCR to scan, upload, compare, and edit contracts instead of paying individual people to do each of those steps. Whenever you use an app such as Google Translate to translate a sign or label while traveling, you benefit from OCR.
OCR can be particularly beneficial in the workplace. For example, companies can scan existing documents through OCR software and instantly turn them into formats compatible with text-to-speech programs.
This can help businesses meet ADA compliance standards without needing years of time and tremendous amounts of money and staff hours to get there. It also enables companies to meet the needs of sight-impaired customers in real time.
In other industries, such as health care, OCR technology can literally save lives. Scan software for OCR can make the enormous amount of information in a patient's medical history savable, searchable, and verifiable in ways that improve accessibility and prevent dangerous errors.
Kodak Alaris weiß um die entscheidende Rolle, die OCR beim Scannen Ihrer Dokumente spielt, seien sie privat oder beruflich. Deshalb liefern wir mit jedem Scanner eine kostenlose und erweiterte OCR-Software.
Unsere Scanner sind so konzipiert, dass sie sich nahtlos in Ihre anderen digitalen Werkzeuge integrieren lassen. Von intelligenten Geräten über Apps bis hin zu alten Klassikern wie E-Mail - unsere Programme arbeiten mit all Ihren digitalen Infrastrukturen. Wir machen es Ihnen leicht, Informationen zu verschieben, zu speichern und weiterzugeben, ganz gleich, wie oder wo sie in Ihr System gelangen.
OCR-Scansoftware von Kodak Alaris hat unseren Kunden geholfen:
Unsere Technologie wird durch unser erstklassiges technisches Hilfsprogramm unterstützt, das sicherstellt, dass Sie jedes Mal das Beste aus Ihrem Kauf herausholen. Egal, ob Sie sich für Kodak Alaris für private oder professionelle Anwendungen interessieren, wir haben die richtige Hardware, Software und Support-Lösungen für Sie.
Hierzu: Wie Alaris für Innovationen in der Scantechnologie sorgt
Optical character recognition software from Kodak Alaris takes your scanning from basic to brilliant. Visit a local reseller partner to learn more about what software and scanners from Kodak Alaris can offer you today.
*Based on 3rd Party testing performed by BLI and commissioned by Kodak Alaris. Test was designed by Kodak Alaris with all devices tested in similar operational conditions and where tested with similar operational methods.
Biel's Document Management stays cutting edge with new scanning solutions from Kodak Alaris
Profitieren Sie von fortgeschrittener Bildwissenschaft und nutzen Sie Perfect Page zur Optimierung Ihrer Scanvorgänge
Kodak Alaris ist ein führender Anbieter von Informationserfassungslösungen, die Geschäftsprozesse vereinfachen. Wir unterstützen Kunden dabei, Informationen sinnvoll mit intelligenten, vernetzten Lösungen zu nutzen – basierend auf innovativer Bildwissenschaft, die seit Jahrzehnten unsere Kernkompetenz darstellt. Unsere ausgezeichneten Scanner, Softwares und Services sind weltweit und durch unser Netzwerk an Vertriebspartnern verfügbar.
Datenschutz | Rechtliches / Website-Bedingungen
© 2022 Kodak Alaris Inc. TM/MC/MR: Alaris, ScanMate. Alle Marken und Markennamen sind Eigentum ihrer jeweiligen Inhaber. Die Marke Kodak und das Logo von Kodak werden unter Lizenz von der Eastman Kodak Company verwendet.