Descubra qué es el OCR, cómo funciona y por qué es tan importante para nuestra vida personal y profesional.
Complete el formulario y vea la información completa.
You may not know it, but you have been playing a key role in helping experts decipher old and even ancient historical texts. Every time you fill out a Captcha on a website to prove that you are human, you contribute to this valuable project. Moreover, you participate in a modern text conversion technology called optical character recognition (OCR). But what is OCR? What other hidden roles does it play in your life? Here's what you need to know about this crucial cutting-edge technology.
Optical character recognition is a state-of-the-art technology that underpins dozens of tools that you use every day. Put simply, it is a type of software that "translates" scanned documents into a format that your computer can read.
Without OCR, your computer perceives each document you scan as a single image, the way we see photographs or pieces of art. In that format, your computer cannot recognize individual letters, words, or phrases. This limits the ways that your computer, and therefore you and other users, can interact with the document.
OCR scan software allows your computer to "see" a scanned document the same way it sees text-based documents you might create in Word, Excel, or equivalent programs. This enables your computer and, as a result, you to engage with scanned documents the same way that you would with original digital documents. This includes:
Optical character recognition can be used to translate text that is printed, and includes two related processes designed to capture handwriting and human-marked data:
Together, these recognition software solutions are useful in a wide array of applications and situations.
1. Mejora
Para ayudar al software de OCR a traducir correctamente un documento, el software de mejora de imagen, como la tecnología Perfect Page de Kodak Alaris líder en la industria, «limpiará» primero el documento digitalizado para reducir el ruido innecesario y amplificar los datos. Cuanto más limpia sea la imagen, mejor y más precisa será la traducción, por lo que Perfect Page busca y corrige automáticamente errores comunes tanto de digitalización como del documento, tales como:
La tecnología Perfect Page está integrada en la oferta de escáneres de Kodak Alaris para optimizar la nitidez de los datos y maximizar la precisión de OCR, al tiempo que se crean archivos del menor tamaño posible. Como resultado, los escáneres de Kodak Alaris ofrecen una tasa de lectura de OCR entre un 20 y un 70 % superior* a la de los competidores y generan archivos de casi la mitad del tamaño que el de los dispositivos de la competencia.
2. Clasificación
Una vez que los datos se han convertido y mejorado, el siguiente paso en el proceso de OCR consiste en comprender qué tipo de documento se ha introducido en el sistema y determinar cuál es el próximo paso para ese tipo de documento.
Gracias al OCR, ICR y OMR, el software de captura como Kodak Capture Pro y Kodak Info Input Solution puede determinar qué tipo de documento se ha introducido. A continuación, el software puede trabajar con las imágenes y aplicar reglas de clasificación según el contenido o el diseño del documento, los códigos de barras o los datos de índice.
La clasificación determinará si un documento es una factura, un historial médico, una solicitud de préstamo o un expediente fiscal, por ejemplo. Además, Info Input Solution puede ejecutar una captura avanzada de documentos con tan solo una o dos muestras para «aprender» a clasificar los documentos.
Kodak Alaris consigue estos resultados mediante algoritmos de aprendizaje automático patentados. El sistema emplea una variedad de técnicas para clasificar los datos: búsqueda de contenido, imágenes, códigos de barras y una combinación de documentos. Si el nivel de confianza es bajo a la hora de clasificar algún documento, el proceso puede solicitar la intervención de un operador humano para que lo confirme, de igual modo que a través de captchas se nos solicita que verifiquemos textos antiguos que los sistemas informáticos no pueden descifrar.
3. Extracción de datos
El último paso en el proceso de OCR es la extracción de datos.
Extraer la información más crucial de un documento para utilizarla como metadatos o datos de índice es fundamental para el proceso de recuperación. La clasificación automatizada basada en reglas informa al sistema sobre la información clave que debería presentar un documento y, a menudo, dónde se encuentra dicha información.
Las soluciones de software de Kodak Alaris pueden identificar el texto en un documento mediante el uso del reconocimiento de patrones y características. Identifican el idioma del documento digitalizado y clasifican el texto en letras, palabras, frases y párrafos individuales.
A continuación, el software extrae y crea una copia de esa información para utilizarla como metadatos en la siguiente fase del proceso. En el caso de los documentos, los metadatos se pueden utilizar para organizar, encontrar o enviar documentos a otros tipos de sistemas empresariales.
Con estas soluciones, puede extraer datos según las reglas empresariales y la información que la empresa necesita mediante búsquedas en una base de datos. Los usuarios pueden configurar el proceso de indexación para extraer automáticamente la información clave contenida en los documentos (mediante el uso de códigos de barras, OCR, ICR u OMR), lo que reduce el tiempo de procesamiento.
OCR technology offers reams of benefits in both the personal and professional spheres. Optical character recognition software makes it possible to translate printed text from almost any material and:
Whether you realize it or not, you use many of these functionalities each day. You also benefit from other people and organizations applying it, as well. For example, police use of OCR technology to identify license plates helps them keep us safe. Banks' use of digital signature recognition, a form of OCR, prevents would-be identity thieves from accessing and spending your money.
Service providers in a range of industries can offer you better pricing and faster service because they are able to use OCR to scan, upload, compare, and edit contracts instead of paying individual people to do each of those steps. Whenever you use an app such as Google Translate to translate a sign or label while traveling, you benefit from OCR.
OCR can be particularly beneficial in the workplace. For example, companies can scan existing documents through OCR software and instantly turn them into formats compatible with text-to-speech programs.
This can help businesses meet ADA compliance standards without needing years of time and tremendous amounts of money and staff hours to get there. It also enables companies to meet the needs of sight-impaired customers in real time.
In other industries, such as health care, OCR technology can literally save lives. Scan software for OCR can make the enormous amount of information in a patient's medical history savable, searchable, and verifiable in ways that improve accessibility and prevent dangerous errors.
Kodak Alaris understands the critical role OCR plays in scanning your documents, be they personal or professional. That's why we provide free and advanced OCR software with every scanner.
Our scanners are designed to integrate seamlessly with your other digital tools. From smart devices to apps to old standbys like email, our programs work with all of your digital infrastructures. We make it easy to move, store, and share information, no matter how or where it enters your system.
OCR scanning software from Kodak Alaris has helped our clients:
Our technology is backed by our top-notch technical assistance program, ensuring that you get the most out of your purchase every time. Whether you are interested in Kodak Alaris for personal or professional applications, we have the right hardware, software, and support solutions for you.
Optical character recognition software from Kodak Alaris takes your scanning from basic to brilliant. Visit a local reseller partner to learn more about what software and scanners from Kodak Alaris can offer you today.
*Based on 3rd Party testing performed by BLI and commissioned by Kodak Alaris. Test was designed by Kodak Alaris with all devices tested in similar operational conditions and where tested with similar operational methods.
Biel's Document Management stays cutting edge with new scanning solutions from Kodak Alaris
Aproveche la ciencia de imágenes avanzada con Perfect Page para optimizar el escaneo
Las salas de procesamiento de correspondencia pueden resultar complejas y caóticas. Esto puede producir la pérdida de productividad y eficiencia. A su vez, esto reduce la capacidad de suministrar una experiencia del cliente con resultados confiables.
Kodak Alaris es una empresa líder proveedora de soluciones de captura de información que simplifican los procesos empresariales. Nuestro propósito es ayudar al mundo a dar sentido a la información mediante soluciones inteligentes conectadas que se basan en décadas de innovación en la ciencia del procesamiento de imágenes. Nuestra oferta de escáneres, software y servicios de reconocido prestigio está disponible a nivel mundial y a través de nuestra red de socios de canal.
Política de privacidad | Condiciones legales/del sitio
© 2022 Kodak Alaris Inc. TM/MC/MR: Alaris, ScanMate. Todas las marcas y nombres comerciales utilizados son propiedad de sus respectivos titulares. La marca registrada y la imagen comercial de Kodak se usan bajo licencia de Eastman Kodak Company.