/ Artículo Guía sobre el reconocimiento óptico de caracteres

Descubra qué es el OCR, cómo funciona y por qué es tan importante para nuestra vida personal y profesional.

¿Quiere más?

Complete el formulario y vea la información completa.

Gracias por su interés. Disfrute de nuestro conocimiento.

You may not know it, but you have been playing a key role in helping experts decipher old and even ancient historical texts. Every time you fill out a Captcha on a website to prove that you are human, you contribute to this valuable project. Moreover, you participate in a modern text conversion technology called optical character recognition (OCR). But what is OCR? What other hidden roles does it play in your life? Here's what you need to know about this crucial cutting-edge technology.

Optical character recognition is a state-of-the-art technology that underpins dozens of tools that you use every day. Put simply, it is a type of software that "translates" scanned documents into a format that your computer can read.

Without OCR, your computer perceives each document you scan as a single image, the way we see photographs or pieces of art. In that format, your computer cannot recognize individual letters, words, or phrases. This limits the ways that your computer, and therefore you and other users, can interact with the document.

OCR scan software allows your computer to "see" a scanned document the same way it sees text-based documents you might create in Word, Excel, or equivalent programs. This enables your computer and, as a result, you to engage with scanned documents the same way that you would with original digital documents. This includes:

  • Using search functions
  • Editing
  • Using comparison and analysis tools
  • Processing, storing, retrieving, and sharing information

Optical character recognition can be used to translate text that is printed, and includes two related processes designed to capture handwriting and human-marked data:

  • Intelligent character recognition (ICR): The process of capturing and translating hand-printed and written characters such as on structured forms
  • Optical mark recognition (OMR): The process of capturing human-marked data from document forms such as multiple-choice surveys, questionnaires, and tests in the form of lines or shaded areas

Together, these recognition software solutions are useful in a wide array of applications and situations.

¿Cómo funciona el OCR?

1. Mejora
Para ayudar al software de OCR a traducir correctamente un documento, el software de mejora de imagen, como la tecnología Perfect Page de Kodak Alaris líder en la industria, «limpiará» primero el documento digitalizado para reducir el ruido innecesario y amplificar los datos. Cuanto más limpia sea la imagen, mejor y más precisa será la traducción, por lo que Perfect Page busca y corrige automáticamente errores comunes tanto de digitalización como del documento, tales como:

  • Ajuste de documentos digitalizados sesgados o torcidos
  • Eliminación de puntos, líneas y otras imperfecciones de impresión de la «vista» del PC
  • Compensación de manchas y otras imperfecciones que no son de impresión presentes en la página
  • Análisis de la disposición de columnas, imágenes, tablas y otras características

La tecnología Perfect Page está integrada en la oferta de escáneres de Kodak Alaris para optimizar la nitidez de los datos y maximizar la precisión de OCR, al tiempo que se crean archivos del menor tamaño posible. Como resultado, los escáneres de Kodak Alaris ofrecen una tasa de lectura de OCR entre un 20 y un 70 % superior* a la de los competidores y generan archivos de casi la mitad del tamaño que el de los dispositivos de la competencia.

2. Clasificación
Una vez que los datos se han convertido y mejorado, el siguiente paso en el proceso de OCR consiste en comprender qué tipo de documento se ha introducido en el sistema y determinar cuál es el próximo paso para ese tipo de documento.

Gracias al OCR, ICR y OMR, el software de captura como Kodak Capture Pro y Kodak Info Input Solution puede determinar qué tipo de documento se ha introducido. A continuación, el software puede trabajar con las imágenes y aplicar reglas de clasificación según el contenido o el diseño del documento, los códigos de barras o los datos de índice.

La clasificación determinará si un documento es una factura, un historial médico, una solicitud de préstamo o un expediente fiscal, por ejemplo. Además, Info Input Solution puede ejecutar una captura avanzada de documentos con tan solo una o dos muestras para «aprender» a clasificar los documentos.

Kodak Alaris consigue estos resultados mediante algoritmos de aprendizaje automático patentados. El sistema emplea una variedad de técnicas para clasificar los datos: búsqueda de contenido, imágenes, códigos de barras y una combinación de documentos. Si el nivel de confianza es bajo a la hora de clasificar algún documento, el proceso puede solicitar la intervención de un operador humano para que lo confirme, de igual modo que a través de captchas se nos solicita que verifiquemos textos antiguos que los sistemas informáticos no pueden descifrar.

3. Extracción de datos
El último paso en el proceso de OCR es la extracción de datos.

Extraer la información más crucial de un documento para utilizarla como metadatos o datos de índice es fundamental para el proceso de recuperación. La clasificación automatizada basada en reglas informa al sistema sobre la información clave que debería presentar un documento y, a menudo, dónde se encuentra dicha información.

Las soluciones de software de Kodak Alaris pueden identificar el texto en un documento mediante el uso del reconocimiento de patrones y características. Identifican el idioma del documento digitalizado y clasifican el texto en letras, palabras, frases y párrafos individuales.

A continuación, el software extrae y crea una copia de esa información para utilizarla como metadatos en la siguiente fase del proceso. En el caso de los documentos, los metadatos se pueden utilizar para organizar, encontrar o enviar documentos a otros tipos de sistemas empresariales.

Con estas soluciones, puede extraer datos según las reglas empresariales y la información que la empresa necesita mediante búsquedas en una base de datos. Los usuarios pueden configurar el proceso de indexación para extraer automáticamente la información clave contenida en los documentos (mediante el uso de códigos de barras, OCR, ICR u OMR), lo que reduce el tiempo de procesamiento.

Why OCR Matters

OCR technology offers reams of benefits in both the personal and professional spheres. Optical character recognition software makes it possible to translate printed text from almost any material and:

    Search your documents, including scanned copies of out-of-print books and other texts
  • Analyze, edit, and compare scanned documents quickly and accurately
  • Share information that you otherwise could not
  • Apply text-to-speech software to scanned documents, making them accessible to audiences that otherwise could not read them
  • Store documents in more compact forms and keep inexpensive digital backups of important documents
  • Process documents digitally in real-time for security and authentication purposes
  • Reduce the need for time-consuming and error-prone data entry in the workplace
  • Upload historical documents to searchable genealogy databases online

Whether you realize it or not, you use many of these functionalities each day. You also benefit from other people and organizations applying it, as well. For example, police use of OCR technology to identify license plates helps them keep us safe. Banks' use of digital signature recognition, a form of OCR, prevents would-be identity thieves from accessing and spending your money.

Service providers in a range of industries can offer you better pricing and faster service because they are able to use OCR to scan, upload, compare, and edit contracts instead of paying individual people to do each of those steps. Whenever you use an app such as Google Translate to translate a sign or label while traveling, you benefit from OCR.

OCR in the Workplace

OCR can be particularly beneficial in the workplace. For example, companies can scan existing documents through OCR software and instantly turn them into formats compatible with text-to-speech programs.

This can help businesses meet ADA compliance standards without needing years of time and tremendous amounts of money and staff hours to get there. It also enables companies to meet the needs of sight-impaired customers in real time.

In other industries, such as health care, OCR technology can literally save lives. Scan software for OCR can make the enormous amount of information in a patient's medical history savable, searchable, and verifiable in ways that improve accessibility and prevent dangerous errors.

Kodak Alaris and OCR

Kodak Alaris understands the critical role OCR plays in scanning your documents, be they personal or professional. That's why we provide free and advanced OCR software with every scanner.

Our scanners are designed to integrate seamlessly with your other digital tools. From smart devices to apps to old standbys like email, our programs work with all of your digital infrastructures. We make it easy to move, store, and share information, no matter how or where it enters your system.

OCR scanning software from Kodak Alaris has helped our clients:

  • Grow their businesses
  • Innovate
  • Save money
  • Increase efficiency
  • Improve service and customer satisfaction rates
  • Minimize their environmental footprints

 

Our technology is backed by our top-notch technical assistance program, ensuring that you get the most out of your purchase every time. Whether you are interested in Kodak Alaris for personal or professional applications, we have the right hardware, software, and support solutions for you.

Related: How Alaris Innovates With Scanning Technology

Learn More

Optical character recognition software from Kodak Alaris takes your scanning from basic to brilliant. Visit a local reseller partner to learn more about what software and scanners from Kodak Alaris can offer you today.

*Based on 3rd Party testing performed by BLI and commissioned by Kodak Alaris. Test was designed by Kodak Alaris with all devices tested in similar operational conditions and where tested with similar operational methods.

Soluciones relacionadas

Alaris Capture Pro

Software Capture Pro

  • Ideal para aplicaciones empresariales en las que se usa gran cantidad de papel
  • Amplia integración con sistemas ECM
  • Módulos de importación y redes disponibles
smart touch

Tecnología Smart Touch

  • Elimine la complejidad de los procesos de digitalización de varios pasos con la sencillez de un solo toque
  • Configure hasta veinte funciones diferentes que se adapten a sus necesidades específicas de digitalización
  • Digitalice fácilmente un documento y envíelo a una ubicación de archivo o a servicios comunes en la nube
Info Input Screen

Info Input Solution

  • Ideal para clientes empresariales de gran tamaño
  • Se integra con aplicaciones empresariales
  • Opción de módulo móvil

Contacto

Para contactarnos, complete nuestro formulario de solicitud de información a continuación y nos comunicaremos con usted pronto.

Ver la política de privacidad de Kodak Alaris