/ Artigo Guia para o reconhecimento óptico de caracteres

Aprenda o que é OCR, como funciona e por que é tão essencial para nossa vida pessoal e profissional.

Quer mais?

Preencha o formulário e veja o insight completo.

Obrigado pelo seu interesse. Aproveite o nosso insight.

You may not know it, but you have been playing a key role in helping experts decipher old and even ancient historical texts. Every time you fill out a Captcha on a website to prove that you are human, you contribute to this valuable project. Moreover, you participate in a modern text conversion technology called optical character recognition (OCR). But what is OCR? What other hidden roles does it play in your life? Here's what you need to know about this crucial cutting-edge technology.

Optical character recognition is a state-of-the-art technology that underpins dozens of tools that you use every day. Put simply, it is a type of software that "translates" scanned documents into a format that your computer can read.

Without OCR, your computer perceives each document you scan as a single image, the way we see photographs or pieces of art. In that format, your computer cannot recognize individual letters, words, or phrases. This limits the ways that your computer, and therefore you and other users, can interact with the document.

OCR scan software allows your computer to "see" a scanned document the same way it sees text-based documents you might create in Word, Excel, or equivalent programs. This enables your computer and, as a result, you to engage with scanned documents the same way that you would with original digital documents. This includes:

  • Using search functions
  • Editing
  • Using comparison and analysis tools
  • Processing, storing, retrieving, and sharing information

Optical character recognition can be used to translate text that is printed, and includes two related processes designed to capture handwriting and human-marked data:

  • Intelligent character recognition (ICR): The process of capturing and translating hand-printed and written characters such as on structured forms
  • Optical mark recognition (OMR): The process of capturing human-marked data from document forms such as multiple-choice surveys, questionnaires, and tests in the form of lines or shaded areas

Together, these recognition software solutions are useful in a wide array of applications and situations.

Como o OCR funciona

1. Aprimoramento
Para ajudar o software OCR a traduzir com sucesso um documento, software de aprimoramento de imagem, como o líder do setor Tecnologia Perfect Page da Kodak Alaris primeiro "limpará" suas digitalizações para reduzir o ruído desnecessário em um documento e amplificar os dados. Quanto mais limpa a imagem, melhor e mais precisa a tradução, então, a Tecnologia Perfect Page automaticamente procura e corrige erros ou problemas comuns de digitalização e documentos, realizando:

  • Ajuste de digitalizações distorcidas ou tortas
  • Remoção de manchas, linhas e outras imperfeições de impressão da "visão" do computador
  • Compensação de manchas e outras imperfeições não impressas na página
  • Análise de layout de colunas, imagens, tabelas e outros recursos

A Tecnologia Perfect Page está integrada ao portfólio de scanners da Kodak Alaris para otimizar a clareza dos dados e maximizar a precisão do OCR, criando os menores tamanhos de arquivo possíveis. Como resultado, os scanners da Kodak Alaris fornecem uma taxa de leitura de OCR de 20 a 70% melhor* do que a concorrência e criam tamanhos de arquivo que são quase a metade dos dispositivos concorrentes.

2. Classificação
Depois que os dados são convertidos e aprimorados, a próxima etapa no processo de OCR é entender qual tipo de documento entrou no sistema e determinar a próxima etapa para esse tipo de documento.

OCR, ICR e OMR permitem software de captura como Kodak Capture Pro e Kodak Info Input Solution para determinar que tipo de documento foi inserido. Em seguida, o software pode obter as imagens e aplicar regras de classificação com base no conteúdo do documento, layout do documento, códigos de barras ou dados de indexação.

A classificação determinará se um documento é, por exemplo, uma fatura, prontuário de paciente, arquivo de empréstimo ou registro de imposto. E o Info Input Solution pode fazer captura avançada de documentos com apenas uma ou duas amostras para aprender a classificar os documentos.

A Kodak Alaris faz isso por meio de algoritmos de aprendizado de máquina patenteados. O sistema usa diversas técnicas para classificar os dados: pesquisa de conteúdo, imagens, códigos de barras e fusão de um documento. Se o sistema tiver pouca confiança em qualquer documento que tenta classificar, o processo pode chamar um operador humano para confirmação, assim como somos chamados para verificar textos antigos que os computadores não conseguem decifrar usando Captcha.

3. Extração de Dados
A última etapa do processo de OCR é a extração de dados.

Extrair as informações mais importantes de um documento para usar como metadados ou dados de índice é vital para recuperação e processamento. A classificação automatizada com base em regras informa o sistema sobre quais informações-chave devem existir em um documento e, frequentemente, onde essas informações devem ser colocadas.

As soluções de software da Kodak Alaris podem identificar o texto no seu documento usando o reconhecimento de padrões e recursos. Eles identificam o idioma do documento que está sendo digitalizado e classificam o texto em letras, palavras, frases e parágrafos individuais.

Em seguida, o software extrai e cria uma cópia dessas informações para usar como metadados na próxima fase do processo. No caso de documentos, os metadados podem ser usados para organizar, localizar e/ou alimentar documentos em outro tipo de sistema de negócios.

Com essas soluções, você pode extrair os dados com base nas regras de negócios e nas informações de que uma empresa precisa por meio de pesquisas no banco de dados. Os usuários podem configurar o processo de indexação para extrair automaticamente os dados principais dos documentos (via código de barras, OCR, ICR ou OMR), reduzindo o tempo de processamento.

Why OCR Matters

OCR technology offers reams of benefits in both the personal and professional spheres. Optical character recognition software makes it possible to translate printed text from almost any material and:

    Search your documents, including scanned copies of out-of-print books and other texts
  • Analyze, edit, and compare scanned documents quickly and accurately
  • Share information that you otherwise could not
  • Apply text-to-speech software to scanned documents, making them accessible to audiences that otherwise could not read them
  • Store documents in more compact forms and keep inexpensive digital backups of important documents
  • Process documents digitally in real-time for security and authentication purposes
  • Reduce the need for time-consuming and error-prone data entry in the workplace
  • Upload historical documents to searchable genealogy databases online

Whether you realize it or not, you use many of these functionalities each day. You also benefit from other people and organizations applying it, as well. For example, police use of OCR technology to identify license plates helps them keep us safe. Banks' use of digital signature recognition, a form of OCR, prevents would-be identity thieves from accessing and spending your money.

Service providers in a range of industries can offer you better pricing and faster service because they are able to use OCR to scan, upload, compare, and edit contracts instead of paying individual people to do each of those steps. Whenever you use an app such as Google Translate to translate a sign or label while traveling, you benefit from OCR.

OCR in the Workplace

OCR can be particularly beneficial in the workplace. For example, companies can scan existing documents through OCR software and instantly turn them into formats compatible with text-to-speech programs.

This can help businesses meet ADA compliance standards without needing years of time and tremendous amounts of money and staff hours to get there. It also enables companies to meet the needs of sight-impaired customers in real time.

In other industries, such as health care, OCR technology can literally save lives. Scan software for OCR can make the enormous amount of information in a patient's medical history savable, searchable, and verifiable in ways that improve accessibility and prevent dangerous errors.

Kodak Alaris and OCR

Kodak Alaris understands the critical role OCR plays in scanning your documents, be they personal or professional. That's why we provide free and advanced OCR software with every scanner.

Our scanners are designed to integrate seamlessly with your other digital tools. From smart devices to apps to old standbys like email, our programs work with all of your digital infrastructures. We make it easy to move, store, and share information, no matter how or where it enters your system.

OCR scanning software from Kodak Alaris has helped our clients:

  • Grow their businesses
  • Innovate
  • Save money
  • Increase efficiency
  • Improve service and customer satisfaction rates
  • Minimize their environmental footprints

 

Our technology is backed by our top-notch technical assistance program, ensuring that you get the most out of your purchase every time. Whether you are interested in Kodak Alaris for personal or professional applications, we have the right hardware, software, and support solutions for you.

Related: How Alaris Innovates With Scanning Technology

Learn More

Optical character recognition software from Kodak Alaris takes your scanning from basic to brilliant. Visit a local reseller partner to learn more about what software and scanners from Kodak Alaris can offer you today.

*Based on 3rd Party testing performed by BLI and commissioned by Kodak Alaris. Test was designed by Kodak Alaris with all devices tested in similar operational conditions and where tested with similar operational methods.

Soluções relacionadas

Alaris Capture Pro

Capture Pro Software

  • Ideal para aplicações de negócios que usam muito papel
  • Ampla integração com sistemas de ECM
  • Módulos Rede e Importação disponíveis
smart touch

Tecnologia Smart Touch

  • Acabe com complicados processos de digitalização de várias etapas graças à simplicidade de apenas um toque
  • Configure até vinte funções diferentes de acordo com as suas necessidades de digitalização específicas
  • Digitalize facilmente um documento para uma localização de arquivos ou serviços comuns na nuvem
Info Input Screen

Info Input Solution

  • Ideal para clientes grandes, empresariais
  • Integra com aplicativos de negócios
  • Opção de módulo móvel

Contato

Para entrar em contato conosco, preencha nosso formulário de solicitação de informações abaixo e em breve entraremos em contato com você.

Veja a Política de Privacidade da Kodak Alaris