Guide de la reconnaissance optique des caractères

Découvrez ce qu'est l'OCR, comment elle fonctionne et pourquoi elle est si essentielle dans nos vies personnelles et professionnelles.

Vous aimeriez en savoir plus ?

Remplissez le formulaire pour consulter l’article dans son intégralité.

Merci pour votre intérêt. Profitez de nos connaissances.

You may not know it, but you have been playing a key role in helping experts decipher old and even ancient historical texts. Every time you fill out a Captcha on a website to prove that you are human, you contribute to this valuable project. Moreover, you participate in a modern text conversion technology called optical character recognition (OCR). But what is OCR? What other hidden roles does it play in your life? Here's what you need to know about this crucial cutting-edge technology.

Optical character recognition is a state-of-the-art technology that underpins dozens of tools that you use every day. Put simply, it is a type of software that "translates" scanned documents into a format that your computer can read.

Without OCR, your computer perceives each document you scan as a single image, the way we see photographs or pieces of art. In that format, your computer cannot recognize individual letters, words, or phrases. This limits the ways that your computer, and therefore you and other users, can interact with the document.

OCR scan software allows your computer to "see" a scanned document the same way it sees text-based documents you might create in Word, Excel, or equivalent programs. This enables your computer and, as a result, you to engage with scanned documents the same way that you would with original digital documents. This includes:

  • Using search functions
  • Editing
  • Using comparison and analysis tools
  • Processing, storing, retrieving, and sharing information

Optical character recognition can be used to translate text that is printed, and includes two related processes designed to capture handwriting and human-marked data:

  • Intelligent character recognition (ICR): The process of capturing and translating hand-printed and written characters such as on structured forms
  • Optical mark recognition (OMR): The process of capturing human-marked data from document forms such as multiple-choice surveys, questionnaires, and tests in the form of lines or shaded areas

Together, these recognition software solutions are useful in a wide array of applications and situations.

Comment fonctionne l'OCR

1. Amélioration
Pour aider le logiciel d'OCR à traduire un document avec succès, un logiciel d'amélioration de l'image tel que la technologie Perfect Page de Kodak Alaris, leader sur le marché, va d'abord « nettoyer » vos numérisations pour réduire les bruits inutiles sur un document et amplifier les données. Plus l'image est propre, plus la traduction est précise et de bonne qualité. C'est pourquoi la technologie Perfect Page recherche et corrige automatiquement les erreurs ou les problèmes de numérisation et de document les plus courants, tels que :

  • Ajustement des numérisations de travers ou en biais
  • Suppression des taches, lignes et autres imperfections d'impression depuis la « vue » de l'ordinateur
  • Compensation des taches et d'autres imperfections non imprimées sur la page
  • Analyse de la disposition des colonnes, des images, des tableaux et d'autres éléments

La technologie Perfect Page est intégrée au portefeuille de scanners Kodak Alaris pour optimiser la clarté des données et la précision de l'OCR, tout en créant des fichiers de taille aussi réduite que possible. Par conséquent, les scanners Kodak Alaris offrent un taux de lecture par OCR de 20 à 70 % supérieur* à celui de la concurrence et créent des fichiers dont la taille est presque deux fois moins importante que celle des appareils concurrents.

2. Classification
Une fois que les données sont converties et améliorées, l'étape suivante du processus d'OCR consiste à comprendre quel type de document est entré dans le système et à déterminer l'étape suivante pour ce type de document.

L'OCR, l'ICR et l'OMR permettent aux logiciels de capture comme Kodak Capture Pro et Kodak Solution Info Input de déterminer quel type de document a été ingéré. Le logiciel peut ensuite prendre les images et appliquer des règles de classification basées sur le contenu du document, sa présentation, des codes-barres ou des données d'indexation.

La classification déterminera si un document est, par exemple, une facture, un dossier de patient, un dossier de prêt ou un dossier fiscal. Et notre Solution Info Input peut effectuer une capture avancée de documents avec seulement un ou deux échantillons pour « apprendre » à classer les documents.

Kodak Alaris y parvient grâce à des algorithmes brevetés d'apprentissage machine. Le système utilise diverses techniques pour classer les données : recherche de contenu, d'images, de codes-barres et fusion d'un document. Si le système n'a pas confiance dans un document qu'il tente de classer, le processus peut faire appel à un opérateur humain pour confirmation – tout comme nous sommes appelés à vérifier les textes anciens que les ordinateurs ne peuvent pas déchiffrer en utilisant Captcha.

3. Extraction des données
La dernière étape du processus d'OCR est l'extraction des données.

Il est vital à la récupération et au traitement d'extraire les informations les plus importantes de ce document pour les utiliser comme métadonnées ou données d'index. La classification automatisée basée sur des règles indique au système quelles informations clés doivent exister dans un document, et souvent où ces informations doivent se trouver.

Les solutions logicielles de Kodak Alaris peuvent identifier le texte de votre document en utilisant la reconnaissance des formes et des caractéristiques. Elles identifient la langue du document numérisé et trient le texte en lettres, mots, phrases et paragraphes individuels.

Ensuite, le logiciel extrait ces informations et en crée une copie afin de les utiliser comme métadonnées pour la phase suivante du processus. Dans le cas des documents, les métadonnées peuvent être utilisées pour organiser, trouver et/ou alimenter des documents dans un autre type de système métier.

Grâce à ces solutions, vous pouvez extraire les données en fonction des règles de gestion et des informations dont une entreprise a besoin en consultant les bases de données. Les utilisateurs peuvent configurer le processus d'indexation afin d'extraire de manière automatique les données essentielles provenant de documents (via code-barres, OCR, ICR ou OMR), permettant ainsi la réduction des délais de traitement

Why OCR Matters

OCR technology offers reams of benefits in both the personal and professional spheres. Optical character recognition software makes it possible to translate printed text from almost any material and:

    Search your documents, including scanned copies of out-of-print books and other texts
  • Analyze, edit, and compare scanned documents quickly and accurately
  • Share information that you otherwise could not
  • Apply text-to-speech software to scanned documents, making them accessible to audiences that otherwise could not read them
  • Store documents in more compact forms and keep inexpensive digital backups of important documents
  • Process documents digitally in real-time for security and authentication purposes
  • Reduce the need for time-consuming and error-prone data entry in the workplace
  • Upload historical documents to searchable genealogy databases online

Whether you realize it or not, you use many of these functionalities each day. You also benefit from other people and organizations applying it, as well. For example, police use of OCR technology to identify license plates helps them keep us safe. Banks' use of digital signature recognition, a form of OCR, prevents would-be identity thieves from accessing and spending your money.

Service providers in a range of industries can offer you better pricing and faster service because they are able to use OCR to scan, upload, compare, and edit contracts instead of paying individual people to do each of those steps. Whenever you use an app such as Google Translate to translate a sign or label while traveling, you benefit from OCR.

OCR in the Workplace

OCR can be particularly beneficial in the workplace. For example, companies can scan existing documents through OCR software and instantly turn them into formats compatible with text-to-speech programs.

This can help businesses meet ADA compliance standards without needing years of time and tremendous amounts of money and staff hours to get there. It also enables companies to meet the needs of sight-impaired customers in real time.

In other industries, such as health care, OCR technology can literally save lives. Scan software for OCR can make the enormous amount of information in a patient's medical history savable, searchable, and verifiable in ways that improve accessibility and prevent dangerous errors.

Kodak Alaris et OCR

Kodak Alaris comprend le rôle essentiel que joue l'OCR dans la numérisation de vos documents, qu'ils soient personnels ou professionnels. C'est pourquoi nous fournissons un logiciel d'OCR gratuit et avancé avec chaque scanner.

Nos scanners sont conçus pour s'intégrer de manière transparente à vos autres outils numériques. Qu'il s'agisse d'appareils intelligents, d'applications ou de vieilles ressources comme les e-mails, nos programmes fonctionnent avec toutes vos infrastructures numériques. Nous facilitons le déplacement, le stockage et le partage des informations, peu importe le la manière et le lieu d'entrée dans votre système.

Le logiciel de numérisation avec OCR de Kodak Alaris a aidé nos clients à :

  • Développer leurs activités
  • Innover
  • Économiser de l'argent
  • Amélioration de l'efficacité
  • Améliorer le service et le taux de satisfaction des clients
  • Minimiser leur empreinte écologique

Notre technologie bénéficie de notre programme d'assistance technique de premier ordre, qui vous permet de tirer le meilleur parti de votre achat à chaque utilisation. Que vous soyez intéressé par Kodak Alaris pour des applications personnelles ou professionnelles, nous avons le matériel, les logiciels et les solutions d'assistance qu'il vous faut.

Voir aussi : Comment Alaris innove dans la technologie de numérisation

Learn More

Optical character recognition software from Kodak Alaris takes your scanning from basic to brilliant. Visit a local reseller partner to learn more about what software and scanners from Kodak Alaris can offer you today.

*Based on 3rd Party testing performed by BLI and commissioned by Kodak Alaris. Test was designed by Kodak Alaris with all devices tested in similar operational conditions and where tested with similar operational methods.

Solutions connexes

Alaris Capture Pro

Capture Pro Software

  • Idéal pour les applications métiers gourmandes en papier
  • Intégration complète avec les systèmes ECM
  • Modules réseau et importation disponibles
smart touch

Technologie Smart Touch

  • Remplace la complexité des processus de numérisations à plusieurs étapes par la simplicité d'une fonction en une touche
  • Configurez jusqu'à vingt fonctions différentes pour répondre à vos besoins spécifiques de numérisation
  • Scannez facilement un document vers un emplacement de fichier ou des services communs sur le Cloud
Info Input Screen

Info Input Solution

  • Idéale pour les entreprises de grande taille
  • S'intègre avec les applications métiers
  • Module mobile en option

Related Challenges

Contact

Les produits, les services et l’assistance technique Alaris pour la gestion des informations sont disponibles partout dans le monde auprès des revendeurs. 

Pour trouver un revendeur dans votre région, appelez-nous au 01 76 46 00 90 ou remplissez notre formulaire de demande d’informations ci-dessous. Un revendeur vous contactera dans les plus brefs délais.

Merci d’avoir fourni vos informations. Nous vous contacterons sous peu.
Une erreur est survenue lors de l’envoi