Les scanners Alaris – La clé du succès pour le logiciel d’IA

Même si nous aimons penser à la numérisation de documents comme à une technologie mature, son application peut être une variable importante dans les mises en œuvre de technologies avancées. Ce point a été illustré dans la mise en œuvre récente de l’IA dans une banque internationale ayant des agences en Europe et en Amérique latine. 

“Notre logiciel d’extraction de données fonctionnait bien quand nous avons fait les tests et l’avons mis en production ; mais quand nous l’avons déployé dans les agences, la qualité de l’extraction s’est dégradée—elle est passée d’une exactitude de 95 % à environ 30 %,” déclare Sinuhé Arroyo, Fondateur et PDG de TAIGER, spécialiste de l’IA basé à Singapour. “Quand j’ai reçu cette information, j’ai commencé à faire certains recoupements et je me suis rendu compte que les scanners dans les agences étaient de moins bonne qualité. Les résultats ont réellement prouvé le vieil adage ‘garbage in, garbage out (mauvaise qualité en entrée, mauvaise qualité en sortie).’ Nous avons donc changé les scanners et le problème a été résolu.”

La résolution de ce problème a conduit à un partenariat avec Alaris, la division Gestion de l’information (incluant la fabrication de scanners) de Kodak Alaris. TAIGER et Alaris ont récemment annoncé une alliance stratégique mondiale dans laquelle TAIGER intégrera son logiciel avec les scanners Alaris et les proposera dans le cadre de ses solutions d’extraction de données. Pour commencer, TAIGER se concentrera sur la certification d’une paire de scanners réseau : la Kodak Scan Station 730EX et l’Alaris S2060w.

“Les scanners réseau répondent aux besoins d’un client particulier et nous permettent d’intégrer la solution TAIGER dans l’interface de l’appareil,” annonce Vanilda Grando, directrice du développement des ventes mondiales pour Alaris. “Ceci nous a donné notre modèle initial de ventes, mais nous ne sommes pas nécessairement limités à travailler avec TAIGER sur les scanners réseau.”

La qualité élevée des images produites par les scanners a été le déclencheur de la vente du point de vue d’Arroyo. “La technologie qu’Alaris a mise sur la table dans le domaine du traitement d’image était supérieure à tout ce que nous avons vu de la part des autres constructeurs,” explique-t-elle. “C’est vraiment ce qui les a démarqués.”

Qui est TAIGER ?

TAIGER (prononcez “tiger”) est l’un des nombreux spécialistes de l’IA avec lesquels nous avons récemment discuté, qui appliquent leur technologie aux applications de capture de documents. Arroyo a fondé la société en 2009. “J’ai commencé à programmer en BASIC quand j’avais 10 ans,” raconte Arroyo. “J’ai continué à étudier les sciences informatiques et obtenu mon PhD en IA. Je travaillais dans des domaines tels que le machine learning et le raisonnement automatisé. Le traitement du langage naturel était l’une des disciplines qui m’ont été enseignées.

“Quand j’ai commencé à rechercher des moyens d’appliquer mes recherches au monde professionnel, j’ai réalisé que la compréhension d’un texte était un domaine qui restait largement non résolu. Avec TAIGER, nous avons commencé avec la technologie de recherche, puis nous avons ajouté un assistant chatbot. Plus tard, nous avons ajouté l’extraction d’informations, qui peut lire des documents et en extraire des informations. Nous convertissons ces informations en données qui seront ingérées par les systèmes d’information.”

TAIGER est basée à Singapour et fait ainsi partie d’une scène technique en pleine croissance. En 2017, TAIGER a clôturé un cycle de financement d’un équivalent de 5,87 millions de $ US. (Juste cette semaine, TAIGER a annoncé le cycle de financement Série B de $25 millions de $, ce qui monte la valeur de la société à 110 millions de $.) La société possède actuellement des succursales à New York, Madrid, Hong Kong et Sydney, et prévoit de continuer à se développer au niveau mondial. “Jusqu’ici, nous nous sommes principalement concentrés sur le marché des services financiers avec parmi nos clients cinq des sept plus grandes banques mondiales,” ajoute Arroyo. “Nous avons également quelques contrats avec des gouvernements et nous venons de commencer à travailler avec des cabinets juridiques.”

TAIGER possède trois lignes de produit séparées : iSearch, iConverse pour les chatbots et iMatch pour l’extraction de données. “Notre technologie d’extraction peut fonctionner avec des documents à la fois aux formats numériques et physiques,” précise Arroyo. “Si le document est un e-mail ou un autre type de fichier électronique, il n’est pas nécessaire de le numériser. S’il s’agit de papier, nous utilisons un scanner pour générer un fichier image sur lequel nous appliquons un OCR. Nous travaillons ensuite sur le texte ASCII pour interpréter le document au profit de l’application définie.” (TAIGER n’utilise pas actuellement le logiciel Alaris Capture Pro pour l’OCR, mais Arroyo nous a confié que ceci était fortement envisagé.)

Selon Arroyo, le principal différenciateur entre iMatch et une capture traditionnelle est le spectre de documents qui peut être traité par iMatch. “La capture traditionnelle est efficace sur des documents structurés et semi-structurés, quand il n’y a pas trop de variations ou de complexité,” complète-t-il. “Quand vous passez à des documents complètement non structurés, ils ne font même pas partie du domaine. Leur technologie de machine learning ne peut pas atteindre notre degré d’exactitude, et les fournisseurs ne peuvent donc pas garantir les KPI comme nous le faisons. Nous pouvons proposer une exactitude de 90-95 % sans aucun faux positif et c’est une valeur énorme.”

Pour la banque mondiale susmentionnée, TAIGER a déployé iMatch pour l’aider dans le processus d’intégration. Pour les clients professionnels, ceci implique de capturer des données provenant d’au moins 10 documents différents, dont des documents non structurés comme des procurations et des statuts. Par exemple, la phrase spécifique qui donne à une personne la procuration pour une entreprise peut fortement varier en fonction du rédacteur du formulaire.

“L’un des défis du langage est que la signification d’une chose que vous dites peut varier de manière considérable en fonction du contexte,” confie Arroyo. “Par exemple, si je demande où vous habitez, ceci peut signifier que je veux savoir dans quel quartier se trouve votre maison, ou dans quelle ville ou pays. Je peux aussi demander la même chose en utilisant des mots différents. C’est pourquoi la recherche de motifs ne fonctionne pas pour l’extraction à partir de documents non structurés. L’arbre des possibilités peut être extrêmement grand. “Notre technologie a la capacité d’identifier dans les phrases les sujets, les prédicats, les objets etc. Elle applique ensuite une compréhension sémantique pour déterminer laquelle parmi les cinq à sept significations différentes est la bonne. Ensuite, nous essayons et contextualisons la phrase à l’intérieur du document pour l’essayer réellement et obtenir sa signification.”

Arroyo a expliqué que l’implémentation d’un iMatch comprenait trois éléments. “Vous avez le moteur sous-jacent qui sera le même dans chaque instance. “Ensuite, vous avez les documents. Finalement, vous avez une base de connaissance, par exemple l’oncologie, qui aide à ajuster le moteur pour traiter un type particulier de document. La proposition de valeur tient dans le fait d’être capable de capturer de manière très précise des données critiques et de garantir qu’il n’y aura pas de faux positifs.”

L’application à la banque mondiale a entraîné une réduction du temps d’intégration pour les clients professionnels de plusieurs semaines à sept minutes seulement dans certains cas. Les coûts pour l’intégration de clients ont été réduits de 85 %. Les erreurs ont également été réduites.

Vanilda Grando
Vanilda Grando
Directrice du développement des
ventes mondiales, Alaris

iMatch prend actuellement en charge la capture des données en anglais, espagnol et chinois. “Nous développons actuellement la prise en charge de nombreuses autres langues,” annonce Arroyo. “Ce n’est pas un processus très difficile. Il nous faut environ deux mois pour ajouter une nouvelle langue.”

Jusqu’ici, iMatch a été déployé uniquement à l’intérieur des sites, mais TAIGER envisage de mettre sa technologie sur le cloud. “Nous remarquons que de nombreuses organisations, en particulier sur le marché des services financiers, cherchent à passer à des logiciels cloud,” constate Arroyo. “Je pense que ceci profite à tout le monde grâce au temps réduit de mise sur le marché et au coût inférieur d’implémentation pour le client. Travailler avec les scanners réseau d’Alaris ne pose aucun problème quand il s’agit de permettre l’intégration avec un logiciel cloud.”

TAIGER continue de développer sa technologie et a récemment ajouté de nouvelles capacités de rédaction. “Le fait d’ajouter des fonctionnalités et de potentiellement déplacer notre technologie vers le cloud devrait nous permettre de mieux cibler le mid-market, même si je ne nous vois pas aller beaucoup plus loin que cela,” confie Arroyo. “Nous sommes réellement une société B2B.”

Pour commencer, Alaris cherchera des opportunités afin de recommander le logiciel TAIGER à ses clients. “Nous ne sommes pas prêts à agir comme un revendeur,” avoue Grando de l’équipe Alaris. “Mais il s’agit du genre d’alliance mondiale que nous cherchons à développer. Quand vous combinez le logiciel TAIGER avec nos scanners, nous pouvons créer quelque chose de vraiment différent sur le marché. J’aime dire que nous sommes le carburant et qu’ils sont le moteur. Nous commençons le processus en fournissant à leur moteur des images de bonne qualité, ce qui fait la différence dans la manière dont ils peuvent automatiser les transactions.”

Pour plus d’informations : https://www.documentimagingreport.com/?p=6312; http://bit.ly/TaigerSeriesB

Ralph-GammonDocument Imaging Report (DIR), est la première newsletter de gestion et de marketing concernant les opportunités et les tendances de conversion des procédures papier au format électronique. DIR est une newsletter de 8 pages rédigée deux fois par mois qui vous aide à rester au fait des développements critiques en seulement quelques minutes - ce qui vous fait gagner des heures de lecture et de recherche chaque mois. Elle est écrite pour les fournisseurs, les utilisateurs finaux et le canal de distribution pour l’industrie de l’imagerie. DIR fournit les informations internes les plus précises et impartiales du marché et vous permet de rester à l’avant-garde des changements et avancées de l’industrie. Pour vous inscrire à la DIR, ou pour un essai gratuit, veuillez consulter https://www.documentimagingreport.com/?page_id=1345

Contacter

Pour nous contacter, remplissez notre formulaire de demande d'informations ci-dessous et nous vous contacterons sous peu.

Voir la politique de confidentialité de Kodak Alaris