<img height="1" width="1" style="display:none;" alt="" src="https://dc.ads.linkedin.com/collect/?pid=565596&amp;fmt=gif">

4 minutes de lecture

La dématérialisation des factures

Logiciel OCR factures : tout comprendre et faire le bon choix

par Angélique Ribas le 2.04.2020

blog-comprendre-l-ocr-en-3-minutes-partie2

L'OCR : un de ces termes techniques à la mode dont nous entendons beaucoup parler ces derniers temps.  Il présente un intérêt notable dans la FinTech (un autre nouvel acronyme à la mode qui signifie « Financial Technology », ou technologies financières) et plus particulièrement pour les fonctions comptables, lorsque nous abordons la dématérialisation des factures. De quoi s’agit-il ?

 

Plus important encore, de quoi ne s’agit-il pas ? Comment cela fonctionne ? Et en quoi cela peut-il impacter la gestion des processus comptables ? Dans ce premier article, nous vous donnerons quelques indices pour comprendre l'OCR.

 

OCR (Optical Character Recognition) signifie reconnaissance optique de caractères. 

 

La reconnaissance optique de caractères est la conversion mécanique ou électronique d'images de textes dactylographiés, imprimés ou même manuscrits, en textes codés par machine. Le texte peut provenir d'un document scanné, d’une image, ou de textes sous-titrés superposés à une image (comme dans une émission télévisée).

 

Premier indice : voici comment cela se présente

 

 

 

En termes simples, il s'agit d'un ordinateur qui, en examinant une image ou un fichier, est capable d'identifier son contenu.

 

Deuxième indice : ne pas confondre OCR avec extraction de données

 

 

L’OCR est une technique qui permet la conversion d’une image en texte. La brique suivante est l'extraction intelligente de données qui reconnaît et traite le texte extrait de l'OCR pour le transformer ensuite en données pertinentes. Vous êtes nombreux à vous tourner vers des fournisseurs de solutions de dématérialisation et vous vous demandez peut-être s’ils disposent de la technologie OCR ? Bonne question. Mais en réalité, ce que vous souhaitez savoir est si la solution offre une technologie complète, qui combine à la fois OCR, extraction intelligente de données et Machine Learning.

 

Aujourd'hui, il existe trois principales technologies d'extraction de données :

 

  1. Extraction vérifiée par l'homme ou externalisée ;
  2. Extraction par zones à partir de modèles prédéfinis ;
  3. Systèmes reposant sur l'intelligence artificielle (IA) ou le Machine Learning

 

Troisième indice : Ces méthodes sont toutes nécessaires car l'OCR seul ignore ce qu'il doit faire des informations qu'il lit.

 

Certains fournisseurs utilisent la reconnaissance optique de caractères (OCR), mais ont recours ensuite à des méthodes d’extraction manuelle, en externalisant cette tâche, également appelée « vérification par une tierce partie ». L'extraction OCR, qui nécessite le contrôle humain, fait intervenir des opérateurs pour saisir les données lues par l'OCR dans des champs prédéfinis. Dans ce cas de figure, la saisie manuelle des données est externalisée et peut s'avérer particulièrement longue, généralement de 24 à 72 heures ouvrables. Ce qui, vous en conviendrez, est contraire à l'objectif visant à passer d'un processus manuel à un processus automatisé pour gagner en efficacité et en productivité.

 

Nous avons aussi fait la distinction entre la reconnaissance optique de caractères et la technologie d'extraction de données. Pour mémoire, il existe trois principales technologies d'extraction de données, dont l’extraction vérifiée par l'homme ou externalisée, l'extraction par zones à partir de modèles prédéfinis ou l'extraction intelligente reposant sur l'intelligence artificielle (IA) ou le Machine Learning .

 

L'automatisation intelligente des processus financiers

 

Les solutions que nous évoquerons ici sont dotées de technologies intelligentes, puissantes et auto-apprenantes.

 

  • Grâce à leurs technologies de reconnaissance de documents basées sur l’I.A., elles savent localiser et extraire automatiquement les données à reconnaître avec un taux de fiabilité proche de 100% sans aucune indication préalable nécessaire de la part de l’utilisateur. Les documents sont ensuite soumis pour approbation et enregistrés dans un outil ERP ou logiciel comptable.
  • Elles permettent de s’adapter aux documents à structure variable (factures, contrats, relevés de banque) et de les classer automatiquement par nature logique.
  • Grâce à l’observation de millions d'exemples, l'outil est en mesure de s'appuyer sur son expérience pour tirer des conclusions. C'est ce qu'on appelle le « machine learning », l'essence même de l'I.A.

Les opérateurs passent ainsi de la saisie manuelle des données à la simple vérification de l'exactitude des données extraites. Si des incohérences ou des erreurs sont détectées, ce logiciel intelligent les signale aux utilisateurs. Grâce à l'optimisation des méthodes de machine learning, le système deviendra de plus en plus intelligent avec le temps, réduisant ainsi le nombre d'erreurs.

 

Vous souhaitez en savoir plus sur ces technologies intégrées aux dernières solutions de dématérialisation de factures ?

 

Je découvre concrètement comment dématérialiser mes factures !

 

 

 

Sources

Hewlett Packard Enterprise Development LP. 2018. Extrait le 29 juin 2018

    Pour en savoir plus sur ce sujet :