5 minutes de lecture

Automatisation comptabilité

L’OCR, le secret des logiciels de traitement de facture

par Yooz le 8.06.2022

ng (20)

Pour gagner en productivité, se débarrasser des tâches à faible valeur ajoutée et pouvoir étoffer leur offre de services, les cabinets d’expertise comptable s’équipent d’outils de de gestion et de traitement automatisés des factures. Mais pour choisir la bonne solution, tirer pleinement parti de ses possibilités et rassurer les collaborateurs comme les clients sur son utilisation, il est important d’en comprendre les principes de fonctionnement des technologies. Au cours des dernières années, ces logiciels, basés sur la reconnaissance optique de caractères (OCR), ont réalisé d’énormes progrès, notamment grâce à l’intelligence artificielle (IA) et à l’automatisation de la comptabilité.

 

L’OCR, ou l’art de repérer du texte dans une image

 

Lorsqu’une photographie contient un panneau ou une enseigne, nous les remarquons aussitôt et nous en lisons le texte sans même y penser. Pour une machine, les choses sont loin d’être aussi simples. Ce que nous identifions spontanément comme des lettres ne sont pour elle qu’une juxtaposition de pixels dénuée de sens. Le but de la reconnaissance automatique des factures, optique de caractère (ROC) ou Optical Character Recognition (OCR) en anglais, est précisément de repérer les éléments de texte présents dans une image, puis de les déchiffrer caractère par caractère, pour finalement les retranscrire sous forme numérique et ainsi éliminer toute saisie manuelle.

 

Lorsqu’on présente au logiciel un document scanné (une facture, par exemple), ce n’est pour lui qu’une image comme une autre. Pour pouvoir l’analyser, il commence en général par la redresser, la nettoyer de ses parasites et la convertir en noir et blanc de manière à accentuer les contrastes (c’est la « binairisation »). Une fois ce prétraitement réalisé, l’OCR parcourt l’image pour localiser les zones de texte, détacher les mots, isoler les caractères et, finalement, reconnaître ces derniers avec certitude. En combinant plusieurs méthodes statistiques, sémiologiques et lexicographiques, on peut affiner l’analyse, par exemple pour identifier les caractères malgré les changements de police d’impression d’un document à l’autre. On peut aussi repérer ce qui ne sont que des erreurs ponctuelles d'extraction – découlant, par exemple, d’une mauvaise qualité de l’impression d’origine – et les corriger.

 

Enfin, pour lever les derniers doutes, l’OCR peut évaluer la vraisemblance des mots que forment les caractères ainsi obtenus en les comparant à des bibliothèques et des dictionnaires de référence, ainsi qu’à un historique de documents de même nature. Si le logiciel hésite entre un O et un 0 pour débuter la suite de caractères « Office365 », le voisinage du mot « Microsoft » lui donne aussitôt une réponse sans ambiguïté. Pour réaliser ce type d’analyse, Yooz s’appuie par exemple sur plus de 100 millions de factures et une base de plus d’un million de fournisseurs. Ceci permet notamment au logiciel de reconnaître les abréviations commerciales usuelles et les noms propres de société sous différents formats.

 

Vous souhaitez en découvrir davantage sur les technologies d'automatisation de la comptabilité et savoir lesquelles sont les plus efficaces pour votre tenue de compte ?  

 

CTA-FR-Webinar Replay-Expert Technologie Automatisation

 

 

De la reconnaissance des caractères à l’identification du sens

 

Au terme de cette première étape, on est donc passé d’une image à une liste de mots, qui n’ont toutefois encore aucune signification pour la machine. L’OCR a remplacé la ressaisie manuelle (ce qui est déjà beaucoup), mais pas l’aptitude humaine à distinguer d’emblée un numéro de client d’un numéro de bon de commande, un prix unitaire hors taxe du montant TTC à payer. Ceci, seuls en sont capables les outils spécialisés dans la comptabilité qui, grâce à l’intelligence artificielle, sont désormais à même de déchiffrer le sens de ce qu’ils ont numérisé.

 

Bien que se conformant aux mêmes exigences légales, il n’existe pas deux factures identiques. En revanche, on y retrouve systématiquement les mêmes informations. C’est ce qui permet à un moteur de machine learning ayant assimilé des millions d’exemples d’en reconnaître les éléments caractéristiques en dépit des spécificités de présentation propres à chaque entreprise : noms et adresses du fournisseur et du client, date, numéros de facture et de bons de commandes, détail du produit ou de la prestation, montants, mentions légales… Ne reste plus qu’à étiqueter convenablement chacune de ces données.

 

Malgré sa sophistication, ce processus qui permet de passer d’une facture papier scannée à l’inventaire ordonné des informations qu’elle contient ne dure que quelques instants. Le résultat est donc beaucoup plus rapide qu’une ressaisie manuelle. Et aussi beaucoup plus fiable : le taux d’erreur des solutions automatisées de traitement des factures est en général nettement inférieur au 1 % incompressible des opérations manuelles, ce qui représente un avantage majeur pour les pôles financiers. 

 

L’imputation automatique, levier d’efficacité pour les experts comptables

 

Une fois qu’il a ainsi numérisé et décortiqué les factures, le logiciel est en mesure d’imputer automatiquement les montants en comptabilité. Pour cela, il a deux possibilités : soit il s’appuie l’expérience accumulée par l’intelligence artificielle pour déduire seul ce dont il s’agit (des ramettes de papier sont très certainement des fournitures de bureau) ; soit il applique des règles spécifiques, développées par le cabinet pour ses clients (pour un imprimeur, ce papier est une matière première). Dans tous les cas, un comptable humain valide et complète si nécessaire les écritures, mais le gain de temps sur la production comptable reste considérable, surtout si l’on prend en compte le temps gagné à ne plus manipuler des masses de papier ou à régler les problèmes occasionnés par de simples fautes de frappe.

 

Grâce à ces gains de productivité, les cabinets d’expertise comptable peuvent réduire le coût de la tenue de comptabilité, et donc proposer cette prestation fondamentale à des tarifs nettement plus compétitifs. Par ailleurs, ils peuvent affecter leurs collaborateurs à des tâches plus intéressantes et à plus forte valeur ajoutée comme l’accompagnement des clients, l’analyse des chiffres et le développement de services d’expertise. Ce système est un levier d’efficacité opérationnelle et d'accélération de croissance sans précédent, à l'aube de la réforme de la facturation électronique 2024-2026.

 

Prêt à vous démarquer et vous imposer en tant que guide numérique ? 

 

CTA-FR-Livre blanc-Stop préjugés sur la démat