Lorsque réaliser des opérations automatiques sur un document numérisé s'impose, la technologie de Lad, ainsi que ses petites soeurs la Rad, l'OCR et l'ICR entrent en jeu. Zoom sur un marché plutôt mature aux nombreuses opportunités.
Lad. Derrière cet acronyme un peu barbare se cachent des technologies (OCR, Rad, ICR, etc.) destinées à lire, indexer et stocker les données contenues dans un document papier. Leur objectif : vous permettre de traiter numériquement, et par des logiciels bureautiques, le contenu d'un support physique.
+ repère
Lad : lecture automatique de documents
Rad : reconnaissance automatique de documents
OCR : reconnaissance optique des caractères
IRC : reconnaissance intelligente de caractères
Les applications de ces technologies sont nombreuses : depuis la simple transformation d'une image vers un PDF plein texte, à l'indexation de données lues sur des images grâce à un serveur OCR, en passant par la simple transformation d'une image en données tangibles tout en créant un PDF respectant une norme d'archivage. Ces outils permettent également la lecture des données pertinentes sur des formulaires venant ensuite alimenter mécaniquement des bases de données, mais aussi la lecture automatique de factures, de bons de livraison ou de courriers papier dont les données seront intégrées dans les logiciels comptables ou bureautiques.
Gains de productivité
Le secteur public comme le privé utilisent ces technologies afin de réaliser des économies de temps et de moyens, en gagnant notamment des heures, voire des journées et des mois, de saisie manuelle. Le retour sur investissement et les gains en productivité des entreprises sur le long terme sont particulièrement élevés avec de telles solutions, en leur permettant par exemple de dégager du temps à leurs employés afin qu'ils se consacrent à des tâches ayant une valeur ajoutée plus importante. Imaginez par exemple le temps et le nombre de personnes qu'il aurait fallu pour indexer à la main l'ensemble des collections numérisées alimentant Gallica, la bibliothèque numérique de la Bibliothèque nationale de France ?
Les éditeurs se montrent optimistes quant à l'état du marché global de la lecture automatique de document. C'est le cas par exemple de Grégory Laborderie, directeur des ventes d'Abbyy : "Ce marché connaît une croissance régulière et celui des produits bureautiques OCR est plutôt stable, explique-t-il, même si les projets de taille importante se font un peu plus rares". Il est vrai qu'adopter une vision et une stratégie globales du traitement documentaire reste encore une posture assez rare dans les organisations. Des opportunités seraient néanmoins à trouver du côté des entreprises de taille moyenne, plus enclines aux demandes métier et donc sur des projets plus complexes.
Le mobile, à court ou long terme
S'il est un domaine dans lequel la Lad semble actuellement trouver un second souffle, c'est bien celui des terminaux mobiles (smartphones et tablettes). "Nous avons des demandes importantes venant des cellules innovation de banques, d'opérateurs télécom et d'assurances souhaitant offrir à leur clients un nouveau canal de contractualisation", explique Venceslas Cartier, directeur marketing en charge de la partie EMEA et Inde d'A2IA. Concrètement, une telle technologie évite d'avoir à
se rendre en agence pour déposer les documents administratifs nécessaires à l'établissement d'un contrat : une simple capture de ses papiers (carte d'identité, Rib, justificatif de domicile, etc.) depuis son téléphone permet ensuite d'en extraire les informations pertinentes puis de générer un contrat automatiquement via l'application.
Dans le même esprit, la capture et la remise de chèque par terminal mobile commencent à émerger : "La Caisse d'Epargne Rhônes-Alpes, avec laquelle A2IA a collaboré, a ainsi été pionnière sur ce créneau de l'appli mobile bancaire", poursuit Venceslas Cartier. Ce type de service permet de scanner un chèque depuis son smartphone pour qu'il soit envoyé à l'établissement bancaire et traité. S'il sera tout de même nécessaire d'envoyer ensuite le chèque à sa banque par courrier, c'est la date de la prise de la photo qui constituera la date de valeur du chèque. "Ces nouvelles demandes accélèrent notre métier et nous obligent à sans cesse développer de nouvelles compétences technologiques, poursuit Venceslas Cartier ; ce marché va très vite avec des délais de mise en oeuvre beaucoup plus réduits".
Une tendance que pondère toutefois Grégory Laborderie, d'Abbyy, lequel ne considère pas la mobilité comme un marché d'avenir proche, estimant qu'elle ne concerne pour l'instant que des projets de petite taille. Selon lui, les technologies de Lad et de Rad les plus abouties seraient encore difficilement intégrables dans les types d'applications mobiles existantes. Néanmoins, ce domaine pourrait émerger selon lui à plus long terme : "Une fois que le pli d'utiliser le mobile pour tout type d'envoi de documents sera pris par les gens, cela ira vite, précise-t-il ; et les éditeurs devront suivre avec des applications intégrées permettant un retour quasi instantané des informations".
Les projets de reprise d'existant documentaire ou d'archives anciennes destinés à valoriser des fonds font toujours partie des demandes des entreprises, notamment auprès d'éditeurs de solutions historiquement positionnés sur la reconnaissance d'écriture manuscrite.
Défis technologiques
En matière d'évolution technologique, les dix dernières années ont permis d'affiner la précision et la pertinence de la capture et de la reconnaissance de caractères imprimés au point que le marché soit considéré aujourd'hui comme totalement mature, voire presque parfait. "Nous ne cherchons aujourd'hui plus à affiner le taux de reconnaissance, confirme Venceslas Cartier ; c'est plutôt sur les fonctions annexes que nous nous concentrons". De son côté, Abbyy se positionne davantage sur l'ICR, dont le marché semble principalement axé sur les champs manuscrits de formulaires à reconnaître. "Des améliorations peuvent encore être apportées dans ce domaine, explique Grégory Laborderie, et ce même si le niveau de reconnaissance est déjà élevé dans le cas de champs dits contraints".
L'ICR libre, c'est-à-dire l'écriture manuscrite, reste aujourd'hui le terrain de chasse de quelques rares éditeurs, lesquels ont eu pendant longtemps du mal à dépasser un taux intermédiaire moyen d'environ 50 %. En la matière, A2IS, n'a cessé de vouloir améliorer ses performances : "Nous avons adopté une nouvelle approche technologique depuis un an, explique Venceslas Cartier ; ces nouveaux algorithmes nous ont permis d'arriver à des taux de précision de 80 %. On se rapproche donc de l'état de l'art de l'imprimé !".
La mondialisation pousse également les éditeurs à se préoccuper de plus en plus du traitement automatique des langues afin d'élargir leurs débouchés et conquérir de nouveaux partenaires. En effet, si les solutions se sont longtemps concentrées sur les caractères latins, de grandes opportunités s'ouvrent aujourd'hui sur d'autres types d'alphabets, en imprimé et en manuscrit, tels que l'arabe, le chinois, le cyrillique ou le coréen.