Découvrez Le Brief de la Démat, la newsletter thématique gratuite d'Archimag dédiée aux projets de dématérialisation et de transformation numérique !
Si, auparavant, il était assez simple de classer ses documents et d’identifier les informations importantes, la tâche est aujourd’hui beaucoup moins aisée !
En effet, les données essentielles peuvent être contenues dans une multitude de supports (textes, photos, vidéos, schémas, etc.), dont le volume s’accroît au sein des organisations. Recenser, à la main, les data intéressantes et les centraliser dans des tableurs est une activité largement dépassée, en plus d’être coûteuse et source d’erreurs.
> Lire aussi : GED, Intelligence artificielle et données : où en sont les organisations ?
Un zest d’IA dans son système de gestion de l’information
D’où l’intérêt, pour y remédier, d’implémenter un peu d’intelligence artificielle à sa Ged ou son ECM. En effet, la technologie est parfaitement capable de se substituer à l’humain pour traiter les contenus, surtout lorsque ces derniers sont nombreux.
Correctement utilisées, l’IA et l’automatisation peuvent aussi bien extraire des données que des métadonnées cohérentes, bien utiles pour indexer et gérer les contenus et permettre de retrouver facilement l’information dont vous avez besoin.
> Lire aussi : Comment la recherche d'information se transforme avec l'intelligence artificielle
Intelligence artificielle, automatisation et métadonnées : un ménage à trois qui porte ses fruits
L’IA peut désormais lire, créer et indexer des métadonnées pour divers contenus, des documents bien entendu, mais aussi des images, des vidéos ou encore des sons.
Pour ce faire, elle peut s’appuyer sur un large panel d’outils : reconnaissance des caractères (OCR), de visages, de formes, de lieux, de couleurs, machine learning, moteur speech-to-text (ou parole-texte), etc. Autant de leviers qui contribuent à une fabrication plus rapide des métadonnées, indispensables à la recherche et à l’exploitation de contenus au sein des organisations.
Vers une indexation automatique des contenus
Cependant, l’intérêt des métadonnées ne se limite pas simplement à faciliter l’accès aux informations ! Elles contribuent également à l’automatisation de certaines tâches, et tout particulièrement à l’indexation des contenus.
En effet, les logiciels de digital asset management (Dam), par exemple, ont recours aux métadonnées pour rendre plus intelligente et plus fine l’indexation des ressources qu’ils agrègent. Par ailleurs, les métadonnées peuvent contenir des informations assurant une meilleure compréhension des contenus. Par exemple, les métadonnées relatives à un document partagé par plusieurs collaborateurs vont intégrer un historique de modifications pour fluidifier le travail collaboratif et garantir un meilleur suivi.
> Lire aussi : Gestion des connaissances : la révolution de l’intelligence artificielle
Le machine learning à la rescousse
Et ce n’est pas tout, puisque le machine learning permet d’aller plus loin avec les métadonnées. En effet, en s’appuyant sur l’apprentissage en continu, les systèmes concernés peuvent anticiper les besoins des professionnels (recherche prédictive) ou les aider à prendre de meilleures décisions via des recommandations intelligentes.
Évidemment, plus les métadonnées sont nombreuses, complètes et pertinentes, plus la technologie est efficace. Cette association révèle le vrai potentiel des outils de gestion de données, alimentés en continu par le pool de data de l’organisation et par l’intégration automatique de métadonnées, notamment à partir d’applications Saas (Hubspot, Koban, Salesforce, etc.).
Les métadonnées sans se ruiner
L’utilisation d’outils performants soulève cependant la question – légitime – des coûts nécessaires à la création et à l’exploitation des métadonnées. En réalité, ce processus ne nécessite généralement que deux étapes : la complétude et la validation des métadonnées, puis l’ajout de valeur. De plus en plus d’organisations s’intéressant aux métadonnées confient leurs catalogues de données à des développeurs ou intégrateurs, dont l’intervention évite aux collaborateurs en interne de perdre du temps à saisir les métadonnées manuellement. En contrepartie, ce choix est synonyme de dépenses importantes.
Pour les structures faisant le choix de l’internalisation, la maîtrise des coûts est plus aisée. Certes, il est encore difficile de recruter des data scientists, le métier étant encore trop récent et peu répandu, mais de nombreux logiciels de gestion de contenus dopés à l’IA (Dam, ECM, IIM, etc.) sont disponibles sur le marché. Aujourd’hui, la priorité est avant tout de disposer d’un outil basé sur une IA suffisamment performante pour assurer la création et le traitement des métadonnées.
> Lire aussi : Quand les archives font appel à l'intelligence artificielle
De multiples outils pour répondre aux besoins des professionnels
Les solutions pullulent sur le marché de l’IA. Difficile de faire sans les Gafam et les multiples outils qu’ils proposent : Google Vision (analyse granulaire des images basée sur le machine learning), Amazon Textract (reconnaissance et extraction de données spécifiques), Microsoft Cognitive Services (OCR et machine learning, entre autres), etc. La limite de ces solutions : elles ne proposent que des modèles génériques ne répondant pas nécessairement aux besoins métier des organisations.
C’est ainsi que d’autres éditeurs, à l’instar de Nuxeo, se distinguent grâce à des services personnalisés et sont capables de générer des données spécifiques en adéquation avec les attentes de leurs utilisateurs. D’autres, tels qu’Informatica, développent des solutions complètes pouvant collecter les métadonnées pour renseigner les utilisateurs au mieux. Enfin, pour les contenus multimédias, il est préférable d’utiliser des outils adaptés, comme les logiciels de Dam de Wedia, Keepeek, MomaSoft, Einden, Orkis, Dalim Software et consorts qui classent automatiquement les images et vidéos en leur attribuant les métadonnées appropriées.
> Lire aussi : Intelligence artificielle : une veille augmentée ?
Bien choisir sa solution
Ces exemples ne sont cependant qu’une infime partie des nombreux outils disponibles sur le marché. Pour ne pas se tromper, plusieurs caractéristiques sont déterminantes dans le choix du logiciel de gestion de contenu à retenir : intégration facilitée, interopérabilité, adaptation aux différents contenus, administration aisée, capacité à traiter des volumes importants, etc.
Surtout, la solution doit disposer d’un machine learning adapté aux besoins de l’organisation, avec des modèles d’apprentissage pouvant évoluer et s’améliorer constamment. Par ailleurs, la technologie ne remplace pas l’humain : une intervention manuelle est toujours nécessaire pour valider les métadonnées créées. Aussi, l’outil retenu doit disposer d’une interface simple à utiliser, tenant compte de ces étapes de validation. Enfin, l’IA doit elle aussi être à la hauteur et répondre aux besoins des utilisateurs, tant en production de métadonnées que sur la recherche d’information.