Temps de lecture : 6 minutes
>>>Vous souhaitez en savoir plus sur la gestion des ressources multimédia et le digital asset management (Dam) ?
Découvrez le dernier guide pratique d'Archimag sur le sujet : Gérer et valoriser ses ressources multimedia.
Découvrez comment et avec quels outils stocker, gérer et valoriser l'ensemble de vos ressources multimédia ! Car les images fixes ou animées sont au coeur de nombreux métiers (marketing, communication, documentation, patrimoine...) !
Lire aussi : Comment gérer et valoriser vos photos et vidéos ? Voici les meilleurs méthodes et outils !
Toujours aussi bouillonnant, voire "encombré", le marché du Dam (les solutions de gestion des actifs ou des ressources numériques) est au niveau international dominé par une quinzaine d’éditeurs, tels Adobe (avec Adobe Experience Manager), Aprimo, Celum, MediaBeacon, Nuxeo et OpenText (avec OpenText Digital Asset Management).
Ils se distinguent, d’après l’institut de recherche Forrester, par l’intuitivité et l’ergonomie de leurs interfaces, qui se doivent d’être simples et faciles à utiliser par tous les collaborateurs, et par leurs capacités à s’intégrer avec les outils permettant aussi bien de créer des contenus numériques que de les diffuser.
Mais ils se démarquent surtout par les avancées dans l’utilisation de l’intelligence artificielle ou de l’apprentissage automatique (machine learning) pour enrichir les contenus numériques et les catégoriser dans de toutes petites entités potentiellement réutilisables.
Lire aussi : Photos, vidéos, sons : quel logiciel choisir pour gérer vos ressources multimédia (avec comparatif) ?
Partenariats avec les Gafam
Pour cela, il est possible d’utiliser avec les plateformes de Dam les solutions d’éditeurs spécialisés à 100 % dans l’intelligence artificielle appliquée aux images, aux textes ou aux vidéos (Clarifai ou Vue.ai, par exemple).
Les éditeurs spécialisés peuvent exploiter depuis leurs outils (à un tarif intéressant) des interfaces de programmation (API) d’outils de traitement des images développés par plusieurs géants du numérique.
C’est le cas de la technologie de deep learning (apprentissage profond) Amazon Rekognition, facturée proportionnellement au nombre d’images traitées. Elle permet entre autres d’identifier des objets, des scènes, des visages ou du texte dans des images et des vidéos.
Google suit un modèle économique comparable et propose pour sa part une API Vision pour faciliter la reconnaissance du texte ou bien l’identification et le "taggage" des objets et des visages à l’aide de modèles de machine learning "préentraînés". Il s’est aussi doté d’une solution AutoML, qui offre la possibilité à un éditeur ou une entreprise de créer et d’entraîner ses propres modèles de machine learning sur un corpus d’images hébergées sur le cloud ou stockées dans des applications maison.
Lire aussi : Comment le Digital Asset Management permet de valoriser les vidéos
Entraînement d’IA pour des secteurs spécifiques
"À notre avis, il n’y a pas de marché pour de l’IA générique", précise Eric Barroca, PDG de l’éditeur d’origine française Nuxeo, qui propose une solution de Dam et travaille depuis plus de deux ans à l’ajout de nouvelles fonctionnalités d’intelligence artificielle.
Il précise : "Les solutions des grands groupes du numérique, qui sont intéressantes sur certains aspects, ne sont en revanche pas du tout adaptées pour répondre à des besoins métier très précis. C’est ce que nous faisons, par exemple, pour un constructeur automobile : nous avons entraîné des modèles pour automatiser l’identification de tous les modèles de véhicules figurant dans des images ou des vidéos. Nous avons aussi entraîné des modèles pour des marques de chaussures de sport ou de cosmétiques, qui souhaitent vérifier que l’utilisation de leurs contenus numériques dans tel ou tel pays est en conformité avec la protection de leur image ou avec les contrats qu’elles ont signés avec telle ou telle personnalité y figurant".
L’allemand Dalim Software utilise quant à lui l’IA pour deux principales tâches, précise Jacques Thiebauld, directeur technologies : "Il y a, d’une part, la génération de mots-clés et le taggage des images et, d’autre part, la recherche de similarités sur la base des images enregistrées".
Il ajoute : "Nous préentraînons des modèles pour des industries très spécifiques, comme la robinetterie. Ils vont progressivement apprendre les bons mots-clés et identifier les caractéristiques communes aux images associées".
Lire aussi : Une iconographe à la bibliothèque de Sciences Po : entre gestion des droits, Dam et valorisation
Le machine learning au service du Dam
Dans la même veine, son concurrent français Einden, créateur de la solution Ephoto Dam, s’appuie sur l’intelligence artificielle pour proposer aux utilisateurs des "termes candidats" à associer aux contenus :
"Le machine learning permet, par exemple, de soumettre plusieurs photos d’un même produit ou d’un même engin (un avion, une voiture ou autre) au Dam, afin qu’il soit capable, après un temps d’apprentissage, de reconnaître automatiquement la marque et le modèle du produit ou de l’engin en question", écrit l’entreprise sur son blog. Il en va de même pour la reconnaissance des individus, à condition d’avoir "au préalable pris soin de nourrir l’algorithme avec des photos de ces personnes" : "Le système est autoapprenant et progresse à mesure qu’il est sollicité".
Lire aussi : Comment choisir un logiciel de DAM ou de photothèque ?
Données d’utilisation, données sensibles
À l’avenir, et en complément de son utilité pour "l’étiquetage automatique", l’intelligence artificielle devrait en outre aider les spécialistes du Dam à optimiser en temps réel l’expérience offerte aux utilisateurs des solutions.
C’est le pari du français Wedia, qui souligne, sur son site internet, que le système peut notamment s’appuyer sur l’IA pour "apprendre de l’utilisateur et créer des widgets présentant les derniers téléchargements sur la base des métadonnées [qu’il] recherche chaque jour ou des derniers éléments sur lesquels il a travaillé"
Les recherches se multiplient aussi pour aider les entreprises à améliorer la capacité des solutions à extraire des contenus dans tous types de médias, y compris les plus secrets. Le groupe français Oodrive, spécialisé dans la gestion des données sensibles, vient ainsi de racheter à Algoba Systems sa solution de gestion des médiathèques et de photothèques Orphea, au motif que les données média (images, vidéos et documents) sont souvent "au cœur de projets confidentiels et stratégiques" et "nécessitent à ce titre un traitement spécifique et très exigeant en matière de sécurité".
Lire aussi : Comment le DAM révolutionne la gestion du packaging
Recherches en cours
Actif depuis près de 30 ans sur ce segment de marché, et partenaire de nombreuses entreprises utilisant ses solutions pour des photothèques ou des médiathèques, l’éditeur Orkis a commencé à utiliser l’IA sur des documents audio dès 2011, explique André Capurro, son fondateur.
L’entreprise, à l’origine du logiciel et du service web Ajaris, crée quelques années plus tard son propre laboratoire de recherche et de développement. Il collabore étroitement, entre autres, avec le Laboratoire informatique d’Avignon (LIA), en pointe sur le traitement automatique du langage et de la parole.
Le but ? Automatiser au maximum les tâches d’indexation et réduire ainsi le temps conséquent jusqu’ici dévolu à l’extraction des données se trouvant dans les contenus lourds (images, sons et vidéos), "plus difficiles à traiter que les contenus textuels" selon André Capurro. "Nous explorons deux principaux axes de recherche", détaille ce responsable :
"Le premier est le sous-titrage automatisé du son des vidéos, grâce auquel nous arrivons aujourd’hui à injecter de façon quasi parfaite le texte associé dans Ajaris. Le second est la détection de visages dans les images fixes et les vidéos, dans un objectif de gestion des droits (nous pouvons par exemple flouter les visages des personnes qui n’ont pas donné leur consentement et identifier automatiquement des dirigeants ou des élus)".
Lire aussi : Ressources multimédia et image de marque : comment les gérez-vous ?
La sémantique pour l'extraction d'information
Depuis peu, ce spécialiste, convaincu de l’utilité de se démarquer des offres d’indexation grand public des Gafam, travaille sur d’autres algorithmes liés à la "la reconnaissance de formes" ou à "la gestion des bases de couleurs".
Il participe également, aux côtés du LIA et du laboratoire d’informatique de l’université du Mans, à un nouveau projet de recherche sur l’intelligence artificielle bénéficiant d’un financement de l’ANR (Agence nationale de la recherche). L’objectif est de "développer de nouveaux modèles sémantiques au niveau de la phrase et au niveau de la conversation pour l’extraction d’information pertinente depuis des documents parlés".
Orkis pourrait ainsi parvenir à terme à ajouter des fonctionnalités de résumé automatique aux capacités existantes d’Ajaris en matière de transcription de la voix. Intelligent.