Digital asset management (Dam) : l'intelligence artificielle automatise le traitement des photos, sons et vidéos

Les spécialistes des solutions de gestion des actifs numériques (Dam pour digital asset management) se mettent de plus en plus souvent en capacité d’entraîner des intelligences artificielles (IA) via leurs propres technologies ou celles de tiers. L’objectif ? L'automatisation des traitements sur les images, les sons et les vidéos… Décryptage.

Temps de lecture : 6 minutes

>>>Vous souhaitez en savoir plus sur la gestion des ressources multimédia et le digital asset management (Dam) ?
Découvrez le dernier guide pratique d'Archimag sur le sujet : Gérer et valoriser ses ressources multimedia.

Découvrez comment et avec quels outils stocker, gérer et valoriser l'ensemble de vos ressources multimédia ! Car les images fixes ou animées sont au coeur de nombreux métiers (marketing, communication, documentation, patrimoine...) !

Toujours aussi bouillonnant, voire "encombré", le marché du Dam (les solutions de gestion des actifs ou des ressources numériques) est au niveau international dominé par une quinzaine d’éditeurs, tels Adobe (avec Adobe Experience Manager), Aprimo, Celum, MediaBeacon, Nuxeo et OpenText (avec OpenText Digital Asset Management).

Ils se distinguent, d’après l’institut de recherche Forrester, par l’intuitivité et l’ergonomie de leurs interfaces, qui se doivent d’être simples et faciles à utiliser par tous les collaborateurs, et par leurs capacités à s’intégrer avec les outils permettant aussi bien de créer des contenus numériques que de les diffuser.

Mais ils se démarquent surtout par les avancées dans l’utilisation de l’intelligence artificielle ou de l’apprentissage automatique (machine learning) pour enrichir les contenus numériques et les catégoriser dans de toutes petites entités potentiellement réutilisables.

Partenariats avec les Gafam

Pour cela, il est possible d’utiliser avec les plateformes de Dam les solutions d’éditeurs spécialisés à 100 % dans l’intelligence artificielle appliquée aux images, aux textes ou aux vidéos (Clarifai ou Vue.ai, par exemple).

Les éditeurs spécialisés peuvent exploiter depuis leurs outils (à un tarif intéressant) des interfaces de programmation (API) d’outils de traitement des images développés par plusieurs géants du numérique.

C’est le cas de la technologie de deep learning (apprentissage profond) Amazon Rekognition, facturée proportionnellement au nombre d’images traitées. Elle permet entre autres d’identifier des objets, des scènes, des visages ou du texte dans des images et des vidéos.

Google suit un modèle économique comparable et propose pour sa part une API Vision pour faciliter la reconnaissance du texte ou bien l’identification et le "taggage" des objets et des visages à l’aide de modèles de machine learning "préentraînés". Il s’est aussi doté d’une solution AutoML, qui offre la possibilité à un éditeur ou une entreprise de créer et d’entraîner ses propres modèles de machine learning sur un corpus d’images hébergées sur le cloud ou stockées dans des applications maison.

Entraînement d’IA pour des secteurs spécifiques

Eric-Barroca-DAM-Nuxeo-intelligence-artificielle "À notre avis, il n’y a pas de marché pour de l’IA générique", précise Eric Barroca, PDG de l’éditeur d’origine française Nuxeo, qui propose une solution de Dam et travaille depuis plus de deux ans à l’ajout de nouvelles fonctionnalités d’intelligence artificielle.

Il précise : "Les solutions des grands groupes du numérique, qui sont intéressantes sur certains aspects, ne sont en revanche pas du tout adaptées pour répondre à des besoins métier très précis. C’est ce que nous faisons, par exemple, pour un constructeur automobile : nous avons entraîné des modèles pour automatiser l’identification de tous les modèles de véhicules figurant dans des images ou des vidéos. Nous avons aussi entraîné des modèles pour des marques de chaussures de sport ou de cosmétiques, qui souhaitent vérifier que l’utilisation de leurs contenus numériques dans tel ou tel pays est en conformité avec la protection de leur image ou avec les contrats qu’elles ont signés avec telle ou telle personnalité y figurant".

jacques-thiebauld-dam-dalim-software-intelligence-artificielle L’allemand Dalim Software utilise quant à lui l’IA pour deux principales tâches, précise Jacques Thiebauld, directeur technologies : "Il y a, d’une part, la génération de mots-clés et le taggage des images et, d’autre part, la recherche de similarités sur la base des images enregistrées".

Il ajoute : "Nous préentraînons des modèles pour des industries très spécifiques, comme la robinetterie. Ils vont progressivement apprendre les bons mots-clés et identifier les caractéristiques communes aux images associées".

Le machine learning au service du Dam

Dans la même veine, son concurrent français Einden, créateur de la solution Ephoto Dam, s’appuie sur l’intelligence artificielle pour proposer aux utilisateurs des "termes candidats" à associer aux contenus :

"Le machine learning permet, par exemple, de soumettre plusieurs photos d’un même produit ou d’un même engin (un avion, une voiture ou autre) au Dam, afin qu’il soit capable, après un temps d’apprentissage, de reconnaître automatiquement la marque et le modèle du produit ou de l’engin en question", écrit l’entreprise sur son blog. Il en va de même pour la reconnaissance des individus, à condition d’avoir "au préalable pris soin de nourrir l’algorithme avec des photos de ces personnes" : "Le système est autoapprenant et progresse à mesure qu’il est sollicité".

Données d’utilisation, données sensibles

À l’avenir, et en complément de son utilité pour "l’étiquetage automatique", l’intelligence artificielle devrait en outre aider les spécialistes du Dam à optimiser en temps réel l’expérience offerte aux utilisateurs des solutions.

C’est le pari du français Wedia, qui souligne, sur son site internet, que le système peut notamment s’appuyer sur l’IA pour "apprendre de l’utilisateur et créer des widgets présentant les derniers téléchargements sur la base des métadonnées [qu’il] recherche chaque jour ou des derniers éléments sur lesquels il a travaillé"

Les recherches se multiplient aussi pour aider les entreprises à améliorer la capacité des solutions à extraire des contenus dans tous types de médias, y compris les plus secrets. Le groupe français Oodrive, spécialisé dans la gestion des données sensibles, vient ainsi de racheter à Algoba Systems sa solution de gestion des médiathèques et de photothèques Orphea, au motif que les données média (images, vidéos et documents) sont souvent "au cœur de projets confidentiels et stratégiques" et "nécessitent à ce titre un traitement spécifique et très exigeant en matière de sécurité".

Recherches en cours

andre-capurro-dam-orkis-intelligence-artificielle Actif depuis près de 30 ans sur ce segment de marché, et partenaire de nombreuses entreprises utilisant ses solutions pour des photothèques ou des médiathèques, l’éditeur Orkis a commencé à utiliser l’IA sur des documents audio dès 2011, explique André Capurro, son fondateur.

L’entreprise, à l’origine du logiciel et du service web Ajaris, crée quelques années plus tard son propre laboratoire de recherche et de développement. Il collabore étroitement, entre autres, avec le Laboratoire informatique d’Avignon (LIA), en pointe sur le traitement automatique du langage et de la parole.

Le but ? Automatiser au maximum les tâches d’indexation et réduire ainsi le temps conséquent jusqu’ici dévolu à l’extraction des données se trouvant dans les contenus lourds (images, sons et vidéos), "plus difficiles à traiter que les contenus textuels" selon André Capurro. "Nous explorons deux principaux axes de recherche", détaille ce responsable :

"Le premier est le sous-titrage automatisé du son des vidéos, grâce auquel nous arrivons aujourd’hui à injecter de façon quasi parfaite le texte associé dans Ajaris. Le second est la détection de visages dans les images fixes et les vidéos, dans un objectif de gestion des droits (nous pouvons par exemple flouter les visages des personnes qui n’ont pas donné leur consentement et identifier automatiquement des dirigeants ou des élus)".

La sémantique pour l'extraction d'information

Depuis peu, ce spécialiste, convaincu de l’utilité de se démarquer des offres d’indexation grand public des Gafam, travaille sur d’autres algorithmes liés à la "la reconnaissance de formes" ou à "la gestion des bases de couleurs".

Il participe également, aux côtés du LIA et du laboratoire d’informatique de l’université du Mans, à un nouveau projet de recherche sur l’intelligence artificielle bénéficiant d’un financement de l’ANR (Agence nationale de la recherche). L’objectif est de "développer de nouveaux modèles sémantiques au niveau de la phrase et au niveau de la conversation pour l’extraction d’information pertinente depuis des documents parlés".

Orkis pourrait ainsi parvenir à terme à ajouter des fonctionnalités de résumé automatique aux capacités existantes d’Ajaris en matière de transcription de la voix. Intelligent.

Digital asset management (Dam) : l'intelligence artificielle automatise le traitement des photos, sons et vidéos

digital-asset-management-intelligence-artificielle.jpg

Partenariats avec les Gafam

Entraînement d’IA pour des secteurs spécifiques

Le machine learning au service du Dam

Données d’utilisation, données sensibles

Recherches en cours

La sémantique pour l'extraction d'information

Les derniers mags :

Les derniers guides :

Partitio : Transport et Logistique : vers une chaîne logistique plus collaborative, digitale et centrée sur le client ? Les cas du Dossier Transit et du Rapprochement des Factures

Coexel : Libérez le potentiel de la Veille avec l’IA Générative

Archimag : Signature électronique : Ajoutez une touche de sécurité et de conformité à votre business !

Kodak Alaris : Rapport d’enquête : les banques, assurances et mutuelles face à la dématérialisation

Box : Entreprises du luxe et du retail : comment optimiser la gestion du contenu en mêlant sécurité, omnicanalité et IA ?

Konica Minolta : Bailleurs sociaux : boostez votre efficacité avec le digital