CET ARTICLE A INITIALEMENT ÉTÉ PUBLIÉ DANS ARCHIMAG N°380
Au sommaire :
- Dossier : IA et patrimoine : les professionnels témoignent
- Université de Montréal : l'IA pour déchiffrer des documents manuscrits
- ChamDoc : l'IA pour traduire une langue en voie de disparition
- Au musée de l'Armée, l'IA valorise les archives de la Libération
- L'IA en mode majeur à la Philharmonie de Paris
- SNCF : un chatbot embarque les visiteurs sur les rails du patrimoine
- Ina : l’IA au service de la découverte du patrimoine audiovisuel français
- Quel avenir pour le patrimoine culturel à l'ère de l'intelligence artificielle ?
Découvrez L'Archiviste Augmenté, la newsletter thématique gratuite d'Archimag dédiée aux professionnels des archives et du patrimoine !
« Maurice Ravel à travers sa correspondance et ses écrits »… « Une immersion dans l’univers musical de Pierre Boulez »… « La formation musicale en pédagogie collective »… Ces trois conférences ne sont qu’un bref aperçu des centaines de conférences et colloques organisés par la Philharmonie de Paris et par la Cité de la Musique depuis plus de vingt ans. Bonne nouvelle : ces événements ont fait l’objet d’un enregistrement. Ils représentent environ 1 200 heures de contenus audio et/ou vidéo qui sont en cours de traitement grâce à l’intelligence artificielle (IA) en vue de leur valorisation. Objectif : indexer ces « archives de la parole » en profondeur et les mettre à disposition des usagers via des outils de recherche intuitifs.
« Dans un premier temps, tous ces enregistrements ont fait l’objet d’un catalogage, réalisé par un documentaliste, et d’une transcription automatique », explique Rodolphe Bailly, adjoint à la direction Médiathèque et Archives au sein du Département des savoirs de la Cité de la musique - Philharmonie de Paris. « L’IA est utilisée pour aider à ce catalogage et ajouter un niveau d’indexation du contenu jusqu’alors impossible, parce que beaucoup trop chronophage ».
La transcription de l’audio vers le texte permet une extraction d’entités nommées, telles que les noms de compositeurs, les interprètes, les orchestres, les œuvres musicales… « Nous utilisons GPT 3.5 pour la phase d’extraction, puis GPT 4.o pour la phase de correction », poursuit-il. « La transcription est ensuite utilisée pour un nouveau traitement en vue d’obtenir une représentation vectorielle. Il s’agit de rapprocher des mots entre eux lorsqu’il existe une proximité sémantique : homme/femme, roi/reine… » Ces représentations vectorielles (embeddings) sont à leur tour intégrées dans une base de données.
Lire aussi : Des archives inédites de Jimi Hendrix mises aux enchères
Une frise interactive pour les résultats
L’utilisateur peut alors lancer une requête au sein de cette base de données du type : « Jean-Sébastien Bach et le violoncelle ». L’outil présente une série de résultats sous forme de frise interactive grisée. Des rectangles bleus signalent les passages de la conférence dans lesquels les termes « Jean-Sébastien Bach » et « violoncelle » sont associés. « Parfois, cela fonctionne très bien, et parfois moins », reconnaît Rodolphe Bailly.
« Nous travaillons à l’amélioration de la pertinence des résultats, d’abord en interne, puis probablement avec des usagers de la médiathèque qui nous aideront à valider et à améliorer l’interface de recherche et de résultats ». Lancé au mois de septembre 2023, ce projet a reçu le soutien financier du Fonds d’accompagnement à la transformation numérique du ministère de la Culture.
La Philharmonie destine cette future application à son service des éditions, qui pourra créer des podcasts à partir de ces « archives de la parole », mais aussi aux musicologues et aux usagers qui fréquentent la médiathèque. D’ores et déjà, un autre outil, lui aussi basé sur l’IA, est mis à disposition de tous les internautes : ScoreBot, un agent conversationnel spécialisé dans la recherche de partitions qui permet d’effectuer des recherches par compositeur, genre, instrumentation et niveau de difficulté.
Lire aussi : Qui est Noria, ce chatbot à base d'IA qui permet d'accéder aux archives de l'Algérie française ?
Le témoignage du professionnel
Pour Rodolphe Bailly, qui a étudié à l’Ircam (Institut de recherche et coordination acoustique/musique) et qui se déclare particulièrement intéressé par la technologie et son évolution, il n’y a pas de doute : « l’IA va bouleverser la chaîne documentaire, qu’il s’agisse de l’aide au catalogage ou de l’assistance à la recherche ».
Selon lui, les métiers de la documentation vont devoir se former à l’IA : « il n’y a pas de crainte de la voir remplacer nos métiers, mais une chose est sûre, la formation sera indispensable pour comprendre le fonctionnement et l’impact de l’IA sur nos métiers. Au sein de la Philharmonie, tout le monde est enthousiaste à l’idée de découvrir les futures applications de l’IA ! »