CET ARTICLE A INITIALEMENT ÉTÉ PUBLIÉ DANS ARCHIMAG N°380
Au sommaire :
- Dossier : IA et patrimoine : les professionnels témoignent
- Université de Montréal : l'IA pour déchiffrer des documents manuscrits
- ChamDoc : l'IA pour traduire une langue en voie de disparition
- Au musée de l'Armée, l'IA valorise les archives de la Libération
- L'IA en mode majeur à la Philharmonie de Paris
- SNCF : un chatbot embarque les visiteurs sur les rails du patrimoine
- Ina : l’IA au service de la découverte du patrimoine audiovisuel français
- Quel avenir pour le patrimoine culturel à l'ère de l'intelligence artificielle ?
Découvrez toutes les newsletters thématiques gratuites d'Archimag dédiées aux professionnels de la transformation numérique, des bibliothèques, des archives, de la veille et de la documentation.
En cette fin d’année 2024, l’histoire de l’intelligence artificielle est encore loin d’être écrite. Les projets de recherche en cours ne cessent de se multiplier au rythme des innovations et des prouesses des algorithmes. À Londres, le vénérable British Museum s’aventure depuis peu sur la voie du « musée vivant » via le service Living Museum qui permet aux internautes de converser avec l’un des 1,2 million d’objets du musée. Le tout en langage naturel.
« Lorsque vous voyez un objet qui éveille votre curiosité, cliquez dessus et entamez une discussion ! », explique le British Museum. « Cet objet répondra à vos questions sur ses origines, son importance et son contexte historique, mêlant ainsi la connaissance du monde à sa propre histoire. » Le service en ligne (également disponible sous forme d’application) se permet même de parler en français !
Ainsi, la vignette correspondant à un dessin au fusain de Raphaël (1483 - 1520) apporte une première réponse : « Oh là là, je suis une œuvre italienne qui a passé plus de 100 ans au British Museum à Londres, mais je peux certainement converser en français ! À l’époque où Raphaël m’a créé à Rome, le français était d’ailleurs très prisé dans les cours italiennes ». Non content d’apporter ce premier niveau de réponse, Living Museum est en mesure de poursuivre la conversation sur la technique picturale utilisée par Raphaël ou bien sur les conditions de conservation du dessin à Londres.
Lire aussi : Patrimoine et innovation : faut-il repenser les musées et les lieux de culture ?
Images, notices et métadonnées
Derrière ce service, une intelligence artificielle est alimentée avec des images, des notices et des métadonnées relatives aux 1,2 million d’objets rassemblés dans la collection numérique du British Museum. « Nous pensons que l’utilisation appropriée de la technologie peut augmenter l’immersion, améliorant ainsi les résultats éducatifs, sans sacrifier l’authenticité requise pour les institutions historiques et culturelles », explique Jonathan Talmi, le créateur du Living Museum.
À ses yeux, l’intelligence artificielle n’en est qu’à ses débuts dans la valorisation patrimoniale : « le monde connaît une évolution technologique rapide. Les modèles d’IA générative peuvent simuler des personnages, des scènes et, dans un avenir pas si lointain, des mondes entiers, avec un réalisme saisissant. Impossibles à distinguer des humains, les agents conversationnels seront bientôt omniprésents ».
Lire aussi : La BnF et l'Ina en négociation avec le consortium ARGIMI pour alimenter la future IA générative
En attendant Argimi
En France, les grandes institutions culturelles se mettent elles aussi en ordre de marche pour ne pas rater le train de l’intelligence artificielle. Depuis plusieurs mois, la Bibliothèque nationale de France et l’Institut national de l’audiovisuel sont en discussion avec des start-up dans le cadre du consortium Argimi. Objectif : exploiter les ressources numériques de la BnF et de l’Ina afin de développer une intelligence artificielle générative francophone.
Ce n’est un secret pour personne, les deux institutions sont assises sur un tas d’or patrimonial. À elle seule, la bibliothèque numérique Gallica propose plus de dix millions de documents numérisés et les collections de la BnF comptent également plus de 54 millions de fichiers collectés au titre des archives du web. Surtout, ces collections bénéficient de métadonnées de qualité.
Quant à l’Ina, ses collections représentent aujourd’hui plus de 27 millions d’heures de documents TV et radio. L’Institut national de l’audiovisuel collecte également 182 chaînes TV et radio au titre du dépôt légal.
Lire aussi : Gilles Pécout : "l’intelligence artificielle a bien entendu sa place à la BnF"
À ce jour, très peu d’informations circulent sur ce projet. Gilles Pécout, président de la BnF, a confirmé à Archimag, lors d’un entretien en novembre dernier, les discussions en cours avec les trois jeunes pousses impliquées dans le consortium (Artefact, Giskard et Mistral AI).
Mais en posant ses conditions : la BnF exige que seuls les corpus libres de droits servent à entraîner les modèles de langage. « La Bibliothèque nationale de France doit suivre en responsabilité l’usage de ce corpus, ainsi que s’assurer du respect du RGPD et du droit d’auteur. À ce jour, les choses sont en cours d’élaboration. Nous en saurons plus au printemps prochain. »