Article réservé aux abonnés Archimag.com

L'intelligence artificielle au service des bibliothèques universitaires

  • bibliotheque_universitaire_intelligence_artificielle.jpg

    bibliothèque-université-intelligence-artificielle
    "Les services que peut rendre l’intelligence artificielle en bibliothèque universitaire sont nombreux, même s’ils sont peu développés encore", estime Marc Martinez, président de l’ADBU. (Freepik/macrovector_official)
  • L’ADBU a rassemblé près de 500 congressistes pour plancher sur le thème de l’intelligence artificielle dans les bibliothèques universitaires. De l’assistance aux usagers à l’indexation de corpus documentaires, le bibliothécaire va-t-il devoir se transformer en biblIAthécaire ?

    L’intelligence artificielle est partout, mais a-t-elle sa place dans les bibliothèques ? Qui plus est dans les bibliothèques universitaires ? C’est sur ce thème qu’ont planché plus de 500 professionnels du document lors du congrès annuel de l’ADBU (Association des directeurs et personnels de direction des bibliothèques universitaires et de la documentation) qui s’est tenu à Bordeaux au mois de septembre dernier.

    >Lire aussi : L'IA, des opportunités de développement pour les bibliothèques

    Le potentiel de l'IA en bibliothèque universitaire

    « Les services que peut rendre l’IA en bibliothèque universitaire sont nombreux, même s’ils sont peu développés encore », estime Marc Martinez, président de l’ADBU : assistance aux usagers, accompagnement des chercheurs sur des corpus de données étendus, automatisation d’une partie des activités documentaires…

    De fait, les BU gèrent un patrimoine documentaire qui fait figure de terrain d’expérimentation idéal pour les chercheurs en IA.

    Qu’on en juge : les données bibliographiques, les corpus numérisés et les renseignements en ligne peuvent naturellement servir de champ d’application à l’intelligence artificielle.

    199 volumes médiévaux indexés par l’IA

    Exemple concret avec le projet européen de recherche Himanis portant sur 199 volumes manuscrits du Moyen-Âge (soit 83 320 pages numérisées) qui ont été « lus » et indexés grâce à l’intelligence artificielle.

    himanis_bibliotheque_intelligence_artificielle

    « L’objectif était de créer une indexation profonde de ces corpus médiévaux », explique Dominique Stutzmann, chargé de recherche à l’Institut de recherche et d’histoire des textes-CNRS ; « ces corpus contiennent 60 % de mots en latin et sont rédigés en écriture cursive.

    L’IA améliore les résultats de recherche grâce à un entraînement qui s’est déroulé en plusieurs étapes. La recherche en plein texte permet surtout de dresser un panorama plus complet, comprenant non seulement les attestations de mots, de leurs quasi-synonymes, mais aussi des absences dans des contextes où ils pourraient intervenir ».

    >Lire aussi : Quand l'intelligence artificielle s'invite dans le traitement documentaire

    Grâce à l’IA, ces 199 manuscrits médiévaux se dévoilent un peu plus. Outre l’indexation, l’intelligence artificielle est en mesure de participer à l’étude approfondie des documents, notamment la datation des manuscrits et la reconnaissance des mains du scribe.

    L’apprentissage profond au service des bibliothèques

    À la Bibliothèque nationale de France, l’IA est également mise à contribution pour la fouille d’images et l’amélioration de la recherche. Gallica, la bibliothèque numérique de la BNF, héberge de très nombreux documents iconographiques (photographies, dessins, estampes…).

    Pour accéder à ce patrimoine, les internautes posent parfois des questions très précises :

    « Je recherche des caricatures de Georges Clémenceau dans toutes les collections » ou bien « je veux compter le nombre de visages de femme présents sur la une de Paris-Match entre 1949 et 1959 »… Convenons-en, même le plus expérimenté des bibliothécaires aurait du mal à répondre à de telles requêtes !

    >Lire aussi : Alerte : des robots bibliothécaires envahissent les bibliothèques de Singapour

    Classifier les images par genre

    « Des techniques d’apprentissage profond ainsi que l’API IIIF (l'International image interoperability framework est une API - interface de programme d’application - standardisée par le consortium IIIF ayant comme objectif de permettre la manipulation homogène d’images indépendamment de leurs localisations physiques et des établissements qui les hébergent) ont été utilisées pour entrer dans le document et le décrire.

    L’intelligence artificielle permet de classifier les images par genres (dessin, graphe, photographie…) et de créer des métadonnées de qualité », explique Jean-Philippe Moreux, expert scientifique Gallica-BNF.

    Ce nouvel outil de recherche iconographique, codéveloppé par Jean-Philippe Moreux et Guillaume Chiron (université de La Rochelle), a été baptisé GallicaPix.

    >Lire aussi : La recherche d'information juridique augmentée par l'intelligence artificielle

    gallicapix_bnf_intelligence_artificielle

    Rendre accessibles les ressources iconographiques

    « Sa création a pour point de départ le constat que les ressources iconographiques disponibles dans les imprimés, qu’il s’agisse de photographies, de dessins, de gravures ou de cartes, restent difficilement accessibles et encore peu valorisées. En tirant partie des progrès réalisés grâce aux techniques d’intelligence artificielle et en s’appuyant sur les collections numérisées avec OCR (reconnaissance optique de caractères) ou OLR (reconnaissance optique de la structuration des documents), il est pourtant possible de mieux identifier et exploiter cet immense réservoir d’images », soulignent les deux créateurs.

    À ce jour, GallicaPix permet d’effectuer des recherches sur les collections d’imprimés numérisés (livre, revue, presse) du début du vingtième siècle.

    Les limites de l'intelligence artificielle

    Pour autant, l’IA n’est pas infaillible — loin de là —  et montre parfois ses limites. La faute à des généralisations excessives réalisées à partir de jeux d’entraînement lacunaires.

    Comme le font remarquer certains chercheurs, l’intelligence artificielle méconnaît le principe de neutralité axiologique cher à Max Weber. L’IA peut en effet amplifier les discriminations et les biais parce que celles-ci sont présentes dans les données qui entraînent les algorithmes et reflètent les comportements des gens.

    >Lire aussi : Learning centers : un premier bilan pour ces bibliothèques universitaires du 21e siècle

    Bibliothécaire ou biblIAthécaire ?

    Au-delà de ses performances, l’irruption des technologies de l’IA dans les bibliothèques universitaires n’est pas sans conséquence sur le travail des bibliothécaires.

    Même si un certain brouillard flotte encore sur ce qu’il adviendra, quelques pistes semblent se dégager : « Les BU devront mettre l’IA au service de leurs usagers et de leurs services, garantir la véracité des informations, traiter les problématiques éthiques et humaines que posent ces technologies », souligne Marc Martinez.

    Pour David Aymonin, directeur de l’Abes (Agence bibliographique de l’enseignement supérieur), « l’intelligence artificielle suppose d’avoir de bonnes données, des algorithmes, des interfaces, des infrastructures, de la mémoire… et des compétences en informatique. Les professionnels de l’information-documentation peuvent se positionner sur la donnée et contribuer à la façon d’interroger l’IA ».

    >Lire aussi : Quel avenir pour les bibliothécaires en bibliothèque universitaire ?

    Montée en compétences

    Faut-il alors parler de montée en compétences ? Invitée à livrer le témoignage d’une institution non universitaire, Estelle Caron, responsable du département documentation de l’Institut national de l’audiovisuel, estime que « la question de la formation des documentalistes de l’Ina est essentielle. Tout comme le travail d’éditorialisation des collections. L’intelligence artificielle nous a obligés à repenser notre offre de services aux chercheurs : interfaces d’accès, reconnaissance d’images, transcription… Ces nouveaux usages sont aussi l’occasion de nous interroger sur la fonction de médiation ».

    congres_adbu_intelligence_artificielle

    Du côté des éditeurs et des prestataires présents au congrès de l’ADBU, on mise également sur l’IA. L’éditeur Emvista propose d’appliquer l’intelligence artificielle à l’analyse de textes, notamment la compréhension du langage naturel. Elsevier promet d’offrir des « services augmentés » aux bibliothécaires et les invite à apporter leurs compétences. Quant à la plateforme Cairn.info, elle va prochainement déployer un outil d’analyse du trafic pour mieux connaître les usages numériques en bibliothèque.

    Cet article vous intéresse? Retrouvez-le en intégralité dans le magazine Archimag !
    Archimag-Ecologie-numerique
    La dématérialisation est-elle écologique ? Avec le numérique, est-on respectueux de l’environnement ? À l’heure où se multiplient les alertes sur la santé vacillante de la planète, ces questions méritent d’être approfondies. Rapidement, on constate que les paramètres sont multiples et les enjeux complexes.
    Acheter ce numéro  ou  Abonnez-vous
    À lire sur Archimag
    Les podcasts d'Archimag
    Pour cet épisode spécial Documation, nous nous sommes penchés sur une autre grande tendance de l'année 2024 : la cybersécurité, et plus particulièrement la sécurité dans le domaine de la gestion des données. La protection des données contre les menaces internes et externes est non seulement cruciale pour garantir la confidentialité, l'intégrité et la disponibilité des données, mais aussi pour maintenir la confiance des clients. Julien Baudry, directeur du développement chez Doxallia, Christophe Bastard, directeur marketing chez Efalia, et Olivier Rajzman, directeur commercial de DocuWare France, nous apportent leurs éclairages sur le sujet.
    Publicité

    sponsoring_display_archimag_episode_6.gif