Synapses : un laboratoire commun pour révolutionner l’exploitation des archives médiatiques du Ouest-France grâce à l’IA

  • synapses-laboratoire-revolutionner-exploitation-archives-mediatiques-ouest-france-ia.jpg

    L'Ouest-Éclair est publié de 1899 à 1944 à Rennes. Il prendra le nom d'Ouest-France à la Libération (Retro News).
  • Avec le laboratoire commun Synapses, Ouest-France, le CNRS et l’Université de Rennes s’allient pour transformer l’exploitation des vastes archives multimédias du journal grâce à de futurs outils d’intelligence artificielle développés en interne.

    La révolution numérique continue de transformer les métiers de la documentation et de l’archivage. Avec la création du laboratoire commun (LabCom) Synapses, Ouest-France, le CNRS et l’Université de Rennes s’unissent pour exploiter l'intelligence artificielle (IA) afin d’analyser, valoriser et rendre accessibles les vastes archives multimédias de Ouest-France. Ce partenariat inédit, présenté lors du festival Médias en Seine le 14 janvier 2024 et soutenu par l’Agence nationale de la recherche (ANR), symbolise l’alliance entre innovation technologique et souveraineté sur les données.

    Ouest-France et l’équipe Linkmedia de l’Institut de recherche en informatique et systèmes aléatoires (IRISA), concrétisent une collaboration informelle de longue date dédiée à la structuration d’archives journalistiques et la création de prototypes d’application de navigation dans les contenus éditoriaux. Désormais, les recherches s’appuieront sur une base documentaire centenaire composée de 48 millions d’articles et 38 millions de photos.

    Lire aussi : Le CNRS dévoile sa médiathèque dédiée à la science ouverte

    Trois axes pour repenser l’archivage et le journalisme

    Le LabCom Synapses se concentre sur trois domaines d’innovation. Le premier vise l’analyse automatique d’images d’archives, facilitant leur recherche et leur contextualisation par les journalistes et documentalistes. Le deuxième axe, consacré au traitement des archives textuelles, cherche à améliorer la compréhension et le traitement des textes historiques. Enfin, le LabCom Synapses développera des outils de visualisation destinés aux journalistes pour rendre accessibles des données complexes et interconnectées.

    Lire aussi : Ina : l’IA au service de la découverte du patrimoine audiovisuel français

    Expertise technologique et souveraineté de l’information

    Ce projet, soutenu par un financement de 363 000 euros de l’ANR, offre la possibilité de tester de développer des outils d’IA en interne, avec des données uniques, permettant de garantir à la fois l’éthique et l’indépendance de l’exploitation de ce patrimoine éditorial​. 

    Derrière cette collaboration, l’enjeu est aussi compétitif : « Le dispositif LabCom de l’ANR vise à renforcer la création de Laboratoires Communs entre les entreprises (TPE, PME, ETI et start-up) et les acteurs de la recherche académique dans une démarche générale de soutien à l’innovation », précise Dominique Dunon-Bluteau, directeur des opérations scientifiques de l’ANR.

    À lire sur Archimag
    Les podcasts d'Archimag
    La mise à disposition des décisions de justice en Open Data a vu le jour grâce à la loi pour une République numérique votée en 2016. Les articles 20 et 21 prévoient la mise en open data des quatre millions de décisions de justice produites chaque année par les tribunaux français. Camille Girard-Chanudet est chercheuse en sociologie au sein du Centre d’étude des mouvements sociaux. En 2023, elle a soutenu une thèse devant l’École des hautes études en sciences sociales (EHESS) : "La justice algorithmique en chantier, sociologie du travail et des infrastructures de l’intelligence artificielle". Dans ce cadre elle a rencontré les équipes de la Cour de cassation qui procèdent à l’anonymisation des décisions de justice.

    Serda Formations Archives 2025

    Indispensable

    Bannière BDD.gif