CET ARTICLE A INITIALEMENT ÉTÉ PUBLIÉ DANS ARCHIMAG N°375
Découvrez L'Archiviste Augmenté, la newsletter thématique gratuite d'Archimag dédiée aux professionnels des archives et du patrimoine !
"Trésor national", "grands oubliés de la démocratie"… Véritables matériaux de connaissance sur les préoccupations de la population française au début de l’année 2019, les cahiers de doléances du grand débat national restent encore inaccessibles à la plupart des Français. Rappelons-nous : il y a cinq ans, environ 1,5 million de citoyennes et de citoyens participaient à l’exercice démocratique du grand débat.
Lancé par Emmanuel Macron le 15 janvier 2019 dans le contexte du mouvement des Gilets jaunes, cet "outil consultatif de sortie de crise" permet alors aux Françaises et aux Français d’exprimer leurs revendications pour le pays, même les plus personnelles. Durant trois mois, plus de 16 000 communes ont recueilli près de vingt mille cahiers de doléances. 1,9 million de questionnaires, dont 569 000 contributions détaillées, ont également été déposés depuis la plateforme en ligne dédiée au grand débat.
Près de 12 millions d’euros ont été déboursés pour collecter, analyser et synthétiser la parole des citoyens. Ce chantier documentaire colossal a nécessité les services d’opérateurs publics et d’acteurs privés spécialistes en numérisation, en traitement, en analyse, et en archivage.
Lire aussi : Dossier : La numérisation au service de la conformité et de l'innovation
Numérisation des cahiers
Clôturés le 20 février 2019, les cahiers de doléances ont été photocopiés par les mairies des différentes communes avant leur envoi en préfecture. Les photocopies ont ensuite été versées à la Bibliothèque nationale de France (BnF), chargée de numériser (avec l’aide du prestataire Numen), de référencer, et d’indexer leurs contenus.
La course contre la montre pouvait alors commencer : environ 500 000 pages ont dû être traitées en quatre semaines avec une attention particulière portée sur la confidentialité des données. "Nous allons avoir une production moyenne de 25 000 pages par jour", déclarait à l’époque Miari Rabenarivo, responsable du service numérisation de la BnF. La numérisation des cahiers a été réalisée en trois formats : JPEG 2000 en 300 dpi (avec une image par page de cahier), PDF en 150 dpi (avec un document correspondant à un cahier), et ALTO (Analysed layout and text object).
Une phase de transcription a ensuite été réalisée par les sociétés Numerize, Archiveco et Inovcom, dont les données ont été transmises pour analyse à un consortium piloté par le cabinet de conseil Roland Berger associé à deux prestataires spécialisés dans le traitement des données de masse, Cognito et BlueNove. Leur objectif : assister le gouvernement pour analyser et synthétiser les principales contributions des citoyens.
Lire aussi : Archivage Physique : un marché encore fertile
Analyse des contributions en ligne
"Plusieurs synthèses seront faites à partir des contributions libres, mais aussi des contributions en ligne", expliquait la mission du grand débat national il y a cinq ans. En effet, le gouvernement s’est tourné vers d’autres prestataires pour analyser les près de 2 millions de contributions déposées sur le site du grand débat : l’institut de sondages OpinionWay et Qwam, société spécialisée dans le traitement des données textuelles (rachetée en 2023 par ChapsVision). "Le véritable défi était de respecter les délais, qui étaient très courts", rapporte Christian Langevin, ancien directeur général de Qwam. "Nos équipes se succédaient jour et nuit".
Leur mission était alors de construire une grille d’analyse et de dégager les thèmes récurrents à l’aide d’une intelligence artificielle pilotée par l’humain. "Nous devions organiser les réponses autour de quatre grandes thématiques", explique Christian Langevin. "L’utilisation du traitement du langage naturel (NLP) et sa compréhension de la sémantique et de la linguistique nous ont permis d’identifier automatiquement les thèmes principaux". Contrairement aux synthèses des cahiers de doléances, celles des contributions en ligne sont encore aujourd’hui disponibles sur le site du grand débat.
Lire aussi : Outils de numérisation et conformité réglementaire
Des versements exceptionnels
Si les cahiers de doléances ont été photocopiés avant d’être numérisés par la BnF, les versions originales ont fait l’objet, à la même période, d’un versement qui a permis leur entrée aux archives départementales dans des délais extrêmement brefs.
Comme de nombreux services, celui des archives départementales de la Gironde, en Nouvelle-Aquitaine, a dû gérer ce versement exceptionnel : "habituellement, les documents versés au sein de nos archives ont atteint la fin de leur durée d’utilité administrative", indique Agnès Vatican, directrice des archives départementales de la Gironde. "Or, pour le grand débat national, nous avons eu pour mission de procéder à l’archivage des cahiers de doléances et à leur mise à disposition du public dans nos salles de lectures avant même que la restitution publique nationale, prévue le 15 avril 2019, ait lieu".
Plusieurs étapes ont été nécessaires afin de mener à bien cette mission, notamment l’analyse de la communicabilité des cahiers. "Nous devions vérifier qu’il n’y avait pas d’éléments susceptibles de porter atteinte à la vie privée des contributeurs, comme des pièces d’identité, des relevés bancaires, des bulletins de salaire, ou autres", poursuit Agnès Vatican.
Au sein des archives de ce département, près de la moitié des 5,1 mètres linéaires de cahiers de doléances n’est pas librement communicable. Dans ce cas précis, le Code du patrimoine entre en application et la durée de délai avant une consultation publique s’élève à 50 ans. "Il existe bien sûr une procédure de dérogation, notamment pour les chercheurs, qui nécessite un accord de la préfecture et du ministère de la Culture avec un délai de réponse de deux mois", précise Agnès Vatican.
Lire aussi : Avantages et défis : comprendre la data literacy
À quand un accès en ligne ?
Le 12 janvier 2024, une proposition de résolution transpartisane a été déposée à l’Assemblée nationale par la députée écologiste de la Drôme (26) Marie Pochon, accompagnée de quinze autres cosignataires. Celle-ci réclame la publication des cahiers de doléances sur internet pour les rendre accessibles à tous.
Pour rappel, le président de la République s’était engagé à restituer publiquement et à mettre en ligne, sur une plateforme ouverte à tous, l’ensemble des cahiers de doléances numérisés par la BnF à partir du 15 avril 2019. "Ces cahiers de doléances sont un véritable trésor national", insiste Marie Pochon. "Le problème réside dans les données à caractère personnel qu’ils peuvent contenir. Leur mise en ligne se heurte aux dispositions du RGPD".
Lire aussi : 5 années de RGPD, un premier bilan
Le plus grand corpus d’expression citoyenne jamais recueilli en France en seulement trois semaines sommeille donc au sein des services d’archives de nos départements. S’il est aujourd’hui possible d’en consulter une partie dans leurs salles de lecture, il faudra probablement patienter encore 45 ans pour qu’ils soient accessibles à tous sur internet.