Le gouvernement a lancé un appel d'offre pour procéder à la transcription des cahiers de doléances mis à disposition des citoyens dans plus de 9 000 communes. Les entreprises candidates à cette prestation devront respecter un certain nombre d'obligations.
Au 11 février 2019, 856 634 contributions avaient été déposées sur la plateforme dédiée au Grande débat national. Un nombre appelé à augmenter puisque la consultation durera jusqu'au 15 mars prochain.
Mais le Grand débat national se passe également partout en France où des cahiers de doléances ont été ouverts dans près de 9 000 communes. Rédigées manuellement, ces contributions devront faire l'objet d'un chantier de numérisation avant de pouvoir être analysées.
Documents papier et fichiers numériques
Le gouvernement a donc passé un appel d'offre portant sur la "transcription de documents en fichiers numériques". Derrière cette formulation, on trouve un ensemble de contraintes précisées sur la plateforme des achats de l'Etat : "la prestation est de transformer les documents originaux fournis en fichier texte (format WORD .docx)". Si la majorité de des documents est produite au format A4, le format A5 (équivalent d'un cahier) n'est pas écarté alors que le A3 ne devrait pas être de la partie "a priori".
Une chose est sûre, les documents fournis aux prestataires le seront soit sous forme papier soit sous forme de fichiers électroniques après avoir été scannés. Dans ce dernier cas, les documents scannés le seront par la Bibliothèque nationale de France dans les formats suivants : JP2 300 DPI, ALTO, PDF 150 DPI. La BnF sera également mise à contribution pour déterminer le format de l'indexation : "y figureront entre autres le code postal d'origine du document et un numéro d'indexation, pour la traçabilité" peut-on lire dans le dossier de consultation de l'appel d'offre.
Traitement au sein de l'Union européenne et application du RGPD
La prestation devra par ailleurs répondre à un certain nombre de critères : fiabilité de la transcription par rapport au document traité, réalisation de la prestation dans un délai restreint, confidentialité des documents à traiter et de leur transcription.
La question de la confidentialité a amené le gouvernement à opter pour une solution exclusivement européenne : "au vu du caractère sensible des données à traiter, l'administration souhaite leur traitement au sein de l'UE et en respectant les dispositions du RGPD".
Les prestataires sélectionnés devront remettre l'ensemble des documents à l'Etat après avoir procédé à leur transcription : "l'administration reprendra les documents après traitement, sous un délai non encore formalisé, qui sera le plus court possible, le prestataire n'ayant pas vocation à stocker".
L'appel d'offre précise enfin que trois prestataires pourront être retenus pour ce chantier de transcription : "le minimum de 300 000 pages A4 est réparti de manière égale entre les attributaires. Au-delà de ce minimum, la règle suivante s'applique : à tour de rôle, dans l'ordre du classement des offres, pour chaque bon de commande, le choix du titulaire s'effectue par roulement".
Analyse et open data
Au terme de cette transcription, les données seront transmises pour analyse à un consortium piloté par le cabinet de conseil Roland Berger associé à deux prestataires spécialisés dans le traitement des données de masse Cognito et BlueNove.
Bonne nouvelle pour les citoyens qui souhaitent accéder aux cahiers de doléances, ceux-ci seront mis à leur disposition en open data dans le respect de la gestion des données personnelles. "L’ensemble des contributions au débat, qu'elles aient été envoyées par voie postale, par courriel ou via les formulaires en ligne, seront à terme accessibles à tous" précise Data.gouv.fr. Une dizaine de jeux de données sont déjà mis à disposition des internautes au format CSV et JSON en vue de leur libre réutilisation.