La numérisation des 23 327 instruments de recherche des Archives nationales durera 3 ans.
Suite à un appel d'offres, c'est le Groupe Numen qui a été retenu pour dématérialiser les instruments de recherche des Archives nationales. Ce projet de numérisation porte sur 23 327 instruments de recherche (bases de données, fichiers, ouvrages...) qui se présentent aujourd'hui sous la forme de pages papier, de microfiches ou de microfilms. Au total, ces instruments de recherche forment un volume d'environ 4,5 millions de pages.
Le chantier de numérisation sera réalisé sur les sites de Paris et Fontainebleau des Archives nationales au rythme de plus de 7 000 documents par an pendant 3 ans. Chaque instrument de recherche donnera lieu à différents formats électroniques : versions PDF (niveau de gris et noir et blanc), version XML (EAD), version RTF, et version CSV pour certains documents. La capture des contenus textuels et la structuration des informations sémantiques seront réalisées par des équipes d'analystes documentaires. Ces derniers disposeront d'automates collaboratifs de Reconnaissance Optique de Caractères.
La dématérialisation de ces instruments de recherche des Archives nationales s'inscrit dans le cadre de l'ambitieux projet de déménagement des Archives nationales vers le nouveau centre de Pierrefitte-sur-Seine (Seine Saint-Denis). D'une capacité de 320 km linéaires, il ouvrira ses portes en 2013.