Choisir un format d’archive est comme choisir une langue. C’est un véhicule d’idées, d’images, etc. C’est être certain que dans des centaines d’années, tout ce que nous avons créé aujourd’hui puisse être déchiffré et compris par les générations futures. Si un format d’archive permet de conserver cette mémoire de manière intangible, il ne saurait être unique dans le temps. Car tôt ou tard se posera la question de son actualisation.
PUBLI/INFO. En France le format d’archives est normé et doit être unique. Pour les documents électroniques, c’est le format PDF/A qui a été adopté et pour les données électroniques, le XML. Or ces formats uniques ne s’attachent pas au traitement des trois âges de l’archive ( archives courantes, archives intermédiaires et archives définitives ) et n’apportent pas pleinement satisfaction. L’Histoire nous éclaire d’ailleurs sur ce point. Souvenons-nous, en effet, que les égyptiens avaient choisi la pierre et les hiéroglyphes pour perpétrer leurs savoirs. Mais aujourd’hui, excepté quelques rares spécialistes dont les traductions sont parfois incertaines, nous consultons le passé égyptien sur papier et dans une langue de notre siècle. Il existe donc une sorte de conflit patent entre “conservation à l’identique” et “accès pratique aux données conservées”.
Le format PDF/A est-il vraiment universel ?
Pourquoi prôner un format unique ? Pour être certain de pouvoir lire les archives électroniques à l’avenir, quelle que soit l’évolution des technologies, des outils et des formats. Avec un format unique, les craintes d’incompatibilité sont censées disparaître, puisqu’un seul “lecteur” suffit pour lire, sur la durée, l’ensemble du “vrac numérique”. Sauf que le format PDF/A n’est pas valable pour les sons, le multimédia, les données relationnelles ou encore les journaux transactionnels (base des applications métier). Voir un film ou écouter un concert en PDF/A dans 200 ans devient donc un problème technique, et non plus archivistique. D’autre part, le PDF/A ne contient pas assez de métadonnées de propriété et ne conserve pas celles des documents originaux, après numérisation.
Coup double
Heureusement l’informatique peut nous venir en aide, en autorisant à la fois la conservation des données dans leur format d’origine et dans le format unique du moment. Il faudra toutefois prendre soin d’actualiser systématiquement le format d’origine, en fonction de ses évolutions. Ce qui revient à conserver la version d’origine et sa traduction la moins mauvaise au fil du temps.
Mise à jour
En ce qui concerne les supports de conservation, il faudra également les actualiser au gré des évolutions matérielles et des systèmes d’exploitation ou de bases de données. Ce qui aura un impact économique certain, même s’il semble évident que les évolutions constantes du traitement et du stockage des données informatiques s’accompagneront d’une diminution globale des coûts de conservation, de maintenance et de mise à jour. Ces évolutions devraient par ailleurs faciliter l’accès aux archives pour les utilisateurs autorisés et tenir à leur disposition des archives courantes ou intermédiaires, directement utilisables en parallèle avec des archives définitives, conservées, elles, au format d’origine ou au format « unique ».
Moralité : aujourd’hui, le PDF/A et le XML sont présentés comme des formats uniques, mais qu’en sera-t-il réellement demain ? Personne ne le sait vraiment. Il restera peut-être un des formats, mais pas forcément “unique” et encore moins “universel” !
Michel Thévenot
Data Records Management (DRM)
01 77 12 39 40
http://www.arkheos.fr
contact@arkheos.fr
Pour découvrir tous nos avis d'experts autour de l'archivage électronique, rendez-vous sur notre rubrique "avis d'experts".