Article réservé aux abonnés Archimag.com

Données et informations : deux soeurs qui se connaissent mal… à tort !

  • donnees-informations-deux-soeurs-connaissent-mal-a-tort.jpg

    La gestion documentaire et la gestion des données constituent, à tort, deux filières parallèles totalement déconnectées (Freepik).
  • Histoire, étymologie, formations et organisation ont conduit les professionnels de l’information et les spécialistes des données à avoir peu de contacts. Ils font pourtant le même travail. Données et documents ne devraient pas être perçus comme deux filières différentes. Pourquoi et comment y remédier ?


    enlightenedCET ARTICLE A INITIALEMENT ÉTÉ PUBLIÉ DANS ARCHIMAG N°378
    mail Découvrez Le Brief de l'IT, la newsletter thématique gratuite d'Archimag dédiée aux professionnels des data, de l'IT, de la digitalisation et de la transformation numérique !


    Les humains utilisent des documents depuis qu’ils gardent la trace de leurs communications. Des fresques de Lascaux aux papyrus, en passant par les tablettes d’argile des Sumériens, les supports ont évolué, mais le besoin initial reste identique : transmettre.

    Mais que transmettre ? Des idées, des souvenirs, des informations, et donc finalement… des données. Les premières bases de données viendraient des Sumériens, « dont les scribes dressaient des listes de laboureurs employés par l’État et préservaient ces données sur des tablettes d’argile », explique Emma Legrand dans « L’histoire de la donnée : retour sur l’évolution de la data ». Des « data » qui auraient d’ailleurs pu s’appeler « capta », car elles ne sont pas « données », mais « collectées » ou « capturées ». Dans l’étymologie du mot, on perçoit les prémices de problématiques actuelles sur le consentement et le cycle de vie de la donnée.

    Lire aussi : Data gouvernance : prenez le pouvoir sur vos données !

    La donnée créatrice de métiers

    Il faudra attendre plusieurs milliers d’années avant qu’elle ne soit encodée et disparaisse peu à peu d’une lecture directe possible par des yeux humains. Numérisée tout d’abord, mais restant matérialisée sur des cartes perforées, puis finalement dématérialisée, chaque étape de l’évolution de la donnée a donné naissance à des métiers spécifiques. Le livre a fait naître les bibliothèques, l’imprimerie les a développées et les métiers de bibliothécaires sont apparus. L’explosion du nombre de documents scientifiques a permis de créer le métier de documentaliste. En changeant de support et en dématérialisant les données, des métiers plus techniques ont émergé, chargés de collecter, conserver, puis analyser ces données.

    Données et documents : une connexion à redéfinir

    Mais quel lien faire entre données et documents ? Est-il logique de conserver des métiers souvent déconnectés ? Le monde dit « du document » n’échange aujourd’hui que peu avec le monde dit « de la donnée ».
    Constat de départ, le document est un support, un contenant pas un contenu. Il contient des informations. Qu’est-ce qu’une information ? La norme ISO 24143 le décrit parfaitement : il s’agit de données auxquelles on a ajouté un contexte. Donc, par transition, un document contient des données. Elles peuvent prendre différentes formes (structurées, non structurées…) et peuvent changer de contenant, c’est-à-dire passer d’un support à un autre — par des moines-copistes ou une impression à distance !

    Lire aussi : Publication de la norme ISO 24143 Information et documentation — Gouvernance de l’information 

    Pourquoi séparer les fonctions ?

    Si le document est donc un support, matérialisé, sous forme de papier, de microfiche, ou maintenant d’un PDF stocké sur un disque dur, pourquoi avons-nous besoin de métiers qui se chargeraient du contenant, et d’autres du contenu ? D’ailleurs, les bibliothécaires et les documentalistes ne se contentent pas de gérer le document support, mais bien également d’indexer son contenu. Ces métiers sont en réalité spécialisés dans la gestion de ce que l’on appelle les métadonnées : les adjectifs qui permettent de qualifier un document ou une information (son titre, son auteur, sa date de publication, sa localisation…). Pourquoi donc séparer les fonctions ?

    Un exemple : la liste des laboureurs sumériens employés par l’État, citée plus haut. Conservée sous forme d’un fichier CSV, il s’agirait de data. Sous la forme d’un fichier imprimé, elle deviendrait un document. Et s’il s’agit d’un PDF ou un fichier XML, s’agirait-il d’un document ou de données ? Pourquoi, en changeant de support, la même information modifierait-elle les compétences métier nécessaires ?

    Lire aussi : Gestion des métadonnées : comment optimiser vos efforts ?

    Deux univers parallèles

    D’où vient cette incohérence ? De manière historique, des filières de formation. Les compétences indispensables aux métiers du document sont bien plus anciennes et viennent d’un monde où l’informatique n’existait pas encore. Puis l’univers des technologies de l’information est né, et avec lui des compétences techniques, informatiques, qui faisaient la part belle au contenant (les fichiers informatiques) plus qu’au contenu (les données). À l’inverse, les experts de l’information documentaire s’attachaient au contenu des documents plus qu’à la fabrication du papier !

    Ces deux univers ont progressé en parallèle, sans jamais fusionner. Bien sûr, l’informatique est arrivée dans le monde de la gestion documentaire comme un outil de classification, de stockage et de recherche. Quant aux analystes de données, ils ont appris à s’interroger sur la source des informations, à les trier et à les présenter.

    Mais ces deux filières restent déconnectées. Aucun analyste ou scientifique de données ne recevra, durant sa formation, de cours sur la veille documentaire ou sur la gestion du cycle de vie de l’information. Et les documentalistes ne seront pas formés à l’analyse prédictive ou à l’apprentissage machine.

    L’exception : le métier de « data librarian »

    Certaines évolutions font exception, comme l’apparition du métier de « data librarian », traduit par documentaliste ou bibliothécaire de données. « Les bibliothécaires de données s’occupent de la gestion des données de recherche, de l’utilisation de ces données en tant que ressources et du soutien aux chercheurs dans ces activités », explique la Cilip, une association britannique de bibliothécaires et documentalistes. « En tant que bibliothécaire de données, il est probable que vous participiez à l’élaboration ou à la mise en œuvre du plan de gestion des données d’une organisation, au stockage et à la gestion des données et à la détermination des périodes de conservation et d’élimination ».

    La prise de conscience dans les entreprises de l’importance d’une gouvernance des données impose aux informaticiens de s’intéresser au contenu de ce qui est collecté ou généré dans leur système d’information, d’y ajouter des méthodes de classification, des contrôles de conformité, de sécurité, et de prendre en compte la gestion complète du cycle de vie de ces données.

    Les objectifs des deux filières sont identiques : aider une personne ou une organisation à prendre de meilleures décisions en l’informant correctement. En 1958, Hans-Peter Lühn, ingénieur chez IBM, expliquait comment des documents (on ne parlait pas encore de données) pourraient, dans le futur, être assemblés et traités pour aider à prendre des décisions. Il inventait alors ce que l’on appelle encore aujourd’hui la « business intelligence ».

    Lire aussi : Fanny Sébire, data librarian au service de la recherche

    Collaboration et formation

    À terme, les deux filières devraient clairement travailler en meilleure collaboration, se répartir les compétences et surtout mieux communiquer. La vérité est qu’informaticiens et professionnels de l’information font le même métier, mais au travers de supports différents. Apprendre à connaître le métier de l’autre permettrait déjà de comprendre ces différences et ces points communs.

    L’évolution des compétences passe par la formation. Si vous êtes un professionnel de l’information, formez-vous aux données, à leur analyse, à leur gouvernance, à l’intelligence artificielle. N’ayez aucune crainte, ce n’est pas de l’informatique hors de votre portée. Et suggérez que votre département informatique découvre à son tour votre métier de professionnel de l’information.

    D’ailleurs, avez-vous remarqué que les mots information et informatique viennent de la même racine : « informare », qui signifie en latin « ce qui donne une forme à l’esprit ». L’informatique, appelée ainsi en Allemagne dès 1957, désigne le traitement automatique de l’information. Nous parlons bien de la même chose !

     

    À lire sur Archimag
    Les podcasts d'Archimag
    Rencontre avec Stéphane Roder, le fondateur du cabinet AI Builders, spécialisé dans le conseil en intelligence artificielle. Également professeur à l’Essec, il est aussi l’auteur de l’ouvrage "Guide pratique de l’intelligence artificielle dans l’entreprise" (Éditions Eyrolles). Pour lui, "l’intelligence artificielle apparaît comme une révolution pour l’industrie au même titre que l’a été l’électricité après la vapeur".
    Publicité

    Serda Formation Veille 2025