Dossier
- Big data : y aller ou pas ?
- Infographie : le big data en mots et en chiffres
- Ghislaine Chartron : "Je ne transformerai pas mes élèves en data scientists"
- Matthieu Scordia, data scientist chez Dataiku
- Big data : l'Ina dans un "lac de données"
L'Institut national de l'audiovisuel repense son système d'information documentaire et met les données au centre de sa stratégie.
Le temple de la mémoire audiovisuelle française revoit ses fondations. Depuis sa création en 1975, l'Ina a créé de nombreux silos d'information au fil de l'eau et des années. "Mais ce système a vécu et atteint ses limites", constate Gautier Poupeau, architecte des données au sein de la DSI de l'Institut national de l'audiovisuel. Ces silos sont en effet dispersés et les passerelles mises en place pour les faire communiquer ne permettent plus de faire face aux nouveaux enjeux documentaires.
A la faveur de la refonte de son système d'information documentaire, l'Ina a décidé de mettre l'exploitation de ses métadonnées au coeur de sa réflexion. "La première chose à faire est de rassembler nos métadonnées documentaires, commerciales, juridiques et d'usage. Cela représente de gigantesques volumes qui sont aujourd'hui malheureusement sous-exploitées", souligne Gautier Poupeau.
Transfert de données documentaires
Pour mener à bien ce projet, l'Ina va se doter d'un "lac de données" qui aura plusieurs missions
à remplir : permettre le transfert des données documentaires par collection de l'ancien modèle de données vers le nouveau modèle, stocker l'ensemble des types de bases de données implémentées dans le lac de données, importer dans le lac de données des données documentaires depuis les outils de production actuels... La nouvelle infrastructure devra en plus être en mesure d'exporter des données documentaires vers des outils du système d'information, et assurer l'interfaçage d'une ou plusieurs applications avec le lac de données.
Un tel projet ne s'improvise pas. La direction des systèmes d'information de l'Ina s'est tournée vers la direction des collections pour recueillir ses besoins et ses souhaits. "Les quelque 150 documentalistes de l'Ina comprennent parfaitement les enjeux du projet et les différents métiers s'impliquent progressivement dans cette nouvelle infrastructure. Tous apprécient de voir que les données sont au centre de ce projet", précise Gautier Poupeau.
Le nouvel écosystème sera testé pendant une période d'une année. Puis viendra la construction de l'interface graphique. A terme, l'Institut national de l'audiovisuel pourra envisager d'accroître ses services au public notamment avec un système de recommandations.