Découvrez Le Brief de la Démat, la newsletter thématique gratuite d'Archimag dédiée aux professionnels des data, de la dématérialisation et de la transformation numérique !
Sommaire du dossier sur la maîtrise des données et les organisations data-driven :
- Organisation data-driven : maîtrisez les données !
- Les 3 piliers de la gouvernance des données : connaissance, qualité et conformité
- 3 outils dédiés au traitement des données et des métadonnées
- Travail et données : ces métiers qui contribuent à rendre leur organisation data-driven
- Banque data-driven : pour la Société Générale, la donnée est un actif stratégique
- Comment Manutan a mis la maîtrise des données au coeur de sa stratégie
Stibo Systems : MDM (master data management)
Frédéric Marie, directeur général de Stibo Systems (Danemark, 24 personnes en France), présente sa société comme leader dans le master data management (MDM) ou gestion des données de référence. On peut tenter de gérer celles-ci avec son tableur préféré — ce que les petites structures font —, mais arrivé à un certain seuil critique, mieux vaut une solution de gouvernance dédiée. Grâce à elle, il s’agit de savoir qui a le droit de modifier quelles données et à quel moment de son cycle de vie.
Cycle de vie ? Un produit, par exemple, possède des caractéristiques de taille, de forme, de composition… Une description en est apportée à telle date, publiée dans un catalogue, mise en ligne… Un an plus tard, le fournisseur de tel matériau aura changé, tel élément aura été modifié, telle réglementation sera intervenue… Autant d’impacts sur les données à prendre en compte.
« La donnée est vraiment vivante », souligne Frédéric Marie. Il convient donc non seulement de l’identifier, mais aussi de la lier et la synchroniser. Le MDM se veut la source de référence unique dans l’entreprise.
> Lire aussi : Master data management : unifiez vos données de référence avec le MDM !
Règles métier et utilisateur autonome
Stibo Systems propose Step, une plateforme totalement intégrée et unique, en Saas et on premise. PDX est son outil de syndication qui embarque les données et les exporte. Une correspondance est établie via un apprentissage par machine learning.
Une « couche » data as a service (Daas) répond au fait qu’un référentiel n’est pas transactionnel. Le Daas se superpose au MDM, hérite des données et de leurs attributs et est interrogé par les applications via des interfaces de programmation (API).
Step est entièrement paramétrable, l’utilisateur est autonome, il peut ajouter des règles métier sur un champ, etc., sans avoir à entrer une ligne de code. Step s’adresse bien au métier ; s’il n’y a pas de problématique métier posée, le MDM sera mis en échec, assure Frédéric Marie.
> Lire aussi : 5 étapes pour mener une gestion des données de référence efficace
Zeenea : smart data catalog
Pour Stéphane Jotic, COO de Zeenea, une entreprise est data driven dès lors qu’elle cherche à maîtriser sa donnée et à introduire de la valeur. Zeenea propose une offre de data catalog, disponible en Saas. Les data catalogs visent à concentrer toutes les données de l’entreprise et pas seulement les données de référence.
La clé est le traitement des métadonnées. Celles que Zeenea prise en compte sont de cinq types : techniques (accès à la donnée), sémantique (point de vue fonctionnel), organisationnel (qui est propriétaire de la donnée, contrôle des données), d’usage (faciliter la production de valeur) et de conformité.
Modélisation des métadonnées
Le smart data catalog de Zeenea met en œuvre une modélisation des métadonnées, s’appuyant à la fois sur une ontologie et sur une logique de graphe de connaissances (création de liens à la volée). Des connecteurs permettent d’atteindre les données dans un but d’inventaire et de sélection des actifs pertinents. Un moteur de recherche, avec traitement automatique du langage naturel (NLP) et analyse sémantique, attaque la donnée gérée. Les résultats sont affinés à l’aide de filtres, eux-mêmes évolutifs, pour une exploration personnalisée.
> Lire aussi : Quels sont les points d’attention et les bonnes pratiques pour assurer l’intégrité de vos données ?
Sinequa : search based application
Luc Manigot est vice-président « center of excellence » de Sinequa. L’éditeur français est parti d’une technologie de traitement automatique des langues (Tal). Son moteur de recherche d’entreprise s’est peu à peu étoffé pour devenir une application orientée recherche ou search based application (on premise, cloud, Saas).
Dans quelle mesure Sinequa s’intéresse-t-il à la donnée ? Pour Luc Manigot, la donnée constitue la totalité de l’information nécessaire au fonctionnement de l’entreprise, y compris l’information non structurée. Sinequa parlerait davantage d’organisation « information driven » que d’organisation « data driven ».
> Lire aussi : Focus de la Rédaction : L’IA sémantique au service de l’automatisation des processus documentaires et de la conformité RGPD
Indexer la totalité des données
Luc Manigot souligne : « La partie la plus difficile à traiter n’est pas la donnée, mais le documentaire ». Des données sont disponibles, mais, pour obtenir une bonne réponse, il faut aussi avoir la capacité de fouiller les documents, quels que soient le volume, l’hétérogénéité ou la diversité de langues.
La plateforme Sinequa, avec ses 200 connecteurs, récupère les données, en tenant compte des droits d’accès, et les indexe afin de les mettre en valeur selon une problématique métier. Les cas d’usage vont de la recherche de données à caractère personnel, dans une démarche liée au RGPD, à la sécurisation des données.
S’opposant au MDM qui lie mécaniquement les métadonnées d’une source vers l’autre, Luc Manigot lance : « Renoncez à rapprocher vos référentiels, indexez la totalité des données et fournissez à l’utilisateur les bons outils de visualisation ».