Dans un contexte où l’accès à l’information devient vital, les outils de cartographie de l’information tentent de faciliter le cheminement dans les données. Zoom sur les usages et les arrière-cuisines technologiques.
«Découvrir que le dirigeant d’un partenaire technologique est aussi administrateur d’une entreprise concurrente. Et ce, grâce à un logiciel de cartographie », se félicite Laurent Baleydier, PDG de Kartoo, l’un des spécialistes du domaine. « Il est plus aisé d’accéder à la donnée recherchée à partir d’éléments graphiques qu’à partir de listes ou tableaux ».
« Identifier en coup d’oeil la version d’un modèle de voiture qui génère le plus de réclamations et zoomer sur le détail de ces dernières », illustre de son côté Mathieu Balsarini directeur général de 4D Concept, un intégrateur d’applications documentaires et de systèmes éditoriaux.
Voilà quelques exemples d’utilisation de cette technologie émergente, la cartographie d’informationi. Elle permet de naviguer dans tous les types d’information à travers des éléments graphiques en lieu et place de listes, de tableaux ou autres moyens plus classiques. À côté des applications géographiques de ces technologies, se développent des outils dédiés au traitement d’informations textuelles. Les outils prennent en charge deux principales fonctions. D’abord la création de liens entre ces différents éléments, le plus souvent textuels à ce jour, pour les positionner les uns par rapport aux autres, puis leur affichage à travers des éléments graphiques. Dirigeant de Pikko, un des spécialistes français du secteur, Christophe Douy pondère :« La visualisation n’est qu’une facette de projets qui ont globalement pour but de faciliter l’accès à l’information ».
utilisation marginale à ce jour
Sur le terrain, les outils de cartographie d’information trouvent timidement leur place dans quelques types d’applications. « Sur les intranets de nos clients, notre logiciel Kvisu récupère les cent premiers résultats ramenés par le moteur de recherchei de Google, Search Appliance, et facilite la navigation entre ces différents résultats », explique Laurent Baleydier. Il s’agit par exemple de faciliter la lisibilité des liens existants entre des dirigeants et des entreprises. « Le même dirigeant peut siéger à plusieurs conseils d’administration. Le logiciel permet de visualiser, de zoomer et d’identifier ces liens plus rapidement qu’avec une approche classique », illustre Laurent Baleydier, qui travaille, entre autres, pour l’Onera et Essilor. Outre les intranets, ces outils se sont également adaptés aux logiciels de veille Intelligence économique.
">i. Christophe Douy de Pikko décrit :« Nos premiers projets ont concerné les départements d’intelligence économique d’industriels comme Air Liquide ou Schneider ». Les logiciels s’adaptent à d’autres secteurs d’activité. Pour naviguer dans les rapports techniques d’analyse de trafic télécom ou dans les variations des cours boursiers, des éditeurs ont développé des solutions métiers. Plus marginal, une autre déclinaison a pour but de faciliter l’affichage et le partage d’idées dans le contexte d’équipes de recherche et développement. Dédié à la recherche sur les futures techniques collaboratives, le projet européen Laboranova utilise ce type d’outils. Des logiciels comme Mindmapper facilite la mise en place de liens entre concepts et la navigation entre ces derniers.
la relation entre les concepts : le point faible
Pour construire ces représentations, les outils se basent sur des corpus de toute nature : e-mails, bases de données, listes de résultats ramenés par des moteurs, etc. Si la construction part d’une base de données, par exemple d’entreprises et de leurs employés, la fiabilité des données et des liens est garantie. Au moins autant que la base de données elle-même. Par exemple, une application de cartographie facilite la navigation dans une application métier dans l’industrie automobile. « La première étape consiste à modéliser l’ensemble des objets métier et leurs attributs », explique Mathieu Balzarini de4D Concept. Une opération facilitée par le fait de travailler dans un champi lexical réduit. « Le rattachement des différents organes à un modèle de véhicule donné, de photos, documents de maintenance ou lettres de réclamation est sans ambiguïté », ajoute Mathieu Balzarini. Par contre, lorsque le corpus de départ ne comprend pas de façon explicite les liens entre les concepts ni même une liste définie de concepts, des effets de bord peuvent apparaître. Pour sa solution dédiée aux intranets, Kartoo construit ses cartes à partir de résultats de recherche. Et extrait les mots-clés les plus pertinents des documents recensés. « Une analyse statistique est à la base de cette analyse. Si le mot olympique est présent dans la plupart des documents recensés alors le mot JO a des chances de signifier Jeux Olympiques et pas Journal Officiel », explique Laurent Baleydier. Une analyse qui a des chances de donner du bruit i(résultat pas pertinent) ou du silencei (résultat pertinent ignoré). La présence de JO dans les documents recensés avec les deux sens en est une illustration. Pikko adopte la même démarche pour quelques projets. Quand aucun outil ne fournit un corpus, « nous utilisons le moteur d’indexationi open sourcei Lucene. Puis un module d’analyse statistique sur les résultats renvoyés. Ce module rapproche les documents et les concepts en fonction du nombre de co-occurrences par document », décrit Christophe Douy de Pikko. Dans tous les cas, l’approche statistique seule ne permet pas de désambiguïser efficacement le sens des mots. Pour pallier les déficiences de cette approche, « les prochaines versions de Kartoo intégreront des dictionnaires », prévoit Laurent Baleydier. De son côté, Pikko travaille déjà avec des éditeurs de moteurs de recherche et de text miningi. Ces outils extraient les entités nommées, noms de personnes, de lieux, etc. ainsi que les mots et expressions liés sémantiquement à la question posée graphiquement. Une liaison obtenue à partir des liens existant dans des ontologies. Par exemple, roulement à billes peut être rattaché à roue, un mot lui-même rattaché à organe, mot à son tour dépendant d’une liste de modèles de voitures dans le cas d’une ontologie du métier de l’automobile. À partir de ces données, « il s’agit de représenter les liens et la distance existant entre différents concepts, explique Christophe Douy de Pikko ; nous prenons en entrée les données extraites, par des moteurs comme ceux d’Ami Software, de Lingway ou de Temis ».
attention au chevauchement
La cartographie proprement dite consiste à représenter graphiquement ces données. La première question qui se pose concerne leniveau d’information que l’on veut montrer. La disponibilité d’algorithmes mathématiques dans le domaine public permet d’envisager plusieurs systèmes de représentation. « Nous utilisons entre autre celui de Voronoi », précise Laurent Baleydier. Ces systèmes de représentation prennent souvent la forme de réseaux. Parmi ces derniers, la cartographie polaire ou centrée présente les informations organisées autour d’une donnée centrale. Dans son homologue équipolaire, toutes les informations sont au même niveau. D’autres types de réseau existent présentant chacun des avantages et des inconvénients. Dans un réseau polaire, ilsera plus facile de partir d’un concept central et de se focaliser sur un détail. A contrario, un réseau équipolaire met tous les concepts au même niveau. Même choix à opérer dans la représentation de liens existants entre les concepts : nuages, sacs de noeuds, etc. Un nuage permet d’afficher plus de concepts sans surcharger l’écran de par l’absence de liens. Alternative, des cercles peuvent être imbriqués. La richesse de cette panoplie d’habillage peut surprendre. Laurent Baleydier de Kartoo constate : « À l’usage, les utilisateurs se sont parfois révélés déroutés par des représentations graphiques. Nous sommes parfois revenus à des représentations plus simples. Par exemple afficher les services d’une entreprise par de simples surfaces, des quadrilatères de taille variables en fonction de l’importance des départements ». Des choix qui reflètent un équilibre entre les différentes contraintes. À savoir, la quantité d’information que l’utilisateur désire obtenir à l’écran et le niveau de précision de ces dernières. Les technologies utilisées visent ensuite à éviter les problèmes d’affichage. « Pour éviter les chevauchements, on utilise différentes techniques. Par exemple, développer des arborescences à partir des angles. Pour ce faire, on utilise aussi des algorithmes antichevauchement », décrit Laurent Baleydier. Pour Mathieu Balzarini de 4D Concept, il s’agit de passer à une logique de calques : « Pour n’afficher qu’un nombre limité d’informations, par exemple des données de type incident sur un modèle donné de véhicule ». Concernant le type de graphisme, les éditeurs du domaine s’orientent vers une piste apparemment simple. « La piste la plus sérieuse consiste à représenter les données, les concepts d’un modèle de connaissances comme les données d’une carte, prédit Mathieu Balzarini; comme pour les villes et les routes d’une carte routière, les concepts les plus importants occupent plus de place, les liens entre les concepts de même ». Pour mettre en oeuvre ces systèmes, les éditeurs utilisent également les technologies 3D. Par exemple pour recentrer dynamiquement des arborescences. Dernière contrainte, les temps d’affichage doivent rester tolérables pour l’utilisateur.« Après une action de l’utilisateur, le calcul et l’affichage de la nouvelle carte ne doivent pas dépasser quatre à cinq secondes », précise Laurent Bayledier. Si la banalisation de ces technologies sur le terrain ne semble pas être pour demain, les premières vraies applications se mettent en place.
plus de terrain
cartographie géographique : vers la banalisation
Déclinaison la plus évidente et la plus mature de la cartographie d’information, les premiers outils ont pour but de placer des données en fonction de leurs coordonnées réelles sur un fond de carte connu. Des fonctions de plus en plus interfacées avec des Sig (systèmes d’information géographique). Cette méthode autorise une navigation intelligente à partir de cartes ou de photographies. L’objectif le plus courant consiste à relier des données – photos, adresses, vidéos, etc. – de lieux touristiques par exemple à leur localisation. Cette association évite la saisie ou la sélection dans des listes de noms de lieux ou de codes postaux. Les sites le plus connus sont bien sûr ceux de l’Institut géographique national, Geoportail.fr, etGoogle Earth. De nombreux sites utilisent aussi cette technique pour faciliter la navigation. Par exemple, le site Risquesmajeurs-hautespyrenees.pref.gouv.fr permet d’identifier les risques d’avalanches et autres problèmes sur toutes les communes des Hautes-Pyrénées par un simple survol des zones.