Données publiques

Statistiques des actes d'état civil parisien sur Paris Mapize. DR

 

Alors que le gouvernement français vient de lancer son portail Data.gouv.fr, l'ouverture des données publiques essaime dans de nombreux pays. Considérées comme « le pétrole du XXIe siècle », elles sont unanimement célébrées, mais font aussi l'objet de d’interrogations économiques et juridiques. Voyage au cœur des données publiques en France et à l'étranger.

Sommaire du dossier :

 

Nombre de naissances, de décès, de mariages, de divorces... Depuis plusieurs mois, les Parisiens peuvent consulter gratuitement les données relatives à l'état civil de la capitale en quelques clics. Le site Paris Mapize propose une série de cartes et graphiques dynamiques rassemblant les statistiques des actes d'état civil réalisés par les vingt mairies parisiennes. Mieux : ces données peuvent être ventilées par arrondissement pour faire apparaître les tendances démographiques par quartier. Ainsi, on apprend que c'est le douzième arrondissement qui enregistre le plus grand nombre de naissances (10 904) et le quinzième arrondissement qui détient le plus important nombre de décès (3 336). Ces données portent sur l'année 2009 et peuvent être comparées avec les statistiques remontant à 2004. Grâce à Paris Mapize, l'état civil de la capitale n'a plus de secret pour personne.

Toutes ces données d'état civil ont une même origine : la mairie de Paris. La municipalité s'est en effet engagée dans un vaste mouvement de d'ouverture de ses données publiques. Elle n'est pas la seule, ni la première.

La pionnière fut la ville de Rennes. Dès 2010, la municipalité ouvrait une plateforme donnant accès aux donnés provenant des services de transport municipaux : horaires, accessibilité des stations de métro et géolocalisation des vélos et des stations. Depuis, le portail Data Rennes Métropole s'est considérablement enrichi et offre un accès aux données budgétaires, environnementales, sportives, culturelles... Aujourd'hui, de nombreuses villes ont rejoint le mouvement et proposent des « jeux de données » parfois étonnants : Montpellier offre un inventaire animalier de son zoo municipal, Bordeaux recense ses espaces boisés et leur superficie, le département de la Saône-et-Loire publie ses cartes relatives aux impôts fonciers... Dans les tout prochains mois, d'autres projets verront le jour à La Rochelle, au Havre ou à Marseille.

principe de gratuité

On le voit, le mouvement est désormais bien engagé, mais la question du modèle économique n'est pas encore tranchée entre partisans des licences payantes et défenseurs de la gratuité. Les premiers font valoir que la production de données a un coût pour les mairies et les collectivités, et qu'il est normal pour elles d'en tirer une rémunération. Dans le camp d'en face, on rétorque que les citoyens ont déjà contribué à la production de données en payant leurs impôts...

En tout état de cause, il semble que le camp de la gratuité est bien parti pour l'emporter. Pour Etalab – la mission placée sous l'autorité du Premier ministre qui coordonne l'action de l'Etat en matière de données publiques -, le choix du modèle économique a été arrêté : « L'ouverture des données publiques est un impératif démocratique qui crée un cercle vertueux économique. Son modèle ne peut être que la gratuité », estime Séverin Naudet le directeur d'Etalab.

Ce principe de gratuité a été acté par une circulaire publiée au début de l'année 2011 et confirmé par décret. Au-delà, l'Etat peut même espérer en tirer des bénéfices indirects selon Séverin Naudet : « En faisant le choix d'ouvrir les données publiques et en rationalisant les systèmes d'information, la France fera des économies budgétaires substantielles ». 

Pour mener à bien sa mission, Etalab peut compter sur un budget de 4,72 millions d'euros qui lui a été alloué pour la période 2011-2013. Une somme qui lui a permis de lancer son portail Data.gouv.fr le 5 décembre dernier, ainsi que des applications mobiles pour téléphones et tablettes numériques.

vers un duopole de licences

Le 19 octobre 2011, la mission Etalab publiait la version 1.0 de sa licence ouverte qui encadrera la réutilisation des données publiques en France. Ce document réaffirme la liberté de « reproduire, copier, publier et transmettre l'information sous réserve de mentionner la paternité de l'information (a minima le nom du producteur) ». Il rappelle également la possibilité « d'adapter, modifier, extraire et transformer à partir de l'information ». La licence ouverte précise enfin que les réutilisateurs pourront « exploiter l'information à titre commercial, par exemple en la combinant avec d'autres informations ou en l'incluant dans un produit ou application ».

Selon l'association Regards Citoyens, qui milite pour la diffusion et le partage de l'information politique, la licence Etalab « prémunit les futurs usagers de tout risque lié au code de la propriété intellectuelle ». Mais l'association souligne que cette licence est limitée au type « BY » alors que des collectivités comme Paris, Nantes ou Toulouse ont choisi d'ajouter une clause « SA ». Cette clause présente la particularité d'encourager l'innovation par la redistribution contributive. Pour Regards Citoyens, « l'open data en France s'oriente donc vers un duopole de licences qui peuvent parfaitement cohabiter, assurant toutes deux un véritable cadre open data aux réutilisateurs ».

au nom de la transparence

L'ouverture des jeux de données introduit également une très lourde question juridique : est-il légal, justifié et moral de tout publier au nom de la transparence...? Pour l'ancienne ministre de l'Economie numérique Nathalie Kociusko-Morizet, la réponse est non : « Il n'est pas question de publier des listes de personnes condamnées. Chaque commune dispose de statistiques liées à la prévention de la délinquance. Ces données sont particulièrement sensibles localement, mais je pense que de nombreuses femmes seraient intéressées de connaître les statistiques d'agression dans telle ou telle rue, tel parking, tel couloir de métro... »

D'ores et déjà, la Commission d'Accès aux Documents Administratifs (Cada) et la Commission Nationale de l'Informatique et des Libertés (Cnil) travaillent conjointement sur la question de l'anonymisation de certaines données publiques. Une question plus complexe qu'il n'y paraît selon Anne Josso, secrétaire générale adjointe de la Cada : « L’anonymisation peut s’avérer plus complexe que d’enlever le nom d’une personne d’un fichier. Beaucoup d’autres informations que le seul nom peuvent en effet permettre d’identifier les personnes ».

On le voit, l'ouverture des données publiques n'en est qu'à ses balbutiements. Il ne se passe désormais plus un jour sans qu'un portail ne soit ouvert en France ou à l'étranger. La Commission européenne elle-même devrait lancer un site rassemblant ses propres données publiques au printemps 2012. Un an plus tard, c'est un portail pan-européen qui verra le jour.

+ repères

l'ouverture des données publiques en 5 mots

1 - Données publiques : données produites et utilisées par les organismes publics dans le cadre de leurs missions.

2 - Etalab : mission chargée de l'ouverture des données publiques en France et du développement de la plateforme Data.gouv.fr. Créée le 21 février 2011, Etalab est placée sous l'autorité du Premier ministre et dirigée par Sébastien Naudet.

3 - Jeu de données : fichier ou ensemble de fichiers relatifs à un même sujet (par exemple un jeu de données consacrées à l'état civil).

4 - Ouverture des données : principe selon lequel les données publiques peuvent être utilisées par les citoyens, les associations ou les entreprises.

5 - Réutilisation : possibilité pour un individu, une association ou une entreprise de publier, modifier et adapter des données publiques.

 

 

 

+ repères

chronologie de l'ouverture des données publiques

2003 : une directive de la Commission européenne suggère aux Etats membres de mettre leurs données à disposition du public.

2005 : le Journal Officiel publie une ordonnance relative « à la liberté d'accès aux documents administratifs et à la réutilisation des informations publiques ».

2006 : une circulaire du gouvernement français transcrit une directive européenne et préconise « une meilleure valorisation des gisements de données dont disposent les administrations ».

2009 : lancement du portail Data.gov aux Etats-Unis hébergeant les données produites par le gouvernement fédéral et les différentes agences du pays.

2010 : lancement du portail Data.gov.uk en Grande-Bretagne.

2011 : lancement du portail Data.gouv.fr en France

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Les podcasts d'Archimag
Rencontre avec Stéphane Roder, le fondateur du cabinet AI Builders, spécialisé dans le conseil en intelligence artificielle. Également professeur à l’Essec, il est aussi l’auteur de l’ouvrage "Guide pratique de l’intelligence artificielle dans l’entreprise" (Éditions Eyrolles). Pour lui, "l’intelligence artificielle apparaît comme une révolution pour l’industrie au même titre que l’a été l’électricité après la vapeur".