réutilisation des données publiques: chaque pays son credo

Virginie Boillet DR

 

Les données publiques représentent une matière première potentiellement exploitable par de nombreuses entreprises. Depuis 2003, une directive européenne cherche à stimuler le développement économique de ce secteur. État des lieux contrasté en Europe.

Le potentiel de réutilisation des informations publiques à l’ère du numérique est très important. Le marché de la réutilisation des données publiques a été estimé à 27 milliards d’euros dans l’Union européenne. Les informations publiques constituent le socle de nombreux produits et services numériques : systèmes de navigation embarquée (GPS), prévisions météorologiques, services financiers et produits d’assurance. Les nouvelles applications possibles, notamment sur les smartphones, sont riches et utiles dans la vie quotidienne : informations en temps réel sur les embouteillages ou les horaires des transports publics, cartographies des taux de criminalité par quartiers, taux de réussite aux examens des écoles…

directive européenne

Souhaitant améliorer les possibilités de réutilisation des informations émanant du secteur public dans l’objectif de contribuer à la croissance économique du marché de l’information en Europe, la Commission européenne a préparé la directive 2003/98/CE, votée le 17 novembre 2003 par le Parlement européen et le Conseil. En France, la directive européenne a été transposée par l’ordonnance 2005-650 du 6 juin 2005 relative à la liberté d’accès aux documents administratifs et à la réutilisation des informations publiques, modifiant la loi 78-753 du 17 juillet 1978. Les conditions de réutilisation des informations publiques sont précisées dans le décret n° 2005-1755 du 30 décembre 2005. Même si aujourd’hui, tous les pays de l’Union européenne ont transposé la directive européenne dans leur législation, les situations de réutilisation restent très contrastées d’un pays à l’autre. Les deux pays les plus avancés en matière de mise à disposition des données publiques pour réutilisation sont les États-Unis et la Grande-Bretagne. Ces deux pays ont adopté une stratégie de valorisation des données publiques de long terme. Les études économiques démontrent, en effet, que les bénéfices indirects – sous forme d’impôts, notamment – procurés par une réutilisation gratuite des données publiques sont supérieurs aux recettes immédiates engendrées par la vente de licences. Une étude de 2006 de l’Office of fair trading (OFT) au Royaume-Uni a démontré que « les pratiques commerciales restrictives des organismes publics producteurs de données induisent un manque à gagner d’environ un milliard de livres [1,43 milliard d’euros] pour l’économie nationale ».

data.gov aux États-Unis

Les États-Unis ont lancé, en mai 2009, leur www.data.gov qui a vocation à rassembler l’ensemble des données publiques américaines. Toutes les données sont gratuites et libres de réutilisation. Un catalogue de données est disponible en différents formats – XML, CSV, text, KML, KMZ, shapefile… – avec une recherche possible par thème ou par agence fédérale. Il y a trois manières d’accéder aux données : en téléchargeant directement les données dans le raw data catalogue, soit en étant redirigé vers le site de l’agence émettrice des données, soit en visualisant les données sur une carte. Ce répertoire de données publiques a pour vocation d’être à terme exhaustif. En outre, une palette d’outils statistiques, de data-mining, cartographique est disponible afin de mieux exploiter l’information.

data.gov au Royaume-Uni

Créé en 2005, l’Opsi (Office of public sector information) est l’organisme public au Royaume-Uni chargé d’aider au développement de la réutilisation des données publiques, avec une vision macroéconomique de développement de l’industrie de l’information. En mars dernier, le gouvernement britannique a mis en place une licence basée sur les creative commons, baptisée creative commons attribution 3.0 licence. Celleci permet une réutilisation des données publiques, y compris commerciale. La seule contrainte est la mention de l’origine des données. Cette nouvelle logique implique qu’il n’y a plus de relation contractuelle entre l’organisme public et le réutilisateur. Lancé en janvier 2010, le data.gov.uk met à disposition des données géolocalisées sur la criminalité, les taux d’obésité, les transports, les performances des écoles… Le portail donne accès directement en ligne à toutes ces données. À terme, 13 000 collections de données seront disponibles sur le site. Actuellement, ce ne sont pas moins de 2000 collections de données qui sont réutilisables. L’Ordnance Survey (équivalent de l’Institut géographique national en Grande-Bretagne) a notamment mis en libre accès l’ensemble de ses bases de données alors que le chiffre d’affaires issu de la vente de licences était d’environ 100 millions de livres par an sur les trois dernières années. La sortie de ce portail a été précédée au Royaume- Uni d’un large mouvement populaire visant à ouvrir les données publiques, initié par le quotidien The Guardian avec sa campagne intitulée « Free our data » (Libérez nos données).

les citoyens s'en mèlent

En France, un mouvement similaire est en train d’apparaître. Le premier barcamp sur la réutilisation des données publiques s’est tenu à La Cantine, à Paris, en décembre 2009. Les articles de presse sur le sujet destinés aux citoyens se multiplient. Quelques répertoires de données publiques ont été créés. Excepté pour les services du Premier ministre, qui mettent à disposition pour réutilisation de manière gratuite leurs données libres de droit d’auteur, et le ministère de la Justice, qui a créé une licence IP pour « information publique librement réutilisable », très proche des licences creative commons, les autres répertoires proposent deux niveaux de réutilisation : le niveau 1 propose une réutilisation gratuite et concernant le niveau 2, il est nécessaire de contacter le webmestre. En France, c’est l’Agence de protection des actifs immatériels de l’État (Apie) qui est chargée de mettre en place des licences de réutilisation des données publiques. Le projet de tarification proposé par l’Apie se base en grande partie sur la valeur d’usage de l’information. La valeur d’usage désigne la valeur d’une information pour un réutilisateur en fonction de l’utilité qu’il en retire. Outre les difficultés à calculer une telle « valeur d’usage », ce principe va à l’encontre de l’esprit même de la directive européenne qui est de développer une économie de la connaissance et une politique de développement de l’innovation. Cela induirait également un prix différent selon les opérateurs. Ce principe privilégie une stratégie de valorisation des données publiques de court terme – recettes immédiates perçues par la vente de licences.

le futur data.gouv.fr

Un projet de portail unique de mise à disposition des données publiques est en cours de préparation par l’Apie. Un appel d’offres va être lancé au cours du premier semestre 2010 pour un lancement prévu à la fin de l’année 2010. Dans le même temps, Eric Woerth, ministre de la Fonction publique et Nathalie Kosciusko- Morizet, secrétaire d’État à l’Économie numérique, ont annoncé, lors d’une conférence de presse donnée le 12 février 2010, leur volonté de créer un data.gov à la française permettant la réutilisation la plus libre possible des données publiques.

Les podcasts d'Archimag
Rencontre avec Stéphane Roder, le fondateur du cabinet AI Builders, spécialisé dans le conseil en intelligence artificielle. Également professeur à l’Essec, il est aussi l’auteur de l’ouvrage "Guide pratique de l’intelligence artificielle dans l’entreprise" (Éditions Eyrolles). Pour lui, "l’intelligence artificielle apparaît comme une révolution pour l’industrie au même titre que l’a été l’électricité après la vapeur".