Données ouvertes

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 7 janvier 2015 à 00:07 et modifiée en dernier par CommonsDelinker (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.
Selon les pays, une part plus ou moins importante de la donnée publique est mise à disposition de tous dans le champ des données ouvertes. Ce mouvement est en expansion
Les données ouvertes à la Loupe
Autocollants utilisés par les militants des données ouvertes

Une donnée ouverte est une donnée numérique d'origine publique ou privée. Elle peut être notamment produite par une collectivité, un service public (éventuellement délégué) ou une entreprise. Elle est diffusée de manière structurée selon une méthodologie et une licence ouverte garantissant son libre accès et sa réutilisation par tous, sans restriction technique, juridique ou financière.

L'ouverture des données (en anglais open data) représente à la fois un mouvement, une philosophie d'accès à l'information et une pratique de publication de données librement accessibles et exploitables.

Elle s'inscrit dans une tendance qui considère l'information publique comme un bien commun (tel que défini par Elinor Ostrom) dont la diffusion est d'intérêt public et général.

En Europe et dans certains pays, des directives et lois imposent aux collectivités de publier certaines données publiques sous forme numérique.

Remarque : Le présent article est généraliste ; le sujet de la donnée ouverte en France est traité dans un autre article : « Données ouvertes en France »

Éléments de contexte et de définition

L'ouverture des données est une philosophie visant à rendre des données numériques accessibles à tous et à s’affranchir des restrictions sur le droit d'accès et de réutilisation. Ces restrictions peuvent être imposées par l'usage de formats propriétaires ou de licences restrictives, notamment les licences payantes parfois mises en place sur des données publiques. L'ouverture vise à publier les données selon une méthodologie qui supprime les restrictions limitant notamment leur exploitation et reproduction.

Le statut de donnée ouverte est applicable à tout type de données numériques. À titre d'exemple, on peut citer les données sur le transport, la cartographie, les statistiques, la géographie, la sociologie, l'environnement ou encore le juridique. Par analogie, et sous certaines conditions, cela peut être comparé à des œuvres protégées par le droit d’auteur, des œuvres littéraires, artistiques et scientifiques, œuvres cinématographiques, dessins, photographies, sites internet.

La publication de données ouvertes rejoint le terme plus général d’Open knowledge[1] par l’Open Knowledge Foundation qui le définit comme étant une connaissance, c'est-à-dire une œuvre, notamment musicale, cinématographique ou des données tel qu'un article scientifique, une donnée géographique, gouvernementale ou administrative. Le terme ouvert est défini comme la liberté d’utiliser, de réutiliser, de redistribuer librement l’œuvre originale.

Les données ouvertes s'inscrivent dans une démarche plus vaste de transparence et de participation des citoyens que l’on retrouve dans toutes les politiques d’ouverture des droits et qui se manifeste parfois par l’acronyme ODOSOS[2] (de l'anglais « open data, open source et open standards, littéralement données ouvertes, logiciel libre et format ouvert), démarche elle-même comprise dans le mouvement plus général de l’innovation ouverte.

Des champs d'application multiples

Des racines dans le monde universitaire

Les données ouvertes peuvent concerner les données du secteur public avec les notions de e-gouvernement ou encore d’e-démocratie. Elles peuvent aussi être des données issues d'instituts de recherche scientifique publics (ou privés bénéficiant de financements publics, ou souhaitant volontairement ouvrir et partager leurs données), souvent parallèlement à une libre diffusion des résultats de recherches ; on parle alors dans ce contexte de « libre accès » ou « libre diffusion », dont la première définition a été donnée par la Déclaration internationale sur le libre accès de Budapest qui s'est tenue le 14 février 2002, connue sous l'acronyme BOAI (Budapest Open Access Initiative)[3].

De là, de nombreuses autres initiatives ont vu le jour ailleurs dans le monde avec par exemple la Déclaration de Berlin de 2003 sur le libre accès à la connaissance en sciences et sciences humaines[4] ; suivi en mars 2005, depuis Southampton, d’une nouvelle Déclaration appelée Berlin III visant à renforcer les mesures adoptées dans le cadre de Berlin I.

Le projet pour le séquençage du génome humain a été permis par un Open data Consortium[5] créé sur proposition de Jim Kent (en) en 2003 et dont les bénéficiaires vont aussi être les pays en voie de développement où les universités et centres de recherche n’ont pas toujours accès aux périodiques scientifiques.

À côté du mouvement de l’open science data, les données ouvertes s'étendent au secteur privé, avec certaines organisations à but non lucratif. À titre d'exemple, Wikipédia et les grands wikis de la même famille placent tout leur contenu sous licence libre CC-by-sa, et le dernier projet de cette famille Wikidata est une base de donnée ouverte de bases de données libres. Certaines entreprises s'orientent vers le « libre » en choisissant des licences plus ou moins ouvertes pour les données et informations qu'elles génèrent, en publiant par exemple des articles, des études, et même des œuvres artistiques.

Les enjeux dépassent donc maintenant le simple droit d'accès aux documents administratifs.

Un mouvement de libération des données publiques en effervescence

Historiquement, ce sont les États-Unis qui ont les premiers lancé un large processus de libération des données publiques (obligation légale pour l'Etat et ses agences) depuis la loi « Freedom of Information Act » de 1966. Mais les facilités offertes par l'Internet lui ont donné un regain d'intérêt de la part du secteur public depuis 2009 [6].

Dans le monde, des mesures en faveur de davantage de transparence vis-à-vis des citoyens se multiplient et les données ouvertes apparaissent comme l'un des moyens de satisfaire leur volonté de participer à la vie de la Communauté et d’exercer leur droit d’être informé en associant un principe des externalités positives au principe de la donnée publique considérée comme bien commun.

En Europe, en 2003, la directive 2003/98/CE du Parlement européen et du Conseil du 17 novembre 2003 sur la réutilisation des informations du secteur public (en anglais, directive) dite PSI (Public Sector Information) va dans le même sens.

Les anglais ont une loi Freedom of Information Act qui date de l'an 2000.

En France, ce mouvement rencontre l'intérêt de nombreuses collectivités (un décideur sur deux de collectivité locale interrogé par MARKESS International en 2012, déclarait envisager l’élaboration d’une stratégie “open data” avant 2014[7]).

La directive PSI est transposée par une ordonnance [8] complétée d'un décret le 30/12/2005[9] pris en l'application de la loi CADA (Commission d'Accès aux Données Administratives) de 1978 [10].

Il peut notamment faciliter la mise en œuvre du droit d'accès des personnes aux documents administratifs, prévu en France par la loi du 17 juillet 1978[11] puis par la directive 2003/98/CE du Conseil de l'Union européenne du 17 novembre 2003 sur la réutilisation des données publiques[12].

Historique

Un fondement ancien à la libération des données publiques

Le droit d'accès aux informations publiques est inscrit dans la Déclaration des Droits de l’Homme et du Citoyen de 1789[13],[14],[15], sous l'article XV qui mentionne que la société a le droit de demander des comptes à tout agent public de son administration. La loi de 1978 sur le droit d'accès à l'information en France n'impose ni de publier des données numériques, ni de publier de manière proactive des informations.

Vague d'ouverture gouvernementale des années 2000 liée à l'émergence des nouvelles technologies

États-Unis

Aux États-Unis, l'adoption de la loi sur le libre accès à l'information en 1966, la Freedom of Information Act[16], a été amendée notamment en 2007 par la loi OPEN Government Act[17]. L'ouverture des données publiques est (re)devenu un axe central du gouvernement américain avec [18], l'Open Government Initiative ainsi que [19] qui mentionnent les critères de publication de données ouvertes.

La libération des données se développe de manière formelle au niveau d'un État puis au niveau fédéral avec l’élection de Barack Obama, qui, dès son investiture fait part de son intention de « créer un niveau d’ouverture du gouvernement sans précédent », dans le but de « renforcer la démocratie et promouvoir son efficacité et son effectivité au sein du gouvernement »[20].

En , le projet data.gov est lancé, puis en décembre de la même année la directive du gouvernement ouvert[21] est publiée et pose les trois piliers de la coopération entre l'État et les citoyens qui sont la transparence du gouvernement, la participation et la collaboration. Vivek Kundra, premier responsable fédéral des systèmes d'informations (Chief Information Officer) dans l'administration Obama, observe que « la libération de ces données a donné naissance à une économie des applications […] on assiste à une explosion de ces communautés de développeurs ».

Europe

Le mouvement des données ouvertes est encadré au niveau européen par la directive 2003/98/CE (« Informations du secteur public » (PSI)) du Conseil de l'Union européenne du 17 novembre 2003 sur la réutilisation des données publiques[12] et la directive INSPIRE en 2008.

Royaume-Uni

Au Royaume-Uni, un projet analogue[22] est officiellement lancé en janvier 2010, par Gordon Brown et sous l'impulsion de Tim Berners-Lee. Le projet oblige le gouvernement à publier, entre autres, toute dépense supérieure à 25 000 livres sterling en utilisant les technologies du Web sémantique que Tim Berners-Lee met en œuvre depuis dix ans.

France
Le guide d'ouverture d'une petite commune de LiberTIC propose des pistes d'action.

En France, les publications commencent dans le domaine du droit en 2002[23] (8 ans avant le gouvernement britannique qui a ouvert son site « Acts and statutory »[24] en 2010). Des mouvements civiques comme Libertic, Open Street Map France, Regards Citoyens ou Wikimedia France évangélisent sur le thème pendant plusieurs années avant que les pouvoirs publics n'agissent. Les collectivités pionnières en France sont des villes : Rennes puis Paris grâce à la délibération prise par le Conseil municipal en date du 8 juin 2010 relative à la diffusion des données publiques et l’adoption d’une résolution[25] puis du portail « Paris Data[26] » (27 janvier 2011) diffusant des données, dont cartographiques (plan parcellaire, éléments de signalétique, notices d'ouvrages en prêt dans les bibliothèques…), qui a rapidement permis de créer par exemple une carte sur l'histoire des noms des rues de Paris[27], une carte électorale interactive[28] ou une carte des 70 espèces d’arbres présentes à Paris[29], utile pour les allergiques ».

Depuis le 9 octobre 2013, l'association OpenDataFrance réunie les collectivités engagées dans l'ouverture des données publiques.

La mission interministérielle Etalab, désormais service du Premier ministre, est chargée de créer et alimenter le portail de données publiques ouvertes data.gouv.fr[30],[31], en ligne depuis le 5 décembre 2011[32]. Étalab a lancé récemment Dataconnexions, un réseau d'acteurs des données ouvertes afin de dynamiser ce secteur de l'économie numérique[33]. Besançon[34] et d'autres sont en réflexions. En mai 2012, un concours organisé par Dataconnexions a permis de récompenser six acteurs de la communauté des données ouvertes françaises[35].

Autres pays

Kenya

Le Kenya, le 8 juillet 2011, met en ligne sa «Kenya Open Data Initiative», permettant l'accès à 160 bases de données[36].

Canada

Au Canada, le ministre Stockwell Day, Président du Conseil du Trésor a annoncé le 17 mars 2011 le lancement d'un projet pilote de 12 mois pour le site fédéral de données ouvertes http://data.gc.ca/[37]. Le 11 avril 2012, le ministre Tony Clement, nouveau président du Conseil du Trésor, a annoncé le Plan d'action du Canada pour un gouvernement ouvert. Ce plan de 3 ans inclut :

  • L'accroissement du nombre d'ensembles de données disponibles et la mise en place d'un cadre de recommandation pour les nouvelles générations de plateformes ;
  • Un nouveau design et une réorganisation du portail national data.gc.ca, de façon à améliorer le niveau de standardisation des données, dans les seconde et troisième années[38].

En plus du site principal http://data.gc.ca/, l'initiative fédérale comprend :

Critères d'évaluation du degré d'ouverture des données

Les dix critères d'une donnée ouverte

En 2010, la Sunlight Fundation établit une liste de 10 critères [39] caractérisant une donnée ouverte. Pour qu'une donnée soit dite "ouverte", elle doit être :

  1. Complète
  2. Primaire
  3. Opportune
  4. Accessible
  5. Exploitable
  6. Non-Discriminatoire
  7. Non-Propriétaire
  8. Libre de droits
  9. Permanente
  10. Gratuite

Échelle de qualité des données ouvertes de Tim Berners-Lee

En 2010, Tim Berners-Lee a proposé une échelle de qualité des données ouvertes (de 1 à 5 étoiles[40]).

Données non filtrées (éventuellement dégradées)
par exemple mises en ligne avec n'importe quel format[41]
★ ★ Données disponibles de manière structurée
(ex : données tabulaires en CSV, XML, Excel, RDF)[42]
★ ★ ★ Données librement exploitables
- juridiquement (Cf. licences),
- techniquement (dans des formats non-propriétaires, pas sous Excel notamment) [43]
★ ★ ★ ★ Données identifiées par des URL (avec date de mise à jour)
afin que l'on puisse « pointer » un lien vers elles (et la retrouver éventuellement mise à jour)[44]
★ ★ ★ ★ ★ Données liées à d'autres données,
pour les contextualiser et enrichir[45]

Cette échelle concerne les données numériques de base, mais ses critères peuvent être adaptés à des données agrégées ou des informations publiques plus complexes (photos, vidéo, rapports, études, etc. qui devront aussi être mis en ligne, idéalement avec une métadonnée de qualité et pouvant aussi intégrer de l'hypertexte dans le cas des rapports et études, voire de certaines vidéos)

L'objectif premier était de mettre en ligne des données produites par l'État ou d'autres sans attendre la mise en œuvre d'une communauté d’intérêts privées (cf débat présenté plus bas sur le paradoxe de la poule ou de l’œuf) qui pouvait ralentir la mise à disposition des données sur le réseau, et donc indirectement freiner l’émergence de ruptures technologiques au sein du mouvement Web sémantique dont Tim Berners-Lee est l'un des promoteurs.

Les données ouvertes dans le Web des données

Les principaux problèmes de l'exploitation des données ouvertes sont d'ordre technique car les données en masse ne peuvent pas être traitées humainement. Le concept de Web des données appliqué aux données ouvertes met en œuvre 3 mécanismes :

  1. Permettre l'existence de la donnée sur le réseau à travers une URI unique (cela inclut les URL).
  2. Diminuer le coût de transformation de la donnée en apportant des formats standards lisibles par les machines (comme avec RDF, RDFa ou les microdonnées dans le HTML5).
  3. Améliorer la qualité de la donnée pour éviter qu'un traitement de mise à disposition ne puisse les altérer. Un entrepôt de données même avec des erreurs est préférable qu'un entrepôt biaisé. Ainsi, des mécanismes pour la fréquence et l’automatisation des mises à jour de la donnée par les producteurs des données est possible avec un service SPARQL sur ces données.

Les données ouvertes ne sont contrôlables par leurs producteurs (contrôle des mises à jours) et réellement exploitables par d'autres qu'à la condition d'utiliser ces 3 mécanismes.

Bénéfices

Publics et sociaux

En Grande-Bretagne, le croisement des données ouvertes a permis une diminution de 30 % de la facture de consommation d'énergie dans les bâtiments publics en seulement deux mois[46].

Mais certaines applications de réalité augmentée dérangent : par exemple, BeenVerified.com indique les adresses des délinquants sexuels répertoriés et Whoslobbying croise les agendas des ministres aux rendez-vous qu'ils ont avec les milieux d'affaires[47].

De plus, des voix s’élèvent pour rendre transparents les échanges économiques et financiers pour :

  • Eviter les problèmes systémiques qui plongent de nombreux pays dans une crise économique permanente[réf. nécessaire].
  • Eviter les délocalisations abusives d'entreprises qui maquillent leurs comptes pour justifier leurs plans sociaux[réf. nécessaire].

Cependant, l'ouverture des données est souvent uniquement associée à l'idée de réduction des coûts. Les innovations de rupture par l'émergence d'usages inattendus sur ces données vont permettre, à titre d'illustration, la publication de données ouvertes sur les hôpitaux, permettant d'améliorer la qualité de leurs services[réf. nécessaire].

Économiques

Les données ouvertes permettent, dans l'idéal, une concurrence équitable entre toutes les entreprises. Cependant, des études sociologiques en Inde et au Canada ont mis en évidence que l'accès et l'utilisation des données ouvertes étaient conditionnés par des critères matériels (électricité, possession de matériel informatique) et sociaux (éducation)[48].

De plus selon certaines études, la libération de ces données publiques diviserait par cinq le capital nécessaire pour exercer une activité professionnelle dans le secteur de la téléphonie mobile[49]. Le rapport MEPSIR datant de 2006, financé par la commission européenne, estime que le marché européen lié à la réutilisation des informations publiques représente 27 milliards d'euros.

Par ailleurs, l'impact économique direct et indirect a été évalué 140 milliards € par an pour l’Europe[50].

Débats sur l'ouverture des données

Paradoxe de l'œuf et de la poule

Il existe des opinions divergentes sur la mise en œuvre des données ouvertes qui se résume au « Paradoxe de l'œuf et de la poule" »:[réf. nécessaire]

  • Certains pensent que ce sont les données (« l'œuf ») qui permettront de voir naître une possible alchimie et ainsi créer de la richesse qui profitera à toute la société. Il faut donc commencer en priorité par mettre à disposition toutes les données qui existent déjà au sein des institutions publiques. De la poule ou de l'œuf, c'est l'œuf qui existe déjà… donc les données sont leurs priorités.
  • D'autres pensent qu'une communauté (« poule ») est indispensable pour transformer les données en Killer application ou en future start-up. C'est le cas par exemple de la FING (Fondation internet nouvelle génération) qui depuis 2000 a une approche principalement sociale[51] en recommandant depuis janvier 2011 aux collectivités de compléter la démarche par une «infrastructure sociale[51] »:(« modalités d’accompagnement de la réutilisation, les formes d’animation de la communauté des ré utilisateurs, la facilitation des modes de partage entre réutilisateurs »)[51].

Depuis la création de l'Internet, les anglo-saxons sont en tête dans la mise en œuvre du Web, du Web des données en terme technologique, scientifique et économique[réf. nécessaire]L'approche « œuf d'abord » apparaît dans la mise en œuvre des données ouvertes comme avec DBpedia. Cette approche pragmatique de commencer par les données semble donc efficace pour la mise en œuvre des données ouvertes. La question se pose de savoir si elle permet leur exploitation et donc de savoir comment en récolter les fruits; certains résultats sont encourageants. Par exemple en Grande-Bretagne, le croisement des données ouvertes a permis une diminution de 30 % de la facture de consommation d'énergie dans les bâtiments publics en seulement deux mois[46].

Rendre compte des actions publiques

Les institutions en France ont le devoir de valoriser leurs données publiques car à budget constant de l'État, c'est un moyen de pouvoir augmenter leurs recettes pour maintenir leur mission (comme avec l'INA, la BNF, les musées, etc.). Seule une décision politique et donc une loi avec un décret d'application contraindraient toutes les institutions à libérer les données exploitables et interopérables dont elles disposent.[réf. souhaitée]

Ainsi en attendant cette loi et son décret, des associations mettent la pression sur les élus pour obtenir ces données car ils pensent que certains élus ne veulent pas voir des données qui les touchent étalées sur la place publique comme leurs prises de décisions dans les institutions, leurs conflits d’intérêts, leurs frais de remboursement, leurs salaires, etc. Automatiquement dans l'imaginaire des élus, ils pensent que les données ouvertes ne serviront principalement aux citoyens qu'à se substituer à la cour des comptes et donc ralentira d'autant leur travail.[réf. souhaitée]

Ainsi, un débat civique sur le thème « Quel est l’intérêt de l'ouverture des données dans la société ? » est devenu « Pourquoi freiner l'ouverture des données avec des écrans de fumée si les politiques n'ont rien à cacher ? ». Parmi les problèmes non bloquants pour la mise à disposition des données, et qui peuvent sembler être des écrans de fumée pour les citoyens, on peut citer les problèmes suivants :

  • Juridiques : sur le droit de réutilisation des données dans la société bien que les données soient publiques.[réf. souhaitée]
  • Economiques : le financement de la recherche des technologies de l'information et des institutions ayant des données sont au point mort pour "cause de crise", bien que les économies soient instantanées dans les pays qui mettent en œuvre l'ouverture des données.[réf. souhaitée]

Les citoyens considèrent ainsi que leurs élus font souvent le service minimum pour la mise en œuvre d'une politique en rupture dans le domaine de l'ouverture des données et donc de la transparence de toutes les institutions par et pour la société.[réf. souhaitée]

Avancement

Ouverture des données publiques

Liste par pays

Voici une liste non-exhaustive des pays s'inscrivant dans le mouvement des données ouvertes:

Sites de Données Ouvertes
URL Entité Pays/Entité Date de Lancement Licence Données gratuites Données complètes
(non altérées)
Point d'accèsSPARQL & nb triplets Formats Thématiques Note sur l'échelle de Berners-Lee
data.un.org Organisme international Drapeau des Nations unies Nations unies
data.worldbank.org Organisme international Banque Mondiale[52]
open-data.europa.eu Organisme international Drapeau de l’Union européenne Union européenne, Commission Européenne
Gouvernement Drapeau de l'Afghanistan Afghanistan
Gouvernement Drapeau d'Afrique du Sud Afrique du Sud
Gouvernement Drapeau de l'Albanie Albanie
Gouvernement Drapeau de l'Algérie Algérie
govdata.de Gouvernement Drapeau de l'Allemagne Allemagne
Gouvernement Drapeau d'Andorre Andorre
Gouvernement Drapeau de l'Angola Angola
Gouvernement Drapeau d'Antigua-et-Barbuda Antigua-et-Barbuda
Gouvernement Drapeau de l'Arabie saoudite Arabie saoudite
Gouvernement Drapeau de l'Argentine Argentine
Gouvernement Drapeau de l'Arménie Arménie
data.gov.au Gouvernement Drapeau de l'Australie Australie[53]
data.gv.at Gouvernement Drapeau de l'Autriche Autriche
Gouvernement Drapeau de l'Azerbaïdjan Azerbaïdjan
bahrein.bh Gouvernement Drapeau de Bahreïn Bahreïn
data.belgium.be
(Données ouvertes en Belgique)
Gouvernement Drapeau de la Belgique Belgique Encore en bêta, mais utilisable.
dados.gov.br Gouvernement Drapeau du Brésil Brésil
data.gov.bf Gouvernement Drapeau du Burkina Faso Burkina Faso alpha 103 CSV 11
data.gc.ca
(Données ouvertes au Canada)
Gouvernement Drapeau du Canada Canada
datos.gob.cl Gouvernement Drapeau du Chili Chili
govinfo.nlc.gov.cn Gouvernement Drapeau de la République populaire de Chine Chine
datosabiertos.gob.go.cr Gouvernement Drapeau du Costa Rica Costa Rica
digitaliser.dk Gouvernement Drapeau du Danemark Danemark
opendata.ee et pub.stat.ee Gouvernement Drapeau de l'Estonie Estonie
data.gov Gouvernement Drapeau des États-Unis États-Unis
data.gouv.fr
(Données ouvertes en France)
Gouvernement Drapeau de la France France
[1] Gouvernement Drapeau de la Finlande Finlande
geodata.gov.gr Gouvernement Drapeau de la Grèce Grèce (données géospatiales)[54] Année invalide (juillet)
[2] Gouvernement Drapeau de Hong Kong Hong Kong
statcentral.ie Gouvernement Drapeau de l'Irlande Irlande
data.gov.it Gouvernement Drapeau de l'Italie Italie [55]
« opendata.go.ke »(Archive.orgWikiwixArchive.isGoogleQue faire ?) (consulté le ) Gouvernement Drapeau du Kenya Kenya
date.gov.md Gouvernement Drapeau de la Moldavie Moldavie
data.gov.ma Gouvernement Drapeau du Maroc Maroc
« data.overheid.nl »(Archive.orgWikiwixArchive.isGoogleQue faire ?) (consulté le ) Gouvernement Drapeau des Pays-Bas Pays-Bas
« data.govt.nz »(Archive.orgWikiwixArchive.isGoogleQue faire ?) (consulté le ) Gouvernement Drapeau de la Nouvelle-Zélande Nouvelle-Zélande [56]
data.norge.no Gouvernement Drapeau de la Norvège Norvège
« data.go.kr »(Archive.orgWikiwixArchive.isGoogleQue faire ?) (consulté le ) Gouvernement Drapeau de la Corée du Sud République de Corée
datosperu.org Gouvernement Drapeau du Pérou Pérou
[3] Gouvernement Drapeau de l'Arabie saoudite Arabie saoudite
data.gov.sg Gouvernement Drapeau de Singapour Singapour
datos.gob.es Gouvernement Drapeau de l'Espagne Espagne
transparency.gov.tl Gouvernement Drapeau du Timor oriental Timor
government.ae/web/guest/uae-data Gouvernement Drapeau des Émirats arabes unis Émirats arabes unis
data.gov.uk
(Données ouvertes en Angleterre)
Gouvernement Drapeau du Royaume-Uni Royaume-Uni
datos.gub.uy Gouvernement Drapeau de l'Uruguay Uruguay
data.gov.in Gouvernement Drapeau de l'Inde Inde
dados.gov.pt Gouvernement Drapeau du Portugal Portugal
opengovdata.ru Initiative privée Drapeau de la Russie Russie, OpenGovData Russia Catalog [57]
data.gov.sk Gouvernement Drapeau de la Slovaquie Slovaquie
xn--ppnadata-m4a.se Gouvernement Drapeau de la Suède Suède
opendata.admin.ch Gouvernement Drapeau de la Suisse Suisse [58]
Ghana Open Data Initiative Gouvernement Drapeau du Ghana Ghana(GODI)
satupemerintah.net Gouvernement Drapeau de l'Indonésie Indonésie
mapas.gob.mx Gouvernement Drapeau du Mexique Mexique
oman.om/opendata Gouvernement Drapeau d'Oman Oman
data.gov.tn et opendata.interieur.gov.tn
(Données ouvertes en Tunisie)
Gouvernement Drapeau de la Tunisie Tunisie
paloalto.opendata.junar.com Municipalité Drapeau des États-Unis États-Unis, Palo Alto
rotterdamopendata.nl Municipalité Drapeau des Pays-Bas Pays-Bas, Rotterdam
bahiablanca.opendata.junar.com Municipalité Drapeau de l'Argentine Argentine, Bahía Blanca
donnees.ville.montreal.qc.c Municipalité Drapeau du Canada Canada, Montréal
lima.datosabiertos.pe Municipalité Drapeau du Pérou Pérou, Lima
data.iledefrance.fr Région Drapeau de la France France, Région Île-de-France

Problèmes

Des moyens faibles face à une rentabilité mal évaluée

Force est de souligner que les budgets informatiques nécessaires pour la mise en œuvre de portails dédiés aux données ouvertes sont faibles. Aux États-Unis, le pilotage de l'Electronic Government Fund ne nécessite que 34 millions $ en 2010[59]. En France, l'équipe Étalab, anciennement dirigée par Séverin Naudet, ancien conseiller « internet » de François Fillon chargé notamment du développement du site France.fr, comprend 9 personnes et dispose d'un budget de 4 M€ hors charges salariales pour réaliser le portail data.gouv.fr; elle est rattachée au premier ministre et a le soutien de la DILA.

Bien que le portail britannique data.gov.uk ait coûté 600 K€, le croisement des données ouvertes a permis une diminution de 30 % de la facture de consommation d'énergie dans les bâtiments publics en seulement deux mois[46].

Une publication inégale selon les domaines

Certains domaines jugés sensibles, stratégiques ou rémunérateurs ne sont pas libérés.

Ouverture des données économiques et financières

Les données qui permettraient de rendre transparents le commerce et la finance sont généralement dans des entités qui ne communiquent que rarement leurs données et bien souvent leurs conclusions sont invérifiables car sans liens avec les données qui ont permis de faire leurs conclusions. Certaines sont publiées du fait de la réglementation, mais sans normalisation ni formats facilement exploitables.

Données sur les entreprises

Données boursières

Ouverture des données scientifiques

L'ouverture des données scientifiques et le libre accès sont deux sujets connexes mais distincts. Le libre accès concerne les publications scientifiques, souvent relues par des pairs. L'ouverture des données scientifiques peut concerner les données à la base de ces articles, ou toute base de données à caractère scientifique (par exemple des relevés météorologiques ou autres), afin de permettre la reproduction des expériences menées, afin de les affirmer ou les infirmer[60].

Les technologies

Évolution du Web des données de 2007 à 2010 par les plus optimistes

Les données ouvertes sont soumises à une seule contrainte qui est d'être accessible par tous types de machines pour permettre leur traitement. Cela implique que les données ouvertes soient interopérables. Si les données ne respectent pas les standards du Web pour permettre leur interopérabilité, on parlera de données bridées car leur réutilisation est moindre voire quasiment nulle.

Ce critère d’interopérabilité n'a jamais été réellement respecté dans l'industrie, jusqu'en 2008 où le standard SPARQL est devenu une recommandation du W3C. Ce langage de requête permet aux développeurs de tester leurs requêtes directement depuis leurs navigateurs Web sur les données ouvertes en ligne puis de développer leur propre programme pour analyser ces données. On peut ainsi consommer les données à distance sans avoir à les transformer ou à les déplacer. Ainsi, les gouvernements au Royaume-Uni et aux États-Unis ont commencé à basculer leurs données dans le Web des données ouvert (en anglais, Linked Open Data ou LOD) en respectant les standards du W3C et en offrant un point d'accès SPARQL pour les développeurs.

Exemple de données réellement ouvertes : trouver sur une carte les écoles les plus proches de son domicile avec les données de Data.gov.uk (du gouvernement au Royaume-Uni) qui offre toutes les données relatives aux écoles sur son territoire.

Une conséquence de ce choix politique, d'offrir un vrai standard pour les données publiques comme le Web des données, est décrit dans le livre "Linking Government Data[61]". Dans ce livre est décrit comment le Web des données est passé de quelques 40 millions de triplets RDF au sein de quatre entrepôts de données en 2007 à 203 entrepôts avec plus de 25 milliards de triplets avec 395 millions de liens à la fin 2010. Les plus optimistes parlent de croissance exponentielle des données (comme dans l'illustration : Évolution du Web des données) et annoncent un Web 3.0 et même un possible point de singularité dans l'avenir. Quoi qu'il en soit, ce choix politique a permis d'ouvrir de nouvelles pistes de recherche scientifique, économique et sociale.

Les licences

L'ouverture des données impose d'apposer une licence fixant les conditions dans lesquelles ces données pourront être copiées, diffusées, réutilisées librement. Les contextes juridiques variant d'un pays à un autre, diverses licences sont aujourd'hui utilisées à travers le monde.

Licences de l'Open Knowledge Foundation

Open data commons est un projet lancé au Royaume-Uni en décembre 2007 par l’Open Knowledge Foundation. La première licence libre du projet a été élaborée en mars 2008 par Jordan Hatcher et Dr Charlotte Waelde.

Ces licences peuvent être appliquées aux bases de données et données qu'elles contiennent prises isolément. L’Open Knowledge Foundation a élaboré trois types de licences de données libres qui se fondent sur leur droit interne, lui-même basé sur le modèle anglo-saxon et qui diffère des droits romano-germaniques, c’est-à-dire civilistes, avec une protection plus reconnue et aboutie du droit moral. De là, l'application de certaines de ces licences aux œuvres de l'esprit n'est pas valable en France mais peut être envisagée pour la diffusion des données publiques dans la mesure où elles sont par définition, publiques.

Public Domain Dedication and License

La licence Public Domain and License (PDDL)[62] donne la possibilité d’utiliser, de copier, de modifier, de redistribuer une base de données sans aucune restriction. C’est une licence libre de tout droit, de type domaine public. Les données peuvent donc être exploitées de façon totalement libre et l’auteur abandonne son droit moral.

Open Database Commons

Cette licence[63] que l'on retrouve sous le sigle ODC-by autorise l’utilisation, la copie, la redistribution, la modification, la réalisation de travaux dérivés de la base de données, sous réserve d’indiquer le nom de l’auteur de la base de données originale. On retrouve ces principes dans la licence Creative Commons By.

Open Database License

La licence ODC-ODbl[64] est fondée sur le droit d'auteur et le droit sui generis des bases de données. Elle donne la possibilité aux utilisateurs de copier, distribuer, utiliser, modifier et produire une œuvre dérivée à partir d’une base de données sous réserve de la redistribuer sous les mêmes conditions imposées par la licence originale. Elle implique aussi d’indiquer le nom de l’auteur de la base de données d’origine.

Licences de type Creative Commons

À l'exception de la licence CC-0 spécialement conçue à cette fin, les licences de la famille Creative Commons ne sont pas adaptées à un usage sur une base de données. Elles sont en effet uniquement centrées sur le droit d'auteur, et négligent le droit sui generis des bases de données : cela risque d'une part de les rendre inefficientes (le respect de leurs obligations n'étant plus lié à la cession de droit) et d'autre part de rendre incertains le statut des données diffusées sous ces licences (l'éventuel droit sui generis des bases de données n'étant pas partagé)[65].

Licences en France

En droit français, les données publiques sont considérées comme susceptibles de contenir des informations sensibles, soit, car elles permettent d'identifier une personne, soit car elles sont soumises au droit d'auteur, secret d'État ou pour des considérations de défense nationale. Dans ce contexte, les données ne peuvent pas être librement diffusées sans autorisation préalable ou doivent faire l'objet d'une anonymisation. Une fois les droits de diffusion garantis, des licences vont s'appliquer. Différents organismes ont élaboré des licences libres applicables à tout type de contenu, public ou créations de l'esprit. Il s'agit de simples modèles de licence d'exploitation qui n'imposent pas de s'y conformer. Des contrats inédits peuvent être élaborés, à la condition de respecter le droit interne, tant au regard des dispositions des lois du 17 juillet 1978 ou encore du 6 janvier 1978 qu'au regard des règles d'ordre public applicables au contrat[66]. En France, jusqu'à cinq licences différentes de réutilisation ont été apposées sur les données ouvertes. En 2013, l'harmonisation des pratiques a conduit à l'usage de deux licences types utilisées dans des proportions équivalentes [67]: la Licence Ouverte et l'Open Database Licence.

Licence du ministère de la Justice français

Le ministère de la Justice a pris l'initiative de concevoir une licence adaptée aux données publiques, la Licence information publique librement réutilisable[68] communément appelée la LIP.

Elle donne la possibilité de réutiliser les données du Répertoire du ministère[69] gratuitement, même à des fins commerciales sous réserve de mentionner les sources, la date de mise à jour, de ne pas altérer les données et de ne pas en dénaturer le sens.

Il est également prévu que l'utilisateur ne puisse autoriser une nouvelle réutilisation sous une licence qu'à la condition d'avoir ajouté de la valeur à la donnée d'origine.

Logo de la Licence Ouverte
Logo de la Licence Ouverte

Licence Ouverte

Cette licence créée par ETALAB est destinée à être utilisée notamment sur data.gouv.fr.

Open Database License

La licence ODbL a été traduite en français par la ville de Paris afin de l'adapter à un usage national. Une variété de projets utilisent cette licence, depuis Open Street Map aux collectivités locales (Paris, Nantes, Toulouse…).


Organisations de promotion des données ouvertes

Notes et références

  1. http://www.opendefinition.org/okd/
  2. Le sigle ODOSOS a été développé lors du lancement de grands projets scientifiques fondés sur l'ouverture des résultats de recherche
  3. Open Acess initiative ; http://openaccess.inist.fr/spip.php?article9
  4. Déclaration de Berlin ; http://www.zim.mpg.de/openaccess-berlin/BerlinDeclaration_fr.pdf
  5. http://www.opendataconsortium.org/
  6. Chronologie de l'ouverture des données publiques par Tim Davies
  7. Open data : quelles perspectives d’élargissement du mouvement au sein des collectivités locales d’ici 2014 ?, blog Administration numérique MARKESS International
  8. Ordonnance 2005-650 du 6 juin 2005
  9. Décret n° 2005-1755 du 30/12/2005 relative à la liberté d'accès aux documents administratifs et à la réutilisation des informations publiques, pris pour l'application de la loi n° 1978-753 du 17/7/1978
  10. Loi n° 1978-753 du 17/7/1978
  11. Texte en vigueur : http://www.legifrance.gouv.fr/affichTexte.do?cidTexte=LEGITEXT000006068643&dateTexte=20110517
  12. a et b Texte en vigueur: http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:2003:345:0090:0096:FR:PDF
  13. Direction de l'information légale et administrative, « Comment améliorer la transparence de l’administration ? - S'adapter aux attentes des usagers Découverte des institutions », (consulté le )
  14. Légifrance, « Déclaration des Droits de l'Homme et du Citoyen de 1789 » (consulté le )
  15. Assemblée nationale, « Le temps de l'invention (1789-1799) - Histoire de l'Assemblée nationale » (consulté le )
  16. Texte en vigueur : http://www.justice.gov/oip/foia_updates/Vol_XVII_4/page2.htm
  17. Texte en vigueur : http://www.justice.gov/oip/amendment-s2488.pdf
  18. [http://www.whitehouse.gov/the_press_office/Transparency_and_Open_Government/ memorandum sur la transparence et gouvernance ouverte de 2009
  19. la Directive sur l'ouverture des données de 2013
  20. « L'information détenue par le gouvernement fédéral est un bien national » (discours du 20 janvier 2009)
  21. http://www.whitehouse.gov/sites/default/files/omb/assets/memoranda_2010/m10-06.pdf
  22. http://data.gov.uk/project ; Projet data.gov.uk
  23. Décret no 2002-1064 du 7 août 2002 instaurant la mise en ligne gratuite sur l'internet des informations juridiques
  24. "Acts and statutory instruments"
  25. « Ordre du jour définitif du Conseil Municipal de Paris du 16/03/2012 »(Archive.orgWikiwixArchive.isGoogleQue faire ?) (consulté le )
  26. http://opendata.paris.fr
  27. Carte interactive sur l’histoire des noms des rues de Paris à partir de données ouvertes
  28. « Carte électorale interactive »(Archive.orgWikiwixArchive.isGoogleQue faire ?) (consulté le )
  29. Cartographie des 70 essences d'arbres à Paris
  30. Etalab, mission de création du portail de données publiques data.gouv.fr
  31. Allocution de Séverin Naudet lors du salon i-expo le 18 mai 2011 : « Avec l'internet, il est logique d'adosser le prix de l'information sur son coût marginal proche de zéro, surtout lorsque la donnée est financée par tous via l'impôt. »
  32. « L'ouverture des données publiques: une dynamique de long terme, impulsée par Etalab », data.gouv.fr, (consulté le )
  33. Les partenaires de Dataconnexions
  34. theitcircle.net, Open Data : Besançon pourrait suivre le mouvement, consulté 2011-09-25
  35. Les finalistes du premier concours Dataconnexions
  36. Joan Tilouine, « #OpenData : Le Kenya lance le mouvement » (consulté le )
  37. Minister Day Launches Open Data Portal
  38. Canada's Action Plan on Open Government
  39. 10 principes de l'ouverture des données selon la Sunlight Fundation
  40. Tim Berners-Lee, « Linked Data », sur le site W3C, section « Is your Linked Open Data 5 Star? » (page consultée le 10 février 2014).
  41. Exemple donnée météorologique basique : T°c la plus basse selon jour/mois/année, tiré de « 5 ★ Open Data », 3 avril 2012 (page consultée le 10 février 2014).
  42. Même donnée que ci-dessus, mais sous forme d'un tableau Excel, plus facile à réutiliser
  43. Même donnée que ci-dessus en format CSV (reconnu par Excel et de nombreux autres logiciels)
  44. Même donnée que ci-dessus, mais via un lien URL
  45. Même exemple que ci-dessus, mais avec lien hypertexte
  46. a b et c Citation de Charles-Henri Schulz lors de l'atelier Open data, open standards lors de l'Open World Forum du 24 septembre 2011.
  47. Émilien Ercolani, Open data : pas si simple ! L'informaticien, no 91, mai 2011, page 29.
  48. Michael Gurstein, Open data : Empowering the empowered or effective data use for everyone ?, First Monday (Université de l'Illinois), 7 février 2011, consulté le 15 octobre 2013
  49. Chiffre cité par Olivier Schmit lors la conférence Les Modèles économiques de la réutilisation des données publiques (open data) du salon i-expo le 18 mai 2011
  50. REVIEW OF RECENT STUDIES ON PSI RE-USE AND RELATED MARKET DEVELOPMENTS by Graham Vickery
  51. a b et c Guide pratique de l'ouverture des données publiques territoriales, à l'usage des territoires et de leurs partenaires (version Beta)
  52. TED talk : l'open data au service de l'aide internationale, par Sanjay Pradhan, vice président de l'Institut de la Banque Mondiale (vidéo 15 min, collaborativement sous-titrée en Français)
  53. http://www.smos.gov.au/media/2011/mr_072011.html
  54. (en) « GR: Free geospatial data available online at geodata.gov.gr », sur epractice.eu
  55. « Wikitalia ovvero la partecipazione civica dopo e oltre i referendum », Libertiamo,‎ (lire en ligne, consulté le )
  56. New Zealand Government initiative to publish Government Data under Creative Commons licences, defined further at NZ GOAL
  57. (en) « Catalogues », sur opengovernmentdata.org
  58. « À propos du portail Open Government Data de la Confédération suisse », sur opendata.admin.ch
  59. Émilien Ercolani, Open data : pas si simple ! L'informaticien, no 91, mai 2011, page 29.
  60. http://www.lemonde.fr/sciences/article/2013/07/15/pour-une-recherche-reproductible-publiez-vos-codes-et-donnees_3447825_1650684.html
  61. (en) David Wood, Linking Government Data, (ISBN 978-1461417668), p6, The Linked Open Data cloud has grown from about 40 million triples representing four data sets in 2007 to 203 data sets (qualified from the 215 submitted) consiting of over 25 billion RDF triples and 395 million RDF links, as of the end of 2010.
  62. [PDF] Licence ODC PDDL
  63. Licence ODC by : http://www.opendatacommons.org/licenses/by/1.0/
  64. Licence ODC ODbl
  65. Voir Mike Linksvayer, « CC and data[bases]: huge in 2011, what you can do », « https://creativecommons.org/weblog/entry/26283 »(Archive.orgWikiwixArchive.isGoogleQue faire ?) (consulté le )
  66. À titre d'exemple, le droit moral de l'auteur ou encore la nullité des clauses abusives
  67. Carte de France des initiatives d'ouverture de données publiques
  68. http://www.rip.justice.fr/information_publique_librement_reutilisable
  69. http://www.rip.justice.fr/ ; licence conçue par Thomas Saint Aubain
  70. "Free our data" (The Guardian section technologie)
  71. http://linkedscience.org/about
  72. Linking Open Data on the Semantic Web

Annexes

Sur les autres projets Wikimedia :

Bibliographie

  • Romain Lacombe, Pierre-Henri Bertin, François Vauglin et Alice Vieillefosse, Pour une politique ambitieuse des données publiques, La Documentation française, (lire en ligne)
  • Simon Chignard, L'open data, comprendre l’ouverture des données publiques, Fyp Éditions,

Articles connexes

Liens externes

Vidéographie