Utilisateur:Overflorian/Source OpenStreetMap

Une page de Wikipédia, l'encyclopédie libre.

Quelle est l'admissibilité des données issues d'OpenStreetMap en tant que source dans les articles Wikipédia ?

C'est la question que j'ai posé le 7 janvier 2023 : Discussion Wikipédia:Observatoire des sources#OpenStreetMap


Voici mon analyse complète :

Recommandation[modifier | modifier le code]

Mon avis est que les données/informations issues d'OpenStreetMap ne sont admissibles qu'à la lumière d'un faisceau d'indices à interpréter au cas-par-cas.

Dans le cas où aucun indice n'est fourni en complément des données issues d'OpenStreetMap, le statut associé devrait être celui d'une référence à confirmer.

Dans ce cas, le cartouche [réf. à confirmer] devrait être affiché.

Je détaille ci-dessous les éléments qui m'amènent à formuler cette recommandation.

Critères[modifier | modifier le code]

La base de données cartographique OpenStreetMap (OSM) est très utile pour identifier des lieux et points d'intérêt recensés sur le terrain[1].

Cette source est déjà mentionnée comme ressource libre[2] et est intégrée en profondeur dans les projet Wikimedia avec Wikimedia Maps[3]. De nombreux fonds de cartes affichés dans les pages Wikipédia sont basés sur OpenStreetMap[4].

  • C'est un projet philosophiquement proche de Wikipédia : collaboratif, libre et ouvert. Son statut pourrait donc être considéré comme similaire à celui d'un wiki, entrainant de facto sa disqualification en tant que source admissible.
  • Techniquement néanmoins, c'est plutôt une base de données, laissant la porte ouverte à une interprétation plus large, appréciable au cas-par-cas, "en fonction du contexte et de l'éditeur" selon 2 critères :
Critère Appréciation
"La notoriété de la base (reconnaissance par les pairs) et de son éditeur" OpenStreetMap est la plus célèbre base de données cartographiques libre au Monde.

OpenStreetMap est la source de données pour de très nombreuses bases de données cartographiques et cartes, notamment par de nombreux acteurs à but non-lucratif comme Wikimedia, Médecins sans frontières, la Croix Rouge ..., par de grosses entreprises comme Meta, Apple, Microsoft, TomTom[5], ... et par d'innombrables acteurs académiques, associatifs, ... autant publics que privés[6][7].

"Certaines bases de données reprennent des données d'autres bases ; mieux vaut alors privilégier la base d'origine." Les sources à l'origine des données créées dans OpenStreetMap sont très variées et il peut donc être pertinent, selon le contexte, de remonter jusqu'à une source plus en amont.

Elles peuvent être regroupées en plusieurs catégories, détaillées dans le tableau ci-dessous :

Type de source Appréciation
Collecte sur le terrain Qualité et précision variable : d'excellente à passable selon l'expérience du contributeur et le matériel utilisé (smartphone, GPS de précision ...).

D'une manière générale, la précision de la position varie entre 50cm et 5m, la précision étant souvent meilleure dans les zones densément habitées.

Déduction à partir de photos terrain Des informations sont déduites de photos précédemment collectées, comme par exemple celles disponibles sous licence Creative Commons dans Wikimedia Commons ou Mapillary.

La qualité et la précision sont variables selon la présence de méta-données de géolocalisation et, le cas échéant, du matériel (photo ou GPS) utilisé.

Intégration de bases de données externes De très nombreuses bases de données sont intégrées au fil de l'eau. La liste de ce type de source s'est tellement allongée que la communauté OpenStreetMap n'est plus à même de la maintenir à jour.

De nombreuses bases de données locales sont intégrées, par exemple en France.

À titre d'exemple, on peut citer :

Nombre de ces sources peuvent être considérées comme admissibles en tant que telles.

Intégration de bases de données externes élevées dans le domaine public Voir la liste
Décalquage d'imagerie aérienne Sources de précision variables : imageries satellite (précision généralement entre 1 et 10m), photographie par avion ou drone, plus précise encore.

Une analyse des données OpenStreetMap (voir tableau ci-dessous) permet d'identifier dans la majorité des cas la source originelle au cas-par-cas. Néanmoins, cette analyse de fournit jamais de garantie absolue.

Autres critères d'appréciation de la qualité d'OpenStreetMap[modifier | modifier le code]

Concernant les autres critères permettant d'apprécier la qualité d'une source :

Critère Appréciation d’OpenStreetMap
la diffusion : le volume, le nombre de lecteurs, mais aussi la qualité du lectorat Début 2023, OpenStreetMap compte 9 millions d’utilisateurs[9] ayant produit 900 millions d'objets[10]. C'est la plus grosse base de données cartographique libre au Monde.

Il y avait 6 millions d’utilisateurs il y a 2 ans, c’est donc un projet en croissance rapide ces dernières années.

la spécialité de la source qui doit correspondre au thème de l'article ; N/A, ce critère doit être apprécié au cas-par-cas
l'engagement : la source est-elle impartiale sur le sujet traité ? Le projet vise l’impartialité, sans toutefois apporter de garanties, en recommandant et veillant à la bonne mise en œuvre de plusieurs bonnes pratiques[11] :
  • la correspondance avec la réalité du terrain[12]
  • la vérifiabilité[13]
  • la prédominance de la qualité des données par rapport au rendu cartographique[14]
  • un grand nombre d’autres règles favorisant la qualité et la véracité des données produites[11]
l'identité et la réputation : la source publie-t-elle souvent des résultats erronés ? Est-elle souvent évoquée comme référence par des sources non confidentielles ? A-t-elle reçu des prix ou des distinctions notables ? Est-ce une source institutionnelle ? Quelle est la réputation de l'éditeur par rapport au sujet traité ? (O'Reilly Media pour l'informatique, Economica pour l'économie, etc.) ; De nombreuses sources mentionnent la pertinence et la qualité des données OpenStreetMap, notamment en comparaison avec des données d'autres bases de données.

Google scholar fait état de 79 900 sources contenant avec l’occurrence "OpenStreetMap".

Une méta-étude a compilé toutes les études à ce sujet en 2017[15].

On peut par exemple citer les études académiques suivantes :

  • Qualité du réseau routier au Québec[16]
  • Exploitabilité des données pour suivre les indicateurs de Développement durable en Pologne[17]
l'évaluation de la source par des tiers : comité de lecture, éditeur, rédacteur en chef, etc. ; Tout comme Wikipédia, il n'existe pas de validation a priori des contributions.

De nombreux mécanismes de contrôle, validation, correction, nettoyage et de mise-à-jour sont mis en œuvre pour améliorer la qualité des données a posteriori. Une combinaison de règles de validation automatiques est combinée avec de la validation crowdsourcée donc manuelle.

De nombreuses études académiques ont fait état de l'efficacité des méthodes de validation a posteriori par rapport aux méthodes de validation a priori classiques[18].

les liens avec d'autres sources quant à l'information diffusée : de quelle manière les informations publiées par la source sont-elles évoquées ou reprises par d'autres sources ? Est-elle reprise dans des bibliographies ? Est-elle citée dans les médias ? De très nombreuses institutions utilisent OSM comme données sources de leurs cartes et bases de données cartographiques[6][7].
la date : la source est-elle datée ? Les informations qu'elle contient sont-elles à jour ? Ont-elles depuis sa publication fait l'objet de critiques ou de remises en cause ? Un registre est tenu public pour la totalité des actions, en particulier pour les :
  • dates de création, modification, suppression
  • utilisateurs et adresses IP


Voici par exemple l’historique de l’oratoire des Rots https://www.openstreetmap.org/node/3617547290/history

Plusieurs modifications successives ont été réalisées sur cet objet. La première est la création de l’objet indiquant la présence d’un oratoire (techniquement, cette information est indiquée par historic=wayside_shrine).

Cette création a eu lieu le 15 juin 2015 à 13h16min26sec par l’utilisateur JBacc1 dans un groupe de modification indiquant que la source des données provient d’un relevé terrain réalisé à l’aide d’un GPS et des données fournies par l’application mobile Strava (source=Survey, gps, strava).

Par la suite plusieurs modifications ont successivement ajouté les informations suivantes :


La remise en cause permanente est constitutive du projet : le principe même d’OpenStreetMap est son caractère infini : tout comme Wikipédia est un projet encyclopédique sans objectif de complétude, OpenStreetMap est un projet cartographique sans objectif de complétude.

la forme : orthographe, niveau de langue. De très nombreuses règles conseillent le formatage précis des données. Voir par exemple les règles s’appliquant aux noms.

Principes[modifier | modifier le code]

Identification de la source primaire autant que faire ce peu[modifier | modifier le code]

Il a été détaillé ci-dessus le processus afin d'identifier plus précisément dans OpenStreetMap la source de chaque donnée et méta-donnée. Dans l'idéal, cette source devrait être recherchée.

Type d'indices admissibles[modifier | modifier le code]

Le faisceau d'indices devrait se baser sur (liste non-exhaustive) :

  • la source de la donnée créée dans OpenStreetMap ;
  • l'association avec une photo ;
  • la présence de la géolocalisation dans les méta-données de cette photo ;
  • la confirmation des données (localisation, nom, autres méta-données) via d'autres sources.

Non-substitution[modifier | modifier le code]

Oratoire des Rots

En outre, il me semble important d'apprécier la source OpenStreetMap en tant que telle et non pas seulement à l'aune de ses indices secondaires : en effet, les informations fournies par OpenStreetMap ne sont pas déductibles de ces indices.

Par exemple, la géolocalisation précise de l'oratoire des Rots est bien issue directement d'un relevé terrain ayant mené à la création de données dans OpenStreetMap aux coordonnées précises 46° 04′ 17″ N, 6° 43′ 10″ E .

Il n'est pas possible de déduire cette information à partir de la position de l'image, car la position de la photo n'est pas exactement celle de l'objet dans OpenStreetMap.

Singularité de la donnée[modifier | modifier le code]

Par ailleurs, si un faisceau d'indices permet d'apprécier la crédibilité d'une donnée en particulier, cela ne devrait pas être généralisable à un jeu de données.

Par exemple, dans le cas où la localisation, le nom, des inscriptions de plusieurs oratoires sont indiqués par OpenStreetMap et sont confirmés par des photos.

- Déduction admissible : "Au 7 janvier 2022, OpenStreetMap recense 20 oratoires sur le territoire de la commune de Samoëns".

- Déduction inadmissible : "il existe 20 oratoires sur le territoire de la commune de Samoëns".

Licence ODbL[modifier | modifier le code]

Les données OpenStreetMap sont soumises à la licence ODbL et les conditions d'utilisation sont précisées sur une page dédiée.

En outre, une obligation de mention du même type que celle de Creative Commons s'applique.

Obligation de citation d'OpenStreetMap[modifier | modifier le code]

En conséquence, même s'il est techniquement réalisable d'identifier précisément la source à l'origine des données créées dans OpenStreetMap, une citation mentionnant OpenStreetMap reste tout de même en vigueur.

Proposition de mentions à insérer comme référence de source[modifier | modifier le code]

Identification de la donnée source au-delà d'OSM Type Référence générique Exemple Commentaire
non Référence générique de la source OpenStreetMap Les données cartographiques sont issues d'OpenStreetMap sous les termes de la licence ODbL.

Consulté le date de consultation.

Les données cartographiques sont issues d'OpenStreetMap sous les termes de la licence ODbL.

Consulté le 1er janvier 2023.

non Référence de la source OpenStreetMap avec lien vers les données sources La position/nom/autre attribut des objets/lieux du lieu sont issues d'OpenStreetMap sous les termes de la licence ODbL et de source.

Consulté le date de consultation.

Les positions et noms des chapelles, oratoires et croix de la commune de Samoëns sont issues d'OpenStreetMap sous les termes de la licence ODbL.

Consulté le 1er janvier 2023.

Pour chaque type de donnée, un URL direct permet de consulter les données via le service overpass-turbo
oui Citation détaillée des données sources ayant permis de créer les données OpenStreetMap La position/nom/autre attribut des objets/lieux du lieu sont issues d'OpenStreetMap sous les termes de la licence ODbL et de source.

Consulté le date de consultation.

Les positions et noms des chapelles, oratoires et croix de la commune de Samoëns sont issues d'OpenStreetMap sous les termes de la licence ODbL.

Le contour des bâtiments est issu du cadastre (Direction Générale des Finances Publiques, millésimes de 2010 à 2023).

Consulté le 1er janvier 2023.

Des précisions sont apportées pour chaque type de méta-donnée identifiée.

Propositions complémentaires[modifier | modifier le code]

Afin de faciliter l'ajout de références OpenStreetMap, il serait souhaitable de :

  • créer un formulaire simplifié apparaissant lors de l'ajout automatique d'une source, si le lien collé provient des domaines openstreetmap.org ou overpass-turbo.eu ;
  • internationaliser la documentation et les outils ;
  • à plus long terme, développer un outil ad-hoc permettant d'apprécier et de citer chaque objet OSM en remplacement d'overpass-turbo

PS : cette proposition fait suite à une discussion publique tenue sur le groupe telegram d'OpenStreetMap France[19] le 3 janvier 2023.

  1. voir par exemple patrimoine religieux de Samoëns
  2. voir Wikipédia:Ressources libres#Géographie
  3. https://diff.wikimedia.org/2018/06/28/interactive-maps-now-in-your-language
  4. voir par exemple Pays de Faverges#Culture et patrimoine
  5. « Overture Maps : carte du futur et la crise d’adolescence d’OpenStreetMap », sur DécryptaGéo, l'information géographique, (consulté le )
  6. a et b https://welcome.openstreetmap.org/about-osm-community/consumers/
  7. a et b https://wiki.openstreetmap.org/wiki/They_are_using_OpenStreetMap
  8. « adresse.data.gouv.fr », sur adresse.data.gouv.fr (consulté le )
  9. https://wiki.openstreetmap.org/wiki/Stats#Accumulated_registered_users_(linear_scale)
  10. https://wiki.openstreetmap.org/wiki/Stats#Accumulated_ways_and_relations
  11. a et b https://wiki.openstreetmap.org/wiki/FR:Bonnes_pratiques
  12. https://wiki.openstreetmap.org/wiki/FR:Bonnes_pratiques#Mappez_ce_qui_se_trouve_sur_le_terrain
  13. https://wiki.openstreetmap.org/wiki/FR:Vérifiabilité
  14. https://wiki.openstreetmap.org/wiki/FR:Bonnes_pratiques#Ne_cartographiez_pas_pour_le_rendu
  15. Jasmeet Kaur, Jaiteg Singh, Sukhjit Singh Sehra et Hardeep Singh Rai, « Systematic Literature Review of Data Quality Within OpenStreetMap », 2017 International Conference on Next Generation Computing and Information Systems (ICNGCIS),‎ , p. 177–182 (DOI 10.1109/ICNGCIS.2017.35, lire en ligne, consulté le )
  16. (en) Milad Moradi, Stéphane Roche et Mir Abolfazl Mostafavi, « Exploring five indicators for the quality of OpenStreetMap road networks: a case study of Québec, Canada1 », Geomatica,‎ (DOI 10.1139/geomat-2021-0012, lire en ligne, consulté le )
  17. (en) Sylwia Borkowska et Krzysztof Pokonieczny, « Analysis of OpenStreetMap Data Quality for Selected Counties in Poland in Terms of Sustainable Development », Sustainability, vol. 14, no 7,‎ , p. 3728 (ISSN 2071-1050, DOI 10.3390/su14073728, lire en ligne, consulté le )
  18. « Google Scholar », sur scholar.google.com (consulté le )
  19. https://t.me/osmfr