OpenRefine

Un article de Wikipédia, l'encyclopédie libre.
OpenRefine
Description de l'image OpenRefine logo (2018-present).svg.
Description de l'image 06 match with wikidata screenshot slides.png.
Informations
Développé par Google, Metaweb (en) et Antonin Delpeuch (d)Voir et modifier les données sur Wikidata
Première version
Dernière version 3.5.0 ()[1]Voir et modifier les données sur Wikidata
Dépôt github.com/OpenRefine/OpenRefineVoir et modifier les données sur Wikidata
Assurance qualité Intégration continue et revue de codeVoir et modifier les données sur Wikidata
Écrit en JavaScript et JavaVoir et modifier les données sur Wikidata
Système d'exploitation Microsoft Windows, macOS et LinuxVoir et modifier les données sur Wikidata
Formats lus TSV, comma-separated values, XLSX, RDF/XML, Machine-Readable Cataloging, JavaScript Object Notation et Notation3Voir et modifier les données sur Wikidata
Langues Anglais, italien, langues chinoises, japonais et françaisVoir et modifier les données sur Wikidata
Type Outil de Wikidata (d)
Open source (en)Voir et modifier les données sur Wikidata
Licence Licence BSDVoir et modifier les données sur Wikidata
Documentation openrefine.org/documentation.htmlVoir et modifier les données sur Wikidata
Site web openrefine.orgVoir et modifier les données sur Wikidata

OpenRefine est un logiciel libre de nettoyage et de mise en forme de données. Il est similaire dans son apparence à un tableur mais fonctionne en fait comme une base de données.

Historique[modifier | modifier le code]

Ancien logo de Google Refine
Nouveau logo

Openrefine a pour origine le logiciel Freebase Gridworks qui fut développé à partir de 2009 par la société Metaweb (en) afin de faciliter la préparation des données à importer dans sa base de connaissances Freebase basée sur les principes du web sémantique et qui publiait ses données en licence ouverte.

Le , est annoncé la sortie de la version 1.0 de Freebase Gridworks[2].

Le , Google a racheté la société Metaweb[3].

Le , Google annonce la version 2.0 du projet qui a été renommé Google Refine[4].

En 2012, le développement n'est plus assuré par Google. Le nom est changé en OpenRefine.

En , Google News Initiative offre 100 000 USD pour permettre le développement d'OpenRefine, qui permit entre autres d'effectuer les versions 2.8 et 3.0[5].

Fin 2019, l'Initiative Chan Zuckerberg a attribué, dans le cadre de son programme « Essential Open Source Software for Science », à OpenRefine 200 000 USD pour permettre son développement en 2020[6].

Fonctionnalités[modifier | modifier le code]

  • nettoyage de données
  • manipulation de données, d'un format à un autre
  • moissonnage de données d'un site web
  • ajout de données depuis un service web
  • alignement avec une Wikibase (dont Wikidata)

Références[modifier | modifier le code]

  1. « OpenRefine v3.5.1 » (consulté le )
  2. (en) Unknown, « Freebase Gridworks 1.0 released! » [html], sur https://freebase-gridworks.blogspot.com, (consulté le ).
  3. (en) Jack Menzel, « Deeper understanding with Metaweb » [html], sur https://googleblog.blogspot.com, Google, (consulté le ).
  4. (en) David Huynh, « Announcing Google Refine 2.0, a power tool for data wranglers » [html], sur https://opensource.googleblog.com, Google, (consulté le ).
  5. (en) Unknown, « Update: Google News Initiative and technical road map » [html], sur https://openrefine.org/blog, (consulté le ).
  6. (en) Unknown, « OpenRefine funded by the Chan Zuckerberg Initiative as an Essential Open Source Software for Science » [html], sur https://openrefine.org/blog, (consulté le ).

Voir aussi[modifier | modifier le code]

Sur les autres projets Wikimedia :

Articles connexes[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

Liens externes[modifier | modifier le code]