Journalisme de données

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche

Le journalisme de données (data journalism en anglais), ou journalisme de bases de données (database journalism), est un mouvement visant à renouveler le journalisme par l'exploitation de données statistiques et la mise à la disposition de celles-ci au public[1].

Il est également lié à la libre disponibilité des données : de plus en plus de données statistiques sont diffusées par les institutions et les gouvernements, et un journaliste d'investigation sachant les analyser peut mettre en lumière des faits importants comme cela a été le cas dans le scandale des notes de frais des parlementaires britanniques[2].

La question de la visualisation de données est également un aspect important de ce type de journalisme.

Définition[modifier | modifier le code]

Pour Adrian Holovaty (en), l'un des chefs de file du mouvement, le travail du journaliste traditionnel consiste essentiellement à collecter des données. Alors que ce dernier dissémine les données (les informations) qu'il a obtenues dans un texte rédigé, le journaliste de données les collecte sous forme structurée afin de pouvoir ensuite les réutiliser plus facilement à des fins de comparaison[3].

Simon Rogers, auparavant responsable du journalisme des données au Guardian, fait une différence entre le journalisme de données et l'infographie. Pour lui, l'infographie consiste uniquement à présenter des chiffres alors que le journalisme de données consiste à les présenter mais aussi à les analyser et les expliquer[4].

À l'inverse du journaliste classique qui protège ses sources, le journaliste de données donne accès aux données au plus grand nombre. Simon Rogers compare l'esprit du journalisme de données à l'esprit punk qui dans les années 1970 encourageait chacun à prendre un instrument et à en jouer[5].

Sylvain Parasie propose l'expression « journalisme hacker » (en anglais hacker journalism), censé rapprocher les passionnés d'informatique (hackers, litt. « pondeurs de code », « bidouilleurs ») et les journalistes (hacks, litt. « journaleux », « plumitifs ») pour faire évoluer le journalisme[3].

Histoire[modifier | modifier le code]

Le journalisme de données est aussi ancien que l'exploitation des données.

Dès 1821, on trouve dans le Manchester Guardian un tableau de données sur les écoles de Manchester et Salford contenant des informations sur le nombre d'élèves dans chaque école et les dépenses annuelles de chacune des écoles[6],[7],[8].

La carte du choléra à Londres en 1854, dressée par John Snow.

Pour le journaliste du Guardian, Simon Rogers, la carte du cholera proposée par John Snow en 1854 est un exemple de journalisme de données. La carte, qui montre la concentration de choléra autour des pompes à eau, a permis de comprendre l'origine de l'épidémie[9].

Diagramme des causes de mortalité au sein de l'armée en Orient par Florence Nightingale.

En 1858, Florence Nightingale publie des données sur la mortalité des soldats dans l'armée britannique. Pour le journaliste du Guardian Simon Rogers, cela constitue un des premiers exemples de journalisme de données[6].

Dans les années 1950 se développe le computer-assisted reporting (en) (le journalisme assisté par ordinateur). Par exemple, la chaîne de télévision américaine CBS collecte des données pour pouvoir prédire les résultats des élections américaines[8].

Dans les années 1970, Philip Meyer propose la notion de « journalisme de précision » qui vise à utiliser les méthodes des sciences sociales et comportementales dans le journalisme[8].

Le journaliste américain Bill Dedman (en) reçoit le prix Pulitzer en 1989 pour une étude statistique montrant que les noirs obtiennent moins de crédits bancaires que les blancs à Atlanta[10].

À partir des années 2000, le développement de l'informatique permet la démocratisation de l'accès aux bases de données et le développement d'un véritable « journalisme de données ». Plusieurs médias anglo-saxons ont investi ce domaine[3].

En septembre 2006, Adrian Holovaty publie un texte manifeste intitulé A fundamental way newspaper sites need to change, dans lequel il défend l'idée que les journalistes devraient publier des données sous forme structurée de manière qu'elles puissent faire l'objet d'une analyse statistique[8],[11].

À partir de mars 2009, le journaliste Simon Rogers anime pour The Guardian le « datablog » qui coordonne les travaux relevant du journalisme de données[12].

En août 2010, se tient la première conférence consacrée au journalisme de données à Amsterdam dans les locaux du European Journalism Centre (en). La conférence rassemble près de 60 journalistes venant du monde entier[8],[13].

En novembre 2011, lors du festival annuel Mozilla, plusieurs acteurs du système se réunissent sous l'égide du European Journalism Centre (en) et de la Open Knowledge Foundation pour rédiger un manuel de journalisme de données, publié en 2012 sous le titre Data Journalism Handbook[14],[15]. Ce manuel est traduit en français en 2013 par la société Journalism++(en) et diffusé en licence Creative Commons[16],[17].

En 2012, deux journalistes du Seattle Times, Michael J. Berens et Ken Armstrong, sont récompensés du prix Pulitzer du journalisme d’investigation pour un travail relevant du journalisme de données montrant qu'un grand nombre de décès dans l'État de Washington était lié à une surdose de méthadone, anti-douleur prescrit aux bénéficiaires de Medicaid pour des raisons d'économie[18].

En France[modifier | modifier le code]

En France, la pratique du journalisme de données se fait encore discrète.

En 2010, c'est le pure player indépendant OWNI qui popularise cette discipline. Premier partenaire français de Wikileaks, OWNI secoue alors le paysage médiatique en publiant les carnets de guerre de l'armée américaine en Irak[19],[20]. Inédit en France, ce type de collaboration permet au jeune média de présenter son savoir-faire tout en démontrant la puissance du journalisme de données. La même année, OWNI est récompensé aux ONA Awards dans la catégories “non-english small site”[21]. Hélas le modèle économique de ce média, gratuit et financé par une société de services[22], se tarit rapidement jusqu'à sa fermeture en décembre 2012[23].

OWNI fait pourtant des émules. En 2011, Pierre Romera et Nicolas Kayser-Bril, deux anciens d'OWNI[24], lancent Journalism++(en), une société de services spécialisée dans le journalisme de données[25]. Pendant presque 5 ans, cette petite société basée à Paris et Berlin propose à des médias européens des infographies interactives, des enquêtes et des outils[26]. C'est à elle que l'on doit notamment les Migrants Files, une enquête d’envergure internationale visant à évaluer le coût humain et financier des politiques anti-migratoires en Europe[27],[28]. Cette enquête est récompensée de plusieurs prix comme le GEN Data Journalism Award en 2014[29] et l’European Press Prize en 2015[30]. Aron Pilhofer, fondateur du service "Interactive News" au New York Times décrit par ailleurs Journalism++ comme une société "au cœur éthique fort" suivant "les plus hauts standards du journalisme"[31].

L'émission DataGueule, crée en 2014 par Julien Goetz (également un ancien d'OWNI[32]), est une émission de télévision et une Web-série hebdomadaire diffusée sur France 4 et sur YouTube et Dailymotion. Le principe de l'émission est de « déconstruire des mécanismes, avec de l'humour et si possible un prisme historique (...) des sujets où l'on se rend compte que ça ne tourne pas rond. Même s'il faut les décortiquer pour comprendre exactement ce qui ne tourne pas rond »[33].

D'autres médias nationaux tentent également de se mettre au journalisme de données. En 2014, le journal Le Monde lance la rubrique Les décodeurs, dédiée au fact-checking[34]. En 2015, le journal Libération lance la rubrique Six Plus dédiée au journalisme de données[35]. De taille raisonnable (moins d'une dizaine de personnes), ces deux équipes uniques en France reste très prolixes et tendent à populariser un journalisme de données plus pragmatique, au rythme du quotidien.

Distinctions[modifier | modifier le code]

Depuis 2012, le Global Editor Networks (en) organise les Data Journalism Awards[36] (oscars du journalisme de données).

Exemples[modifier | modifier le code]

Aux États-Unis, The Texas Tribune (en) met à la disposition de ses lecteurs une base de données contenant les salaires de 667 000 employés du secteur public. L'article contient un lien vers les données brutes mais aussi des visualisations avec un histogramme de la distribution des salaires et des tableaux montrant le salaire moyen, médian, maximum et minimum en fonction de la nature de l'emploi et de l'employeur[37],[38].

En France, pendant la campagne électorale pour l'élection présidentielle de 2012, la chaîne de télévision iTélé et le site web d'information OWNI ont mis en place un outil intitulé le « véritomètre » permettant de confronter les chiffres avancés par les différents candidats pendant la campagne avec la réalité[39].

Le Wall Street Journal a mis en place, à la disposition du public, une base de données sur les statistiques de la criminalité aux États-Unis entre 2000 et 2010[40],[41].

En 2017, le Consortium international des journalistes d'investigation et ses partenaires dévoilent les résultats d'un an d'enquête dans le cadre des Paradise Papers. À la pointe des techniques du journalisme de données, ces révélations se basent sur une immense fuite de plus de 13,5 millions[42] de documents confidentiels notamment issus du cabinet d'avocats Appleby, détaillant des informations sur des sociétés offshore. Parmi eux se trouvent des multinationales et de nombreuses personnalités de la vie publique[43],[44],[45].

Critiques[modifier | modifier le code]

Dans Le Monde diplomatique, Giulio Frigieri déplore que de nombreuses infographies privilégient l'aspect esthétique sur l'intelligibilité[46].

En 2014, plusieurs éditeurs de logiciels[47] commercialisent des robots rédigeant automatiquement des articles sur la base de grands volumes de données[48]. Dans les années à venir, ceci pourrait limiter le travail du journaliste de données à une activité de reformulation[49].

Bibliographie[modifier | modifier le code]

  • (en) Philip Meyer, Precision Journalism, Indiana University Press, (ISBN 978-0253201638)
  • (en) David Weaver et Maxwell McCombs, « Journalism and Social Science: A New Relationship? », Public Opinion Quarterly, vol. 44, no 4,‎ (DOI 10.1086/268618, lire en ligne)
  • (en) John Herbert, Journalism in the Digital Age : Theory and Practice for Broadcast, Print and On-Line Media, Focal Press, (ISBN 978-0240515892)
  • Alain Joannès, Data journalisme - Bases de données et visualisation de l'information, CFPJ Éditions, , 169 p. (ISBN 978-2353070374)
  • Sylvain Parasie et Éric Dagiral, « Portrait du journaliste en programmeur : L'émergence d'une figure du journaliste hacker », Les cahiers du journalisme, nos 22-23,‎ (lire en ligne)
  • (en) Simon Rogers, Facts are Sacred : The power of data, Guardian Books, , 92 p.
  • Sophian Fanen, « Le journalisme les doigts dans les données », Libération,‎ (lire en ligne)
  • (en) David McCandless, Information is Beautiful : The Information Atlas, Collins,
  • (en) Jonathan Gray, Lucy Chambers et Liliana Bounegru, Data Journalism Handbook, O'Reilly Media, (ISBN 978-1449330064, lire en ligne)
  • (en) Paul Bradshaw, Scraping for Journalists, Leanpub, (présentation en ligne)

Filmographie[modifier | modifier le code]

Notes et références[modifier | modifier le code]

  1. Nicolas Vanbremeersch, « Pour un journalisme de données », Slate.fr,‎ (lire en ligne)
  2. (en) Daily Telegraph.
  3. a, b et c Sylvain Parasie, « Le journalisme « hacker » : Une nouvelle utopie pour la presse ? », La Vie des idées,‎ (lire en ligne)
  4. Sophian Fanen, « WikiLeaks a changé la vision des rédactions : Entretien avec Simon Rogers », Libération,‎ (lire en ligne)
  5. (en) Simon Rogers, « Anyone can do it. Data journalism is the new punk », The Guardian,‎ (lire en ligne)
  6. a et b (en) Simon Rogers, « Data journalism at the Guardian: what is it and how do we do it? », The Guardian,‎ (lire en ligne).
  7. (en) Simon Rogers, « The first Guardian data journalism: May 5, 1821 », The Guardian,‎ (lire en ligne).
  8. a, b, c, d et e (en) Liliana Bounegru, « Data Journalism in Perspective », dans Data Journalism Handbook, (lire en ligne).
  9. (en) Simon Rogers, « John Snow's data journalism: the cholera map that changed the world », The Guardian,‎ (lire en ligne).
  10. Sophian Fanen, « Les Américains défricheurs du déchiffrage », Libération,‎ (lire en ligne).
  11. (en) Adrian Holovaty, « A fundamental way newspaper sites need to change », holovaty.com,‎ (lire en ligne).
  12. Pablo René-Worms, « Les coulisses du journalisme de données », Le Point,‎ (lire en ligne).
  13. (en) Nicolas Kayser-Bril, « Reasons to cheer from Amsterdam’s Data-Driven Journalism conference », journalism.co.uk,‎ (lire en ligne).
  14. (en) « Featured Guide: Data Journalism Handbook - A New Approach To Storytelling », Rising Voices,‎ (lire en ligne)
  15. (en) Federica Cocco, « Hacks and hackers gather to write the first Data Journalism Handbook », Data Driven Journalism,‎ (lire en ligne).
  16. « Guide du datajournalisme », sur www.eyrolles.com (consulté le 8 juillet 2018)
  17. « Guide du datajournalisme », sur jplusplus.github.io (consulté le 8 juillet 2018)
  18. « Le journalisme de données récompensé », Courrier international,‎ (lire en ligne).
  19. Le Point, magazine, « DOCUMENTS SECRETS - OWNI, la plate-forme française qui a aidé WikiLeaks », Le Point,‎ (lire en ligne)
  20. Antoine Mairé, « Comment les Français d’Owni ont aidé WikiLeaks à faire courir la fuite », Télérama,‎ (lire en ligne)
  21. « ONA Awards 2010: l’aventure américaine d’OWNI », sur owni.fr (consulté le 8 juillet 2018)
  22. Antoine Mairé, « Owni, un média venu d’ailleurs », Télérama,‎ (lire en ligne)
  23. « Fermeture du site Owni.fr », sur Le Monde.fr (consulté le 8 juillet 2018)
  24. « “Allô, c’est Julian Assange” », sur owni.fr (consulté le 8 juillet 2018)
  25. « Rencontre avec deux journalistes++ », Atelier des médias,‎ (lire en ligne)
  26. « Journalism++ – L’investigation par les données », sur mediatype.be (consulté le 8 juillet 2018)
  27. « Une carte recense les migrants et réfugiés morts sur les routes de l’Europe », sur Le Monde.fr (consulté le 8 juillet 2018)
  28. « La Tunisie en "bonne place" sur la carte des naufrages les plus meurtriers en Méditerranée », Al HuffPost Maghreb,‎ (lire en ligne)
  29. (en) Alison Langley, « European Union journalists cross borders for story collaboration », Columbia Journalism Review,‎ (lire en ligne)
  30. (en-US) « 2015 - European Press Prize », sur europeanpressprize.com, (consulté le 8 juillet 2018)
  31. Global Editors Network, « “Interesting startups that can solve the problems of a newsroom do exist.” », sur Medium, (consulté le 8 juillet 2018)
  32. « #DataGueule : les coulisses de l’émission », Nil Sanyas,‎ (lire en ligne)
  33. « #DataGueule : les coulisses de l’émission », Nil Sanyas,‎ (lire en ligne)
  34. « Pour les Décodeurs du journal Le Monde, "l'objectif c'est de trouver la source" », RTBF Info,‎ (lire en ligne)
  35. « Le data-journalisme, un journalisme d'investigation qui s'ignore (INTERVIEW) – french.xinhuanet.com », sur french.xinhuanet.com (consulté le 8 juillet 2018)
  36. « Data Journalism Awards » (consulté le 27 avril 2013)
  37. (en) « Government Employee Salaries », sur The Texas Tribune (consulté le 14 août 2012)
  38. (en) Simon Rogers, « Some Favorite Examples », dans Data Journalism Handbook, (lire en ligne)
  39. Nicolas Patte, « Le Véritomètre de la présidentielle », OWNI,‎ (lire en ligne)
  40. (en) « Murder in America », sur Wall Street Journal (consulté le 3 septembre 2012)
  41. « États-Unis : des chiffres et des meurtres », Les Inrockuptibles,‎ (lire en ligne)
  42. (en-US) Pierre Romera et Cécile S. Gallego, « How ICIJ deals with massive data leaks like the Panama Papers and Paradise Papers - ICIJ », ICIJ,‎ (lire en ligne)
  43. (de) « Das sind die Paradise Papers », Süddeutsche Zeitung,‎ (lire en ligne)
  44. (en-GB) Paradise Papers reporting team, « Tax haven secrets of ultra-rich exposed », BBC News,‎ (lire en ligne)
  45. (en) Mike McIntire, Sasha Chavkin et Martha M. Hamilton, « Commerce Secretary’s Offshore Ties to Putin ‘Cronies’ », The New York Times,‎ (lire en ligne)
  46. Giulio Frigieri (trad. Isabelle Boski), « L’infographie dans la production du savoir », Le Monde diplomatique,‎ (lire en ligne)
  47. tels que Melty, Narrative Science (en) et Automative Insights
  48. Après l'informatisation et la numérisation, la robotisation
  49. Chez « Associated Press », le robot repère et le journaliste analyse

Articles connexes[modifier | modifier le code]