Entretien avec Simon Rogers, le Monsieur Data du Guardian

Simon Rogers édite le Data Blog du Guardian et a participé pour son journal à l'exploitation des fuites de Wikileaks. Interview par l'atelier des Médias d'un des principaux datajournalistes.

Il y a quelques jours, L’Atelier des Médias de RFI a profité du passage par Paris de Simon Rogers, “Monsieur data” au Guardian pour l’interroger sur son parcours et sur cette nouvelle tendance du journalisme : le data-journalisme ou journalisme de données. Simon Rogers édite le Data Blog du Guardian. Il a participé pour son journal à l’exploitation des fuites de Wikileaks sur l’Afghanistan et sur l’Irak. Malgré sa modestie et la simplicité avec laquelle il expose ses points de vue, c’est certainement une des principales personnalités et un des principaux moteurs du data-journalisme et de la visualisation de données dans le monde. Ci-dessous, une retranscription aussi fidèle que possible de cet entretien que vous pouvez également écouter en VO ou en VF dans les deux players sur le site de l’Atelier ou à télécharger (VF ou VO).

Ecoutez ici l’interview en VF:

Clip audio : Le lecteur Adobe Flash (version 9 ou plus) est nécessaire pour la lecture de ce clip audio. Téléchargez la dernière version ici. Vous devez aussi avoir JavaScript activé dans votre navigateur.

Atelier des Médias (ADM) : Pour commencer, est-ce que vous pouvez nous présenter votre blog et nous parler de votre parcours?

Ce que nous faisons c’est publier des ensembles de données brutes. On les met à disposition du monde et on demande à notre public de s’en servir, d’en faire quelque chose. Parallèlement, on dirige un service au sein du Guardian qui analyse et rend exploitable des données par nos journalistes, c’est ce qu’on appelle en fait du data-journalisme, du journalisme de données : transformer une masse de données en information, en histoire qu’on peut raconter à nos lecteurs. J’ai commencé à travailler au Guardian le 10 septembre 2001, c’était mon premier jour ! Le lendemain, j’ai vu le monde devenir complètement fou. Il se passait tellement de choses en même temps qu’on a eu besoin de produire des infographies pour les expliquer. Il y avait trop d’infos, de données, à gérer pour confier cela uniquement à des graphistes. Je me suis donc retrouvé à bosser sur des graphiques avec des designers pour expliquer l’information avec des visuels. C’est comme cela que j’ai commencé à collecter des masses de données.

Par la suite, en mars 2009, le Guardian a lancé sa plateforme ouverte (open platform) destinées aux développeurs et aux technophiles. Elle leur permet d’interroger les données du Guardian et de réaliser des applications à partir de ces données. Par exemple, on peut fabriquer une application qui permet, quand on est dehors, d’entrer notre adresse et l’application nous dit quels sont les restaurants alentours avec les critiques du Guardian. C’est cela l’idée de la plateforme ouverte. Au moment où le journal a proposé ce service d’accès à ses données, on a pensé que ce serait bien d’ouvrir parallèlement un data blog, un blog de données. On a publié quelques paquets de données pensant que cela intéresserait un petit nombre de développeurs. En fait cela a vite décollé, c’est devenu un blog qui reçoit deux fois plus de visites que le département officiel des statistiques du Royaume Uni. Beaucoup de gens visitent notre site parce qu’ils cherchent des informations brutes sur, par exemple, les émissions de carbone dans l’ensemble du pays ou quelles aides a reçu le Pakistan en provenance de quel pays après les inondations. En fait, tout peut être envisagé comme des données.

On a par exemple publié tous les mots utilisés par les Beatles dans leurs chansons. Combien de fois ont-ils employé le mot « love » (amour) ? 613 fois figurez-vous. Tout peut être transformé en données. Et ce qu’il y a de magique, c’est qu’une fois que vous avez transformé quelque chose en chiffres et en tableaux, les gens peuvent s’en servir pour faire des visualisations, des graphiques et des analyses.

ADM : Quand on vous écoute, on a l’impression que c’est presque par chance ou par hasard que vous avez développé le journalisme de données dans votre journal, alors que c’est un phénomène qu’on voit prendre de l’ampleur dans beaucoup de médias. Comment cela s’est passé concrètement ?

En fait quand on a mis en ligne le data blog en mars 2009, c’était une thématique encore très confidentielle. Après cela, le gouvernement américain a lancé data.gov, et puis cela s’est étendu au monde entier. Depuis un an, de plus en plus de gouvernements publient leurs données. Ils ont maintenant une vraie pression qui les incite à rendre leurs données publiques dans des formats exploitables par tous. Plutôt que d’utiliser du .pdf, qui est le format traditionnellement utilisé par les gouvernements, on leur demande des formats exploitables comme le .csv ou .xls. En résumé, on a eu de la chance et puis il faut avouer qu’il y avait une tendance quand même. Les gens veulent de l’information brute.

Mon grand-père veut savoir le prix du pétrole, où puis-je trouver cette information ? Et comment savoir si ce sont des données fiables ? Par exemple au Royaume Uni, le PIB est une donnée très importante, c’est publié tous les mois. Si vous allez voir sur le site des statistiques officielles, vous allez trouver 9 ou 10 manières différentes de calculer le PIB. Comment savoir quelle est la bonne méthode ? Ça c’est une question qu’on s’est déjà posée au Guardian à laquelle on a déjà trouvé des réponses parce qu’on en a besoin, donc on partage notre savoir faire.

ADM : Comment vous voyez la relation du journalisme de données avec le journalisme en général ? Est-ce que cela doit être une partie du journalisme ou est-ce que cela doit être un peu partout ?

De mon point de vue, chaque sujet comporte une dimension « données » en lui. D’un point de vue technique, ce n’est pas si compliqué, ce doit être un outil de plus pour les journalistes. On ne doit pas envisager cela comme un machin insurmontable et flippant. C’est juste une autre manière d’accéder à l’information. En réalité, la plupart des choses que l’on fait sont très simples. On utilise des logiciels que tout le monde possède. On a tous un tableur sur notre ordinateur, Excel, OpenOffice ou quoi que ce soit d’autre. C’est un outil aux capacités extraordinaires. Pas besoin d’être mathématicien ou statisticien. Tout ce qu’il faut faire c’est traiter cela comme toute autre information : il faut douter, interroger et se poser des questions de base.

Carte géolocalisée et chronologique des bombes artisanales en Afghanistan

ADM : Une autre partie du journalisme de données, c’est ce qu’on appelle la visualisation, la manière de montrer ces données. Quelle relation vous voyez entre les données et la visualisation ?

Ce qui est intéressant là dedans c’est que par le passé, on avait tendance à garder les données pour soi. Aujourd’hui, on les publie et par conséquent, notre rôle est d’aider les gens à les interpréter, à les analyser, à les montrer. Dans certains cas, un petit tableau suffit ou même la mise en avant d’un chiffre clé ou la comparaison entre un chiffre et un autre. Parfois ce simple travail est suffisant mais, dans d’autres cas, on veut vraiment montrer ces chiffres physiquement. Pour ce faire, le mariage de la visualisation et des données peut avoir un impact très fort. Par exemple, dans le cas des fuites de wikileaks, on a cartographié toutes les bombes artisanales en Afghanistan de manière chronologique. Grâce à  cette visualisation, on comprend comment leur usage s’est multiplié et pourquoi c’est devenu un paramètre essentiel de la guerre. Seule la visualisation permet de montrer cela.

Maintenant, est-ce qu’il faut être un graphiste pour faire des visualisations ? Il y a plusieurs approches. Il y a des personnes qui sont avant tout journalistes et qui réalisent des visualisations comme David McCandless et son « Information Is Beautiful ». Il a une formation de journaliste, il n’est pas graphiste mais il a produit de très belles visualisations qui expliquent bien les choses. En revanche, il arrive qu’on ait vraiment besoin d’un graphiste pour réaliser une visualisation complexe.
Il existe, par ailleurs, des outils très simples, accessibles en ligne, qui permettent de réaliser des visuels : Manyeyes, Timetric et même Google propose des outils de visualisation que chacun peut utiliser pour raconter une histoire.

ADM : Pour clore cet entretien Simon Rogers, je voudrais évoquer avec vous deux tendances assez fortes aujourd’hui. La première concerne l’Opendata, on parle aussi d’open governement, c’est un mouvement qui incite les institutions et les gouvernements à ouvrir et rendre publiques le plus de données possibles. Qu’est-ce que vous pensez de cela ? Quelles sont vos attentes ?

C’est une évolution très intéressante. Il y a encore un an, on militait pour accéder aux données et aujourd’hui on croule sous les données que nous recevons. Par exemple, au Royaume Uni, le Trésor avait une base de données importante appelée COINS qui répertorie tout ce qui est dépensé par le gouvernement, dans le moindre détail, il y a des millions d’informations. Le nouveau gouvernement a rendu ces données publiques, on avait beaucoup milité pour ça. Il y a un an, on voulait accéder à ces infos, aujourd’hui on les a et il s’agit maintenant d’aider les gens à s’en servir, à les analyser. Donc ce qu’on a fait avec la base de données COINS, on a choisi le meilleur format, le .csv. On a choisi la meilleure période et les départements les plus faciles à comprendre et on a rendu l’ensemble plus intelligible.

Pour moi, le rôle des journalistes va, de plus en plus, ressembler à ça. Rendre les données accessibles et compréhensibles. Au Guardian, on propose aussi un service qui s’appelle World Governments Data Search, recherche de données gouvernementales dans le monde. Si vous tapez World Government data dans Google, on sort en premier. En fait notre service répertorie toutes les publications de données gouvernementales dans le monde et vous permet par exemple de faire une recherche sur le mot crime, vous aurez alors des chiffres des USA, du Royaume Uni, de Chicago, de Californie, de France euh non d’Espagne pas de France, de Nouvelle-Zélande etc…et vous pouvez aussi comparer ces chiffres. L’enjeu maintenant c’est de trouver une bonne manière de combiner toutes ces données pour permettre aux gens de les utiliser. Parce que les gens veulent faire des choses avec ces chiffres, chez eux, à la maison et on veut les aider pour faire partie de ce mouvement.

Dépenses gouvernementales du Royaume Uni par département 2009-2010

ADM : Et comment vous pourriez convaincre des États de rendre leurs données publiques ou des populations à inciter leurs États à le faire ? Qu’est-ce que ça apporte à des sociétés ?

Ce qu’il faut comprendre c’est que les gouvernants n’ont rien à perdre. Aux USA, au Royaume Uni, en Australie ou en Nouvelle-Zélande, le monde ne s’est pas écroulé parce que les données gouvernementales ont été rendues publiques ! Cela a tout simplement rendu les choses plus ouvertes et plus transparentes à une époque où on ne fait plus confiance aux politiciens, on ne fait plus confiance à la politique. Vous voulez qu’on vous fasse confiance ? Il faut être ouvert. Rendre ses données publiques c’est essentiel pour cela, il faut le faire dans un format pratique pour encourager les gens à s’investir.

Quand Data.gov.uk a été mis en ligne, ils ont impliqués plein de développeurs pour permettre aux gens d’accéder à cette masse d’infos, pour moi c’est le rôle du gouvernement de faire ça. Il y a beaucoup d’exemples aujourd’hui que ceux qui militent pour l’ouverture des données peuvent utiliser pour montrer que les pays ne se sont pas effondrés à cause de l’open data. L’open data ne peut que renforcer la foi des peuples dans leurs gouvernants.

ADM: Pour finir, je voudrais parler avec vous de Wikileaks, ce site qui se sert de lanceurs d’alertes, de personnes qui divulguent des informations secrètes dans le monde et qui les diffuse. Vous avez été impliqués dans ce qu’on appelle les War logs en Afghanistan (et en Irak), qu’est ce que vous pensez de cela ?

C’est une nouvelle tendance du journalisme. Les journalistes vont devoir de plus en plus gérer des masses de données et trouver des infos et des histoires dedans. A l’avenir, un journaliste ne pourra plus dire « je ne m’occupe pas de tableurs… », cela fera vraiment partie de son boulot. Au Guardian, cela a vraiment changé notre manière de travailler. Aujourd’hui les données sont une partie intégrante de notre job. Maintenant, je pense que les infos de Wikileaks sont excellentes pour comprendre ce qui se passe. Si vous regardez les rapports divulgués sur l’Afghanistan, ils montrent à quel point cette guerre est difficile. Cela raconte notamment comment des gens tentent d’apporter de l’aide humanitaire dans un village et cela n’intéresse personne, parce que les villageois ont peur de la corruption etc…Il y a ce genre d’infos où on voit que les militaires se sentent responsables du bien être des populations locales. On finit en fait par se demander pourquoi l’armée ne publie pas ces rapports.

Il n’y a rien de sensationnel, ça ne change même pas la manière dont on perçoit cette guerre. Cela fait en tous cas de la guerre en Afghanistan une des plus documentées de l’histoire, grâce à ces fuites. Est-ce que cela a nuit aux États-Unis ? Pas vraiment je pense. Le gouvernement américain nous a aidé à retirer les noms cités dans les rapports pour ne pas mettre les personnes en danger.

ADM : Et sur le futur du secret, des choses secrètes, est-ce que cela pose une vraie question pour vous ?

Cela va être intéressant de voir comment les autorités gèrent cela. Il y a eu des menaces mais rien de très concret. Et puis il va y avoir bientôt de nouvelles lois de transparence et de protection du journalisme en Islande. Cela va devenir un abri pour les journalistes. Sur le même modèle que les paradis fiscaux, on aura des paradis journalistiques, des lieux protégés pour la liberté sur internet. Les gens iront là-bas pour publier des données sensibles.
En tous cas, Wikileaks a complètement changé le rapport que l’on a avec les documents que l’on produit, géographiquement notamment. Je pense en tous cas qu’à l’avenir ce type de fuites ne va faire que se multiplier.

>> Interview initialement publiée sur l’Atelier des Media de RFI.

>> Crédit photo : Jessica Chekroun (la photo n’est pas en Creative Commons)

Laisser un commentaire

Derniers articles publiés