Apprendre à cartographier, avec Yann Guégan

Comment rendre visible les lignes éditoriales internationales des médias, leurs zones d’intérêt géographique et donc, leurs visions respectives du monde ? C’est la question à laquelle a tenté de répondre le journaliste et formateur Yann Guégan, que j’ai rencontré lors de la première édition des Ateliers de Couthures, organisés en juillet dernier. Nous nous sommes livrés à un exercice de journalisme de données, duquel nous avons tiré des éléments de réponse, mais aussi des outils d’extraction de données et de cartographie.

En octobre 2015, le site d’information citoyen Altermondes postait une carte anamorphosée, c’est-à-dire une carte qui déforme la taille réelle des pays en fonction de données statistiques, pour rendre compte de son traitement de l’actualité internationale. Dans son labo, Yann Guégan a repris l’idée à son compte pour proposer une comparaison, toujours sous la forme d’anamorphoses, du traitement international de 22 médias francophones. Alors, les médias nous donnent-ils une vision déformée du monde qui nous entoure ?

  • Deux outils d’extraction de données, ou “datascraping”

Déjà en mai 2015, Yann Guégan proposait une carte qui permette de visualiser le traitement géopolitique des chroniques de Bernard Guetta, tous les matins à l’antenne de France Inter. Dans un article-tutoriel intitulé “Comment j’ai exploré plus de 500 chroniques de Bernard Guetta”, il explique comment il a “scrapé” le site de France Inter, c’est-à-dire comment il a extrait les données pour dénombrer les occurrences des pays dans plus de trois saisons de chroniques.

Pour ce faire, il a utilisé un logiciel payant Outwit Hub qui permet d’extraire des données de manière efficace et sans avoir à passer par un langage de programmation. Mais à ceux qui souhaitent découvrir cette opération de datajournalisme, Yann Guégan conseille le service gratuit import.io, qui “essaie au maximum de fonctionner tout seul”, même si “comme souvent avec les systèmes automatiques, ça ne marche pas très bien et il faut passer en mode manuel” pour améliorer les résultats.

Le scraping appelle quoiqu’il en soit à la vigilance de la part des journalistes, compte tenu des anomalies qui peuvent figurer dans les jeux de données. Lors de son expérience journalistique, Yann Guégan a ainsi dû prendre en compte plusieurs pièges :

  • les occurrences du Chili ou de la Grenade englobaient les citations des recettes de cuisine ou de l’engin explosif ;

  • les dénominations de la Birmanie n’incluaient pas l’appellation de Myanmar, imposée par la junte en 1989 et dont l’usage se fait plus courant ;

  • et il fallait pouvoir distinguer la République démocratique du Congo (dit Congo-Kinshasa) de la République du Congo (aussi appelé Congo-Brazzaville).

Pour autant, Yann Guégan insiste sur le fait que “chaque chantier de scraping est différent” et dépend notamment des sources desquels on souhaite extraire les données. Un site comme Airbnb est ainsi beaucoup plus facile à scraper que Google. Surtout, l’outil le plus approprié dépend de ce que l’on souhaite faire avec les données.

  • Trois outils pour apprendre à cartographier

 Suite à l’anamorphose réalisée par Altermondes, Yann Guégan a réitéré sa méthode de datascraping et repris ce type de datavisualisation pour comparer la façon dont une vingtaine de médias francophones voient le monde. Cette expérience de datajournalisme, publiée en janvier dernier, s’accompagne également d’un article de méthodologie dans lequel il détaille les outils qu’il a utilisés.

 Pour réaliser l’anamorphose des cartes, le journaliste a utilisé le logiciel ScapeToad, aussi utilisé par Altermondes, qui utilise des fichiers de contour dans lequel on insère la donnée pour laquelle on souhaite déformer la carte.

 Si le logiciel ne convient pas forcément à des néophytes du format vectoriel SVG, Yann Guégan admet volontiers avoir “cherché la difficulté” et considère que “la cartographie est de plus en plus simple” : il existe selon lui beaucoup d’outils pour créer des cartes, de plus en plus faciles à utiliser et à prendre en main.

 A ceux qui souhaiteraient découvrir cette forme de visualisation de données, il conseille notamment Carto (anciennement CartoDB), qui permet le géoréférencement, qui permet de placer des points sur une carte à partir d’un code postal, d’une rue ou d’une ville.

Le service de graphique Datawrapper a également ouvert ouvert un service de cartographie simple d’usage qui guide l’utilisateur pour savoir quelles informations il souhaite faire figurer et comment.

Yann Guégan pointe à ce propos la “fascination des journalistes pour les cartes” quand on leur demande quel format ils aimeraient essayer. Il faut cependant s’interroger sur l’apport d’une visualisation au sujet traité, en s’assurant par exemple qu’elle apporte des informations qui ne sont pas contenues dans le texte l’accompagnant pour ne pas “prendre une kalachnikov pour tuer une mouche”.

  • S’interroger sur la visualisation la plus adaptée

C’est donc pour des travaux plus originaux ou plus poussés qu’il y a intérêt à passer sur des solutions plus artisanales, qui ne sont toutefois pas exemptes d’imperfections.

RFI-map.png

Le monde selon RFI
Sur la carte de RFI, on voit rapidement que l’Afrique est disproportionnée dans le traitement de l’actualité de la chaîne. En revanche, difficile de savoir quels pays font l’objet d’une couverture plus régulière sur le continent, ou de voir que les Antilles sont également plus traitées.

Le travail de visualisation de Yann Guégan est ainsi le résultat de choix, à commencer par celui d’une carte choroplèthe et de la projection Mercator. Pour le journaliste, l’important était d’obtenir une infographie esthétique dans un souci d’accessibilité et de lisibilité. 

De même, l’anamorphose étire les pays avoisinants les pays déformés, ce qui rend difficile toute lecture approfondie de la carte sans retourner dans le jeu de données. D’où l’intérêt des graphiques complémentaires proposés par le journaliste pour essayer d’établir des corrélations.

Si Bernard Guetta ne parle pas plus des pays les plus peuplés ou les plus grands, mais aura plus tendance à aborder ceux qui ont un budget militaire plus important. Il incite d’ailleurs de “ne pas s’arrêter aux données elles-mêmes” et de prolonger ce travail, par exemple en allant voir des chercheurs, plus à même selon lui de confirmer ou d’infirmer les hypothèses formulées, et ainsi de prouver des causalités.

 

Retrouvez les dernières expériences de Yann Guégan sur GitHub, sur Twitter et bien sûr sur son site, Dans mon labo, où il a récemment publié un article de “factchecking” sur… les informations vérifiées.

M'envoyer un e-mail lorsque des personnes publient un commentaire –

Mathias Virilli - bébé journaliste, biberonné à l'Atelier des médias

Vous devez être membre de Atelier des médias pour ajouter des commentaires !

Join Atelier des médias

Récemment sur l'atelier

Mélissa Barra posted a blog post
Le site Espace d’espoir (« Fushat Amal » en arabe libanais), lancé par l’ONG Act for the Disappeare…
15 nov. 2016
Clara-Doïna Schmelck posted a blog post
Mardi, la rédaction d'iTélé a voté la grève pour un neuvième jour consécutif. Le conflit qui secoue…
26 oct. 2016
Solo Niaré posted a blog post
Il ne serait pas excessif de dire que sur le continent africain, les élections se suivent et, comme…
8 sept. 2016
Clara-Doïna Schmelck posted a blog post
Une nouvelle chaîne d’info en continu ? Oui, mais celle-ci est une « télévision » venue du web, com…
5 sept. 2016
Plus...