OWNI http://owni.fr News, Augmented Tue, 17 Sep 2013 12:04:49 +0000 http://wordpress.org/?v=2.9.2 fr hourly 1 Les data en forme http://owni.fr/2012/05/07/les-data-en-forme-episode30/ http://owni.fr/2012/05/07/les-data-en-forme-episode30/#comments Mon, 07 May 2012 17:44:56 +0000 Paule d'Atha http://owni.fr/?p=109450 OWNI vous met l'eau à la bouche avec des projets en lice pour les Data Journalism Awards 2012. La crème de la crème des applications de data journalism produites à travers le monde et prochainement récompensées. Au total, 57 exercices qui décrivent une nouvelle manière de penser l'information. Et rendent toujours plus désirables les politiques publiques d'ouverture des données.]]>

Circonstance exceptionnelle pour un événement pas banal, c’est au festival international du journalisme de Perugia, en Italie, qu’a été dévoilée vendredi la liste des 57 nominés pour le “Prix du journalisme de données”, ou Data Journalism Awards. L’éminent jury de ce prix, présidé par Paul Steiger, fondateur de ProPublica, et dans lequel figurent notamment des précurseurs du “ddj” tels que Wolfgang Blau (Zeit Online) ou Aron Pilhofer (New York Times), aura la tâche rude de sélectionner six vainqueurs après la réception de plus de 300 projets issus des quatre coins du monde et d’annoncer le résultat le 31 mai au cours du News World Summit à Paris. Organisée par le Global Editors Network (soutenu par Google) et le Centre européen de journalisme (EJC), la compétition – ouverte à candidature depuis le 19 janvier – a fermé les vannes le 11 avril dernier. Elle couvre trois catégories qui contiennent chacune trois prix – dont le premier est attaché d’une récompense de 7 500 euros : le journalisme d’investigation soutenu par la donnée, la visualisation de données et la narration, les applications web et mobile autour de la donnée.

Accordant aux 57 nominés tout le crédit qu’ils méritent au titre de l’effort fourni pour faire avancer la science, l’équipe des Data en forme a choisi cette semaine de vous présenter ceux qui nous semblent répondre le mieux aux exigences du journalisme de données tel que nous le concevons, en encourageant naturellement le lecteur a parcourir lui-même le labyrinthe de projets pour son propre plaisir.

Savourons donc les neuf projets qui nous ont fait la meilleure impression.

Ich bin ein Berliner

Soulageant la curiosité des citoyens germanophones férus de politique, “The 149 members of the 17th Berlin Parliament” est une cartographie inventée par le Berliner Morgenpost qui permet de fureter au sein du Parlement fédéral berlinois et de rencontrer virtuellement ses 149 locataires actuels. Avec sa base de données hébergée dans un tableur en ligne Google (méthode très largement utilisée chez OWNI aussi), l’application permet de filtrer ce beau monde par parti, par circonscription, par commission, par origine, par profession ou par sexe. Le résultat final de cette idée simple est lisible et aisé à la manipulation. Une vraie réussite réalisée à huit mains, soit globalement le nombre idéal de collaborateurs pour imaginer ce type d’application.

Open flic

Estimant sans doute pouvoir eux-mêmes esquiver la formule “servir et protéger” flattant leur corps de métier au-delà de l’Atlantique, certains flics (5% quand même) de Milwaukee, dans le Wisconsin, ont été réprimandés par la justice pour violation de la loi : beaucoup pour conduite en état d’ivresse ou trafic de plaques d’immatriculation, d’autres pour agressions sexuelles ou encore agressions physiques, ce qui revient au même sauf quand c’est une officier de police qui colle une droite à son copain dans un bar. Toutes ces données étant publiques, le Milwaukee Journal Sentinel (plusieurs fois vainqueur du Pulitzer) a décidé de pondre cette petite application de métaflicage où les amateurs de séries policières retrouveront les ingrédients de leur passion : tronche de méchant (sur ce point, c’est caricatural), classement des délinquants par délit, documents d’enquête ayant permis leur radiation, leur suspension. Ou leur blanchiment. Parce que le Wisconsin est un état comme un autre.

Toujours en mode sirène deux-tons, on attire ici l’attention des amateurs du légendaire Sim City et de ses cartes colorimétriques en 3D sur le site (application ?) pondue par les élèves de l’atelier de journalisme d’investigation de l’université de Halifax, au Canada. Ici, c’est une donnée publique plus “participative” qui y est manipulée : les quelques 130 000 appels téléphoniques reçus chaque année par la police locale, tant pour des questions de régulation de trafic routier que pour les plus horribles crimes. Grâce à la constitution de cartes présentant, par zones, à la fois les délits et les temps de réponse des autorités, ainsi que de graphiques rendant compréhensibles les différentes charges incombant à la police selon les heures du jour et de la nuit, il est possible de se faire une meilleure idée du travail fourni par les serviteurs de l’ordre et de la sécurité de l’Etat. C’est évidemment le type d’application qui offre la meilleure idée du bien-fondé de l’ouverture des données et de la raison pour laquelle tant de citoyens militent aujourd’hui pour une transparence absolue des données publiques à travers le monde : cerner les questions, regrouper des réponses, améliorer le quotidien.

Garçon, l’addition

Offrir à chaque citoyen un moyen simple de réaliser une opération complexe est également une mission pour le journalisme de données. C’est celle, justement, parfaitement remplie par le projet finlandais “Verokuitti Tax Receipt” : mettez-vous cinq minutes dans la peau d’un Helsinkien ayant téléchargé le navigateur Google Chrome permettant la traduction du finnois vers le français à la volée, et inscrivez votre revenu mensuel en euros, puis cliquez sur “Tulosta verokuitti”. Ainsi, vous y verrez en un coup d’oeil que votre salaire médian franchouillard de 1 653 euros vous rendrait contribuable à hauteur de 3 200 euros par an au pays du Père Noël ; que votre participation au bon déroulé de l’existence quotidienne du chef de l’Etat se monterait à 1,28 euro, et que celle de la construction du métro de l’ouest à 2,31 euros. Loin de vos efforts pour payer les intérêts de la dette, qui vous coûterait plus de 140 euros. Bref, une vraie mine d’or et un gage de transparence démocratique assumée comme on devrait en voir de plus en plus souvent dans nos contrées. Et ça fait du bien, rien que d’y penser.

Chronique de Sibérie

Intuitivement, l’application “Accidents avec les piétons à Novossibirsk en 2011” (traduction Google Chrome, suivez l’idée) n’est pas folichonne, mais elle part du même esprit de la mise en forme des données publiques pour rendre service à la communauté. Là encore basé sur un fichier partagé, la carte permet à tous de se figurer chaque accident ayant eu lieu dans la plus grosse ville de Sibérie au cours de l’année écoulée. L’application rend compte du lieu exact de l’accident, des parties impliquées (conducteur et piéton) et des dommages pour les personnes, et permet un filtre sur le mois (réglette supérieure) et le type d’incident.

Connais-toi toi-même

Prévoir ce que nous serons : c’est un peu ce que propose l’application “Visualizing Our Future Selves” face au vieillissement inexorable de la population. Grâce au travail de News21 dans les domaines de la démographie, de la santé et de l’économie, il vous est possible d’anticiper l’avenir et de vous y situer par rapport aux autres au regard de plusieurs critères (âge, sexe, race – dans le sens sociologique utilisé aux Etats-Unis -, finances). Là encore, nous sommes en présence de la mise en musique de données globalement trouvables mais complexes à appréhender. Et lorsqu’une touche d’interactivité est proposée, cela ajoute évidemment de l’intérêt au tout.

Tu connaîtras l’univers

Outrages, agressions, violences. Le lot quotidien des journalistes qui veulent exercer leur métier en Afghanistan. Pour lutter à sa manière contre ce fléau qui sévit particulièrement depuis 10 ans, l’équipe de Nai MediaWatch a dressé une cartographie drastique de ces 266 incidents qui ont causé la mort de 22 personnes à ce jour. A noter, toutes les données présentes sur le site sont téléchargeables et réutilisables à l’infini.

Et les Dieux

Véritable coup de coeur de la semaine, c’est la magnifique application “2011 Brazil State-Level Business Environment Ranking” (Flash), qui fait guise de tableau de bord statistique d’une merveilleuse exhaustivité et d’une exemplaire clarté de la situation au Brésil. Fondé sur 32 pages de méthodologie (en portugais, on vous laisse le bonheur d’en prendre connaissance), ce remarquable travail de synthèse n’a aucun défaut et devrait être rapidement copié dans les rédactions du monde entier : il est en effet compliqué de rendre compte de manière aussi limpide de l’état d’un pays à un instant donné.

Faciès

Closant cette sélection de projets pour un journalisme de données de qualité, “Known to police” est une vidéo réalisée par le Toronto Star pour dénoncer les pratiques de fichage systématique des citoyens à des fins de constitution de bases de données policières, officiellement pour améliorer l’avancée des enquêtes criminelles. Mais en recoupant ces informations, il apparait que certains citoyens contrôlés dans la rue le sont plus souvent que d’autres. Fortuitement ?

On retrouvera sans doute une partie de ces projets à Paris fin mai pour la remise des prix. Articulée autour de l’accroissement sensible de la libération des données (Open Data) à travers le monde au cours des douze derniers mois, l’idée même du journalisme de données continue de faire son chemin à travers ce type de récompense. Carotte gourmande sans bâton visible à ce jour, le “ddj” – dont on ignore encore aujourd’hui s’il constitue un moteur économique à l’évolution des médias ou bien s’il n’est qu’un jouet coûteux dans la chaîne de transformation des métiers liés au journalisme, le “data” journalisme tient donc là son événement fédérateur. Déjà mondial, le sujet a, au moins, le mérite de rassembler force motivation au sein des plus inventives communautés.

Nonobstant les incertitudes et les questionnements liés à l’avenir des médias, on se rejouira donc de profiter du vent frais et citoyen brassé par cette discipline du journalisme de données, comme une herméneutique d’un monde nouveau. En attendant la gloire, les prix et la richesse éternelle, c’est toujours ça de gagné.


Retrouvez tous les épisodes des Data en forme !

]]>
http://owni.fr/2012/05/07/les-data-en-forme-episode30/feed/ 3
Le Véritomètre de la présidentielle http://owni.fr/2012/02/16/veritometre-factchecking-presidentielle/ http://owni.fr/2012/02/16/veritometre-factchecking-presidentielle/#comments Thu, 16 Feb 2012 09:58:02 +0000 Nicolas Patte http://owni.fr/?p=98726 Le Véritomètre
Découvrez “Le Véritomètre“.

Le citoyen, qui est un être sensible, éduqué, un peu idéaliste et pas cynique pour un sou, connaît deux moyens sûrs pour arrêter son choix au moment d’élire celui ou celle qui le représentera au plus haut niveau de l’État.

Le premier, sans doute le plus sensé, est de déchiffrer avec attention le programme politique diffusé par l’ensemble des candidats à l’élection présidentielle (soit une petite vingtaine aujourd’hui), et de confronter ces lectures avec son bon sens, son entendement, ses convictions et sa vision de la chose publique. Le deuxième moyen, moins subjectif – mais toutefois fort compatible avec le premier, c’est donc celui qui aura notre préférence – consiste à écouter chaque candidat(e) durant la campagne pour vérifier scrupuleusement la fiabilité des propos tenus lors de ses allocutions.

Confiance

La question de la confiance, pour le citoyen sensible, éduqué, etc., est évidemment cruciale dans son rapport au politique : on élit à la fonction suprême une personnalité qui ne ment ni ne triche car elle détient durant cinq ans la créance morale de plusieurs dizaines de millions de bonnes âmes résolues, à travers la fonction présidentielle, à réformer l’État, travailler honnêtement, vivre décemment, moraliser le capitalisme. Et toutes ces sortes de choses.

Évaluer la crédibilité des principaux candidats à l’élection présidentielle française est donc le pari de l’application web “Le Véritomètre 2012″. Imaginée, construite, peaufinée pour i>TÉLÉ par tous les métiers présents chez OWNI, avec : une chef de projet (Anne-Lise Bouyer), des développeurs (James Lafa, Tom Wersinger), des graphistes (Marion Boucharlat et Loguy) associés à des journalistes de données (Marie Coussin, Grégoire Normand, Pierre Leibovici, Sylvain Lapoix, Nicolas Patte, votre serviteur) et à un meneur de jeu (Guillaume Dasquié). Onze joueurs focalisés sur l’objectif humble et ambitieux de faire rentrer la balle dans le but et de faire hurler la foule.

Au scalpel

Le “Véritomètre” est impitoyable et absolument impartial. Les grands rendez-vous médiatiques de François Bayrou, François Hollande, Eva Joly, Marine Le Pen, Jean-Luc Mélenchon et Nicolas Sarkozy y ont été et y seront scrutés mot à mot, analysés au scalpel dans un grand exercice de vérification des faits (“fact checking“), en confrontant en permanence leurs verbes à la réalité des chiffres officiels. Chaque intervention a été et sera découpée quotidiennement en multiples citations qui, toutes, font l’objet d’un examen personnel et finalement d’une sanction : “correct”, “incorrect” ou “imprécis”. Avec neutralité.

Ainsi, c’est la somme de ces citations qui donne un indice final de crédibilité à chaque discours, entretien ou débat majeurs de la campagne. Et c’est l’ensemble de ces interventions qui attribuent un indice global moyen aux six candidats à l’élection présidentielle, encastrés pour cette occasion sur un classement qui déterminera précisément celui ou celle en qui tient la “ligne de crédit” – corde de la confiance à l’instant donné.

Et ce n’est pas tout. En sus de ce classement de crédibilité et du “fact checking” de l’ensemble des interventions des six principaux candidats à l’élection, nous avons décidé de rassembler au sein du “Véritomètre” les données majeures de la campagne réparties sur les grands thèmes qui la baliseront. Aujourd’hui, c’est plus de 130 graphiques contextualisés et sourcés répartis au sein de ces thématiques (économie et fiscalité, éducation, immigration, santé, sécurité) qui sont disponibles. Au gré des vérifications et du vent de la campagne, cette masse augmentera afin de constituer une véritable base de données de tableaux de bord de la vie politique du pays.

Le “Véritomètre” est un site web – qui fonctionne également sur les tablettes et les smartphones – mais c’est aussi un rendez-vous quotidien à l’antenne d’i>TÉLÉ tout au long de la campagne. Un partenariat vertueux entre la principale chaîne d’actualité continue et un média innovant amoureux du journalisme de données. Et deux acteurs portés par l’objectif de faire de cette élection politique, marquée par une crise internationale sans précédent et une volonté mondiale de renouvellement démocratique, un terrain de rencontre et un lieu d’éducation entre ces citoyens partagés entre l’envie d’avoir confiance et l’envie d’espérer un monde meilleur.

Et pas cynique pour un sou.

“La vraie politesse n’est que la confiance et l’espérance dans les hommes.” (H.D. Thoreau)


Illustrations et couverture par LOGUY pour OWNI /-)
Suivez le “Véritomètre” sur Twitter (et profitez-en pour nous laisser vos remarques) !

]]>
http://owni.fr/2012/02/16/veritometre-factchecking-presidentielle/feed/ 98
Le Data-journalism notre religion http://owni.fr/2011/08/30/le-datajournalisme-notre-religion/ http://owni.fr/2011/08/30/le-datajournalisme-notre-religion/#comments Tue, 30 Aug 2011 09:56:39 +0000 Pirhoo http://owni.fr/?p=77431 À l’opposé des intentions de la presse d’opinion, celle qui dicte une manière de penser le monde, une nouvelle presse émerge, désireuse de transmettre toutes les données susceptibles de lire le monde différemment, de nourrir toutes les pensées critiques, sans tenter d’en imposer une. Pour cette presse-là, le journalisme de données (ou Data Journalism à l’anglo-saxonne) s’apparente à une nouvelle profession de foi. Pirhoo est l’un de ces apôtres.
Voici sa parole
.

Ce texte représente un retour d’expérience sur les caractéristiques très précises du Data Journalism, ou journalisme de données. Pour commencer, la première partie de cet article s’adresse aux développeurs – mais ne partez pas, je serai doux. Vous vous en doutez peut-être déjà, il ne suffit pas de savoir coder pour faire du Data Journalism dans de bonnes conditions. Outre des techniques, certes singulières et indispensables, en visualisation de données et data-mining, le développeur qui veut se frotter aux journalistes doit avant tout recueillir des qualités humaines auxquelles son métier ne l’a pas préparé.

1. Tous les sujets sont différents, soyez curieux !

On le sait, par nature, développer nécessite d’être curieux : il faut en permanence recycler ses techniques et ses connaissances. De sujet en sujet, les journalistes ont eux aussi, à leur manière, une telle “contrainte”. De fait, il va falloir trouver une sorte d’équilibre lorsque vous allez vous intéresser à l’objet de vos applications. Il y a des objectifs capitaux lorsque on travaille sur un tel projet : rendre claire une donnée obscure, soutenir un angle car une application ne se suffit pas à elle-même et enfin, raconter une histoire avec tout ce qu’on a rassemblé.

Pour atteindre ces objectifs, ne faites pas de détour : il faut jouer le jeu à fond, ne pas faire semblant, se plonger corps et âme dans votre sujet. Si votre discours s’adapte à celui des journalistes, par continuité il s’adaptera avec celui des utilisateurs. Le meilleur moyen de parvenir à une telle adaptation et de comprendre tous les enjeux d’un sujet et offrir les réponses aux questions que vous vous êtes d’abord posées. Mettre en ordre les choses pour que le lecteur comprenne, c’est déjà en grande partie le rôle des journalistes. Soyez complémentaires. Ce n’est pas parce qu’un designer va faire un beau dessin et que vous allez faire clignoter des panneaux que le problème sera plus clair. L’utilisateur n’en sait jamais assez, si vous n’êtes pas assez didactique, votre application ne sera qu’une source d’interrogations supplémentaires.

2. Ne faites pas qu’exécuter, proposez

Oui, c’est vrai, ils adorent s’écouter parler. Mais les journalistes sont aussi des animaux très attentifs, qui savent poser les bonnes questions et construire du neuf avec vos réponses. Et comme le spécialiste de la data, c’est vous, vous allez avoir des choses à raconter. Non seulement lorsque vous aurez une idée, avant même d’en parler, vous saurez déjà s’il est possible de la réaliser, mais en plus, votre motivation n’en sera que plus grande. Les designers et les journalistes ne s’en rendront jamais compte, vous avez été mieux formés qu’eux pour répondre aux besoins de l’utilisateur.

Quand les journalistes racontent une histoire, les designers l’illustrent et l’animent. Vous avez toutes les qualités nécessaires pour faire en sorte que vos applications reprennent au mieux cette histoire. Les uns pensent narrations, vous pensez utilisation. L’enjeu de ces travaux est souvent de vulgariser un sujet (ou des données) par nature complexe(s). Vous avez toute la légitimité nécessaire pour vous imposer (souvenez vous UML, Merise, etc, tout ça c’est pas rien).

3. Préparez-vous à apprendre

Lorsque vous faites du Data Journalism, la dynamique des projets est telle que vous allez côtoyer un nombre exponentiel de technologies différentes. Il n’y a pas 1000 façons de positionner des points sur une carte, il y a cependant une quantité infinie de raconter quelque chose avec ces données. Diversifiez vos compétences et vos applications seront de plus en plus abouties et riches. Ne vous contentez pas (par exemple) de Highcharts pour faire des jolis graphiques. Cette librairie est magique mais vous limiter à seulement quelques outils dans vos manches, ce serait comme contraindre un peintre à n’utiliser que du noir et blanc. Il aura le temps de se lasser avant de lasser son public.

4. Sortez des clichés

J’ai très souvent été confronté à une situation assez clichée : journalistes et développeurs dans des pièces séparées, ces derniers étant vus comme des êtres d’un autre monde. Comment diable leur association pourrait-elle fonctionner ? Le développeur n’est pas un prestataire de service. Pour faire bonne recette, il faut créer les conditions favorables à une collaboration horizontale, briser les murs, se mélanger. C’est d’ailleurs pour cette raison qu’il est nécessaire que tous les membres d’un projet de Data Journalism signent leur travail. Ce n’est pas juste pour que Maman voie votre nom dans les crédits, c’est avant tout pour rétablir un certain niveau d’égalité, même illusoire (les développeurs sont bien meilleurs of course).

À partir de maintenant, développer dans son coin sans jamais communiquer autrement que par email, c’est fini. Ne sortir que pour manger des pizzas dans une soirée Counter Strike, c’est fini. Il faudra probablement vous reproduire avec des journalistes, aussi. Adoptez leur comportement, ils adopteront le vôtre. Ce métier hybride c’est prendre ce qu’il y a de meilleur chez les uns pour le marier avec le meilleur des autres. Ce joyeux bordel doit mettre à sa manière un peu d’ordre dans le chaos.

Après avoir assommé mes congénères à grands coups de recommandations : développeurs, avant de savoir faire, sachez être ! Entre deux insultes ce sont aussi les journalistes que j’accable… J’ai en effet plus coutume d’enseigner à des journalistes qu’à des développeurs. Dès à présent, c’est donc à eux que je m’adresse.

5. Détendez-vous, tout va bien

Journalistes réactionnaires, éditorialistes venu d’un autre âge, je les vois venir. Trop sûrs d’eux pour oser remettre en question leur profession, ils sont trop nombreux à s’offusquer devant un view source. Heureusement le débat n’est plus à mener : ça ne fait plus aucun doute, les métiers de l’information n’ont qu’un avenir incertain sur le papier, il leur faut se diversifier, conquérir de nouveaux supports et en exploiter tous les potentiels. Encore aujourd’hui j’entends dire “ce n’est pas mon métier” quand je suggère à un journaliste d’apprendre la programmation. Je comprends que l’idée puisse surprendre. Mais plutôt que d’énumérer ce qui va changer, pourquoi ne pas regarder ce qui finalement ne change pas ? Vous savez mieux que moi qu’outre informer, vous devez aussi raconter. L’information dans toutes les histoires se met en scène, c’est ce que vous savez faire le mieux. C’est ce qu’on a toujours attendu des journalistes. Avec le Data Journalism et toutes les mutations liées au Web, nous n’essayons pas de vous en demander plus, juste de le faire un peu différemment.

Le support change, oui. Les techniques s’élargissent, aussi. Jamais pourtant on ne doit vous demander d’exécuter un travail de Web Agency. Toutes ces choses que vous allez apprendre (ou avez déjà apprises), c’est uniquement pour servir l’angle, la transparence et la poésie de vos articles. Ce ne sont que des outils supplémentaires pour rendre interactif un objet autrefois inerte. Une autre façon en somme de raconter une histoire.

6. Vous serez toujours moins fort que moi

Qu’il n’y ait pas d’ambiguïté entre nous, le développeur ici, c’est moi. Vous allez maîtriser de plus en plus les technologies qui définissent mon métier, toutefois, ça ne doit pas signifier que les rôles vont s’inverser. L’idée c’est que vous soyez autonome sur des pratiques de data-mining et de gestion de projet. Personne ne veut faire de vous une créature supersonique qui collectionne les casquettes. Si nous devions quantifier la somme minimale de connaissances à assimiler, je serais tenté de dire “juste assez pour que journalistes, développeurs et designers puissent se comprendre”. La grande innovation, au fond, c’est cette équipe à trois têtes. Tous ces bons conseils un peu moralisateurs n’ont lieu d’être que si l’alchimie fonctionne entre nos disciplines.

Comme je le disais précédemment, la première partie de ce guide s’adresse aux développeurs. Si vous la lisez, vous vous rendrez compte que je ne parle pratiquement que de créer les conditions favorables à un bon travail d’équipe. J’insiste lourdement car c’est finalement ce que j’ai de meilleur à vous enseigner. Il y a bien sûr quelques outils indispensables. Le plus redoutable d’entre tous n’est cependant pas logiciel, il est humain. Soignez vos relations avec les développeurs, votre passion pour rédiger des articles, ils la partagent à leur manière dans le code et la plupart des raisons qui vous poussent à aimer l’écriture peuvent s’appliquer à la programmation.

Lorsque j’étais encore étudiant en informatique, les maths occupaient une place centrale. Une place telle qu’aujourd’hui encore, certains de mes collègues ne savent pas concevoir un algorithme sans se passer d’une équation. Je me suis toujours tenu à l’écart de ce prédicat et le Data Journalism en est l’image quasi inverse. L’informatique repose sur des calculs fondamentaux (“computer” en anglais signifie littéralement “calculateur”) toutefois je conçois plus la programmation comme une forme de littérature. Nous avons des figures de style, chaque programmeur a une empreinte qui lui est propre, nous avons une syntaxe à respecter et lorsque nous énonçons un problème ou sa solution par l’algorithmique, nous sommes confrontés à des problématiques proches de celles de la narration. Laissez-vous convaincre que nos métiers ne sont pas si différents.

7. Donnez-vous les moyens d’évoluer

Jean-Marc Manach, qui est un collègue et ami, m’a toujours beaucoup intrigué. Il me semble important de le citer dans cet article car j’ai eu la chance collaborer de nombreuses fois avec lui et c’est un symbole fort du Data Journalism. Dire que Jean-Marc est un journaliste équivaut à dire que Rocco Siffredi est un acteur : ce n’est qu’une part infime de la vérité… C’est un électron libre, un élément perturbateur qui va pousser sa discipline dans ses retranchements pour lui permettre d’évoluer. Lorsqu’un site gouvernemental dissimule brusquement des photos qui étaient publiques auparavant, Jean-Marc va fouiller dans le code HTML dudit site pour y trouver des pistes, tester des combinaisons dans l’URL et utiliser un tableur Excel pour web scrapper l’objet de son enquête. Il ne fait usage d’aucune technique compliquée, pas besoin d’avoir un diplôme en ingénierie informatique, c’est purement et simplement une démonstration de hacking. Jean-Marc est un journaliste-hackeur, il bricole, cherche en tâtonnant et ses résultats sont parfois surprenants.

Cet exemple nous dit quelque chose de très important : le journalisme de données est une discipline pour gens curieux. C’est ça, l’essence même du Data Journalism. Cette condition est indispensable à la pratique sur le terrain. C’est en allant fouiller les recoins d’Internet que vous allez le plus apprendre car c’est ainsi que vous allez vous heurter aux problématiques du métier comme le discernement des données et toute la complexité parfois pour les récupérer. On peut dire que c’est un métier de bricoleur, de Data Nerd. C’est probablement l’une de ces caractéristiques les plus importantes, la négliger serait une erreur.

~

Il ne vous reste plus qu’à vous mettre au travail. Trouvez des développeurs, trouvez des designers, trouvez des sujets, même complexes. Si vous parvenez à créer une application qui raconte une histoire et vient soutenir l’angle de votre article, alors vous pourrez vous vanter d’avoir fait du Data Journalism en bonne et due forme.

Ressources

  • Envie de s’attaquer directement à la pratique et au code ? Je vous recommande l’excellent Site Du Zéro qui depuis 10 ans est une source abyssale de bons tutoriels. Comme son nom l’indique, aucun pré-requis n’est nécessaire (HTML et PHP sont de bon choix pour débuter ;).
  • Trouver des jeux de données ? Rien de plus facile, le Web regorge de ressources telles que DataPublica (repository), Buzzdata (réseau social de la data) et certains tags sur Delicious sont de vraies mines d’or (comme ddj, API ou data). N’oubliez pas non plus que si les gouvernements attendent parfois certaines initiatives pour mettre leurs données en ligne, certaines sont publiques, il suffit simplement de les leur demander gentiment.


Article publié initialement sur l’Oeil du Pirate en deux parties sous le titre Data-journalism : par où commencer ? (1) et Partie (2)

Illustration Flickr CC Paternité blprnt_van

]]>
http://owni.fr/2011/08/30/le-datajournalisme-notre-religion/feed/ 9
Guerre et cuisine http://owni.fr/2011/05/11/guerre-et-cuisine/ http://owni.fr/2011/05/11/guerre-et-cuisine/#comments Wed, 11 May 2011 10:15:16 +0000 Nicolas Kayser-Bril http://owni.fr/?p=62145 Le bilan des violents combats se sont achevés tard dans la nuit, faisant plus de 100 morts d’après les estimations de la Croix-Rouge. Les troupes loyalistes auraient fait de nombreuses victimes, selon les rebelles en déroute. Le chef rebelle avance le chiffre de 250 blessés, ce que nie formellement le gouvernement.

Cette dépêche semble familière. Mieux, elle marche dans toutes les situations. Essayez vous-mêmes et relisez-la avec , , ou .

Alors que l’on tend à juger les conflits au nombre de leurs victimes, le cérémonial dépassionné qui entoure leur comptage rend caduque tout sens des proportions. Pour redonner du sens à ces chiffres, le projet 100 Years of World Cuisine, dont je fais parti, a voulu les recontextualiser en offrant une échelle. Comme nous l’indiquons sur la page de présentation, « ce projet ne cherche pas à remplacer une démarche scientifique, mais à apporter un autre regard, porteur de sens ».

La cuisine reste reste l’endroit où l’on s’attend le moins à voir la violence émerger, au cœur de nos foyers. En plaçant la scène dans cette pièce, la photo renforce l’absurdité de la guerre.

Cliquer sur l'image pour la voir en plus grand

Cette démarche rejoint la visualisation des morts de la guerre en Irak proposée la semaine dernière sur OWNI.

Une échelle des guerres

Tout au long du projet, la question de la justification des conflits choisis nous a été posée. Pourquoi telle guerre et pas telle autre ?

Loin d’offrir des réponses, le projet vise seulement à s’interroger sur l’importance relative accordée aux différents conflits. La comparaison entre le conflit israélo-palestinien et les guerres du Congo est particulièrement frappante. Le premier a fait un peu plus de 50.000 morts et régulièrement la « une » des journaux. Le second a fait plus de 3 millions de victimes entre la fin des années 1990 et le début des années 2000, mais reste peu couvert.

Un journaliste affirme dans le documentaire Décryptage qu’il y a autant de journalistes à Jérusalem que dans tout le continent africain. Sans être forcément vraie, cette comparaison montre que personne ne hiérarchise les conflits selon le nombre de morts, ou même selon le nombre de morts-kilomètre (une théorie qui affirme que les médias couvrent plus les évènements proches de leur lectorat).

Le traitement des conflits semble être fait de manière arbitraire, laissant toute latitude aux éditeurs et aux utilisateurs pour décider de l’importance à accorder à chaque évènement.

Compter les victimes

Les choix réalisés pour la photo mettent également en évidence la difficulté de compter les victimes et de définir les contours d’un conflit. La guerre du Vietnam a-t-elle durée de 1965 à 1975, comme le considère les Américains, ou de 1946 à 1975, comme le considèrent peut-être certains Vietnamiens ayant subi la guerre avec les Français avant celle des Américains ? Ou bien a-t-elle commencée avec l’occupation japonaise en 1940 ?

Impossible de dater objectivement le début et la fin d’une guerre. L’armistice laisse souvent la place aux pillages et aux échanges de population, comme le montre le très meurtrier exode des populations germanophones installées à l’est de l’Oder. Entre 1944 et 1946, plus de 500 000 Allemands sont morts en fuyant vers l’Ouest, alors que la paix était revenue.

Compter les victimes est également impossible. La guerre empêche souvent d’établir des certificats de décès et les disparus peuvent également avoir fui sans laisser de trace. Les historiens sont obligés de recourir à des estimations plus ou moins précises pour établir un nombre de morts.

Bruce Sharp explique par exemple dans un article comment ont été comptées les victimes du génocide Khmer. Les premiers résultats, menés par le gouvernement suivant le régime de Pol Pot, a interrogé tous les foyers cambodgiens pour arriver à un total de 3 314 768 victimes. Certains historiens ont comparé les recensements pré-génocide avec ceux post-génocide et, compte-tenu de l’accroissement naturel au début de la période, sont capable d’estimer le nombre de personnes ‘manquantes’ en fin de période à 1,7 million. D’autres ont interviewé des survivants, demandant à chaque fois combien de personnes de leur entourage avaient disparu. En faisant la moyenne et en extrapolant à l’échelle du pays, ils arrivent à un total de 1,5 million. Les estimations actuelles tournent, elles, aux alentours de 2 millions de morts. La précision du premier semble totalement fantaisiste au regard des estimations des historiens, qui, n’arrivent pas eux-mêmes à réduire leurs marges d’erreur en deçà de 200 000 victimes.

Cet exemple souligne la nécessité de porter un regard critique envers les chiffres diffusés lors de catastrophes majeures. La rapidité avec laquelle sont relayées les dépêches chiffrées, sans analyse minutieuse de l’origine des calculs avancés, ne font que renforcer l’absurdité des communiqués laconiques lors desquels le présentateur nous annonce le nombre de victimes.

100 Years of World Cuisine est un projet de Clara Kayser-Bril, Nicolas Kayser-Bril et Marion Kotlarski.

]]>
http://owni.fr/2011/05/11/guerre-et-cuisine/feed/ 11
[itw] Income, le datajournalisme appliqué http://owni.fr/2011/04/17/interview-income-le-datajournalisme-applique/ http://owni.fr/2011/04/17/interview-income-le-datajournalisme-applique/#comments Sun, 17 Apr 2011 17:14:15 +0000 Mirko Lorenz http://owni.fr/?p=57341 Le datajournalisme est au centre de toutes les attentions. Motivés par un mélange d’espoir et de peur, des journalistes, développeurs et lecteurs souhaitent que l’utilisation de données conduise à un journalisme augmenté. Mais une question reste en suspens: quelqu’un va-t-il payer dans cet océan de contenus gratuits? Il reste tout de même de l’espoir, comme le montre cette histoire.

La rapidité de la communication sur les réseaux a un effet secondaire: les concepts sont souvent trop utilisés et deviennent des buzzwords, puis déçoivent, avant même d’être prêts. Résultat, l’intérêt pour la chose diminue et l’insatisfaction le remplace. Le journalisme de données (#ddj pour data-driven journalism) est à cette croisée des chemins aujourd’hui. Bien que la plupart des intéressés s’accorde à dire que les données pourront à l’avenir être utilisées pour enrichir le journalisme et le rendre plus fiable, beaucoup s’interrogent.

La question la plus souvent posée reste “Mais en quoi est-ce différent de ce que l’on a déjà ? On parle de grandes infographies, c’est ça ?” C’est pourquoi nous avons, en mars dernier, publié un long papier intitulé Media Companies Must Become Trusted Data Hubs, où l’on tâchait de démontrer le potentiel futur des données et du journalisme.

Des exemples, SVP

On a besoin d’exemples montrant réellement comment les données peuvent faire la différence. Comme d’aider les lecteurs à comprendre ce qu’il se passe et à prendre de meilleures décisions: acheter une maison ou une voiture, choisir une université ou une carrière – tout ça, nous le faisons tous les jours en nous fondant sur ce qui pourrait marcher. Et pour cette raison, nous nous faisons souvent berner par le “Monde des 99 Centimes” : les promesses de succès faciles charriées par la publicité et les relations presses nous laissent souvent désemparés lorsqu’il s’agit de faire le bon choix.

Bien que l’on dispose d’une infinité de contenus et de mises à jour, il reste difficile de trouver des informations fiables, compréhensibles et dignes de confiance lorsque l’on doit prendre des décisions réellement importantes. La plupart des “conseils” ou des “offres” sont un savant mélange de psychologie de comptoir (“Possédez une nouvelle voiture pour 299€”) et d’algorithmes affichant des bannières qui clignotent. Tout ceci est construit sur de l’analyse de données: de grosses boîtes comme Google, McDonald’s ou Zara utilisent des algorithmes complexes avant de dépenser des millions dans des campagnes de communication. La jungle qui nous entoure est construite sur des données, et – regarde – ça clignote.

L’une des grandes promesses du journalisme de données est que cela peut changer. Qu’il existe un genre de journalistes qui peut creuser dans les données, en tirer du sens et découvrir ce qu’une situation ou un évènement recouvre réellement. Mais à l’exception de quelques médias qui travaillent là-dessus, où sont les pionniers qui arrivent avec des projets enthousiasmants ?

Aller plus loin : le projet “Income”

Voilà un exemple qui peut nous en apprendre beaucoup. Il s’agit d’une création de Catherine Mulbrandon, qui a étudié l’économie, travaillé dans la finance et ouvert un site web, Visualizing Economics, il y a quatre ans. Sur son site, les données remontent sur plusieurs décennies et couvrent de nombreux sujets, tels le prix de l’immobilier, les cycles économiques, l’inflation. Elle cherche clarifier ces sujets pour le commun des internautes.

Pour faire passer ce projet à l’étape supérieure, Mulbrandon a conçu un projet baptisé Income (revenu), où elle tente de visualiser comment les Américains gagnent leur vie, en prenant en compte de nombreux angles. Pour le financer, elle a utilisé la plateforme Kickstarter, une plateforme où de bonnes idées peuvent être présentées à des financeurs éventuels.

Catherine Mulbrandon a clairement trouvé son créneau. La somme nécessaire au lancement du projet, 6 000$, a été dépassée depuis longtemps. Ses mécènes continuent même à donner: au 15 avril 2011, un total de 209 soutiens a financé le projet à hauteur de 9 000$, et il reste 15 jours avant la fin de la collecte de fonds.

En comparaison des affaires du monde, cette petite histoire n’a rien d’exceptionnel. Mais au vu de la situation dans le milieu du journalisme, c’est très important. Mulbrandon a déjà reçu l’argent, et c’est largement plus que ce que perçoivent la plupart des auteurs de livres. Les commentaires sur le site de Kickstarter sont très positifs et soutiennent le projet. Ils soulignent à quel point “Income” répond à un besoin et fournit ce que de nombreux utilisateurs souhaitent comme information.

Début mars, nous avancions que les groupes de presse devaient devenir des plateformes de données dignes de confiance et ne plus chercher à accaparer l’attention, mais plutôt à fournir des réponses plus profondes. C’est exactement ce que fait “Income“, et en pratique, pas en théorie. Rencontre avec la créatrice de ce projet.

Interview de Catherine Maldbrandon: Le projet ‘Income’

Mirko Lorenz: Tout d’abord, félicitations pour votre projet. Avez-vous été surprise par cet engouement?

Catherine Mulbrandon : Bien que j’avais dans l’idée que le projet soit financé, je l’ai lancé parce que je voulais tester mon idée selon laquelle un groupe de personnes  (professeurs, financiers, journalistes, bloggers politiques, amateurs d’infographie) serait en mesure de payer pour des versions papier ou des copies en haute-définition de mon travail.

D’où vous est venue l’idée de commencer ce blog?

J’ai passé plusieurs années à travailler dans la finance et j’ai vu très fréquemment des clients avoir besoin d’information économique très basique pour comprendre l’environnement financier. Cela manquait aussi dans la couverture médiatique de l’économie. A l’université Carnegie Mellon, j’ai créé une série de posters sur l’économie américaine pour mon mémoire de maîtrise et j’ai décidé de continuer ce travail après mon diplôme, via mon blog.

Les revenus constituent un sujet pour tout le monde. Pourquoi est-ce que ce que vous essayez de couvrir n’est-il pas déjà fait?

Le revenu était l’un des sujets de mes trois premiers posters, en 2004. A l’époque, il y avait très peu de visualisations à propos des revenus mais, au fil du temps, le sujet est devenu de plus en plus populaire. Pourtant, ces infographies se penchent souvent sur les inégalités présentes et ne les placent pas dans un contexte historique plus large, prenant en compte les modifications de la structure de l’économie. J’ai dans l’idée, pour ce Guide Illustré, de faire converger en un même endroit toute l’information sur les revenus que je peux trouver.

Comment décririez-vous le travail que vous faites ? Un regard créatif sur les nombres ? Creuser plus profondément ?

Plusieurs personnes essayent de définir ce que je fais. Je pense qu’une combinaison de design de l’information et de datajournalisme est le mieux que je puisse trouver pour qualifier mon travail.

Votre projet se concentre sur un aspect de l’information quotidienne qui n’est pas bien couvert: aider le public à visualiser le contexte des changements économiques qui nous affectent. Pourquoi y a-t-il si peu de sites web qui se penchent sur les données sur le long-terme? Cela ne devrait-il pas être couvert partout?

Je pense que le problème est que personne ne va payer pour ça. Le gouvernement ? Les journaux et les magazines ? Une bonne partie de l’information économique est créée par le gouvernement, mais l’administration n’a aucune raison de la fournir au public d’une manière compréhensible. Les médias se concentrent sur l’actualité chaude et de nombreux groupes ou ONG présentent des données de façon biaisée.

Dernière question: avez-vous découvert des faits croustillants dans votre travail sur Visualizing Economics, dans ce projet ou un précédent?

Quand j’ai commencé à me pencher sur les disparités de revenus, j’ai pensé que les PDG et les stars étaient les mieux payés, qu’ils gagnaient 20, 50 ou 100 millions de dollars par an. Une somme que j’avais du mal à imaginer. Quand j’ai poussé plus loin l’enquête, j’ai vu que des managers de fonds spéculatifs gagnaient plus d’un milliard de dollars par an. On a récemment pu voir que le manager de fonds spéculatif le mieux payé se faisait 5 milliards par an.

]]>
http://owni.fr/2011/04/17/interview-income-le-datajournalisme-applique/feed/ 3
Le datajournalisme: vecteur de sens et de profits http://owni.fr/2011/04/17/le-datajournalisme-vecteur-de-sens-et-de-profits/ http://owni.fr/2011/04/17/le-datajournalisme-vecteur-de-sens-et-de-profits/#comments Sun, 17 Apr 2011 12:32:46 +0000 Nicolas Kayser-Bril http://owni.fr/?p=57351 Ce post reprend les éléments d’une réflexion amorcée avec Mirko Lorenz et Geoff McGhee dans un article intitulé Media Companies Must Become Trusted Data Hubs [en] et présentée à la conférence re:publica XI.

Chaque jour, nous produisons deux ou trois exaoctets [en] de données, soit 1 million de téraoctets. Dans le même temps, Facebook et ses 600 millions d’utilisateurs produisent à eux seuls 70 téraoctets, soit à peine 0.007% du total. Pour comparer, un journal papier traditionnel pèse entre 1 et 50 mégaoctets.

Si l’on veut synthétiser toute l’information produite en quelque chose de digeste pour l’utilisateur final, il faut résumer par un facteur de 100 milliards. Pas facile pour un journaliste.

Pour faire sens de cette hyper-abondance de contenus, les professionnels de l’information doivent adopter de nouvelles techniques. Dans un monde analogique, l’enregistrement et la restitution permettent de rendre compte de manière optimale de la réalité. Dans un monde numérique et connecté, la difficulté ne vient plus de l’enregistrement mais de l’extraction de données pertinentes. Pour les exploiter, il devient indispensable de s’approprier des connaissances en analyse de données et en statistiques.

Une fois équipé des bons outils, faire parler des masses de données devient possible. La plupart des opérateurs téléphoniques, tels Vodafone [pdf/en], China Mobile [en] ou Verizon [en], utilisent les données produites par leurs utilisateurs pour prédire les embouteillages, par exemple. De telles techniques pourraient également être utilisées par les journalistes pour prévoir les manifestations.

Toute information est une donnée

L’aboutissement du datajournalisme reste de penser tout type d’information comme une donnée à mettre en lien et en contexte pour lui donner du sens. Si Vodafone est capable de transformer les informations de communication d’un simple GSM en service de prédiction des bouchons, les professionnels de l’information doivent être capables de réassembler et de manipuler les éléments pris dans l’actualité pour en extraire des tendances et du sens pour le citoyen.

L’information telle qu’on la consomme habituellement, sous forme de textes ou d’images, n’est que très partiellement compréhensible par l’ordinateur. Les masses d’information accumulées par les journalistes restent amorphes une fois publiées, alors qu’elles pourraient être valorisées en fournissant le contexte nécessaire à la compréhension des articles du jour.

Certaines initiatives vont dans ce sens. L’International Press Telecommunications Council (IPTC) vient de publier un format de description des données permettant d’identifier clairement les personnes, les lieux et les organisations impliquées dans un article. Ce standard, rNews, a été dévoilé le 5 avril. L’IPTC compte parmi ses membres l’AFP, la BBC et 27 autres acteurs majeurs des médias. Son pas en avant va peut-être accélérer le passage des médias au web sémantique et aux données liées.

Médias liquides

Pour diffuser sur l’ensemble des plateformes et des écrans, les contenus doivent être capables de prendre différentes formes. Du SMS à l’infographie dynamique, l’information doit pouvoir être consommée dans n’importe quelle situation, y compris celles que nous n’imaginons pas encore.

La plupart des rédactions peuvent certainement prendre à leur charge la distribution de leurs contenus sur le web, via leur site. Une petite partie d’entre elles est capable de faire de même sur l’iPhone, sur Android et sur l’iPad. Et malgré ça, aucun média français (à part 10 minutes à perdre) n’est capable de se positionner parmi les 100 app les plus vendues sur iTunes.

En donnant la possibilité à tout développeur d’accéder à leurs informations, les médias peuvent diffuser beaucoup plus largement leurs contenus, sans se poser la question du support. Tout comme la plupart des titres papier externalisent l’impression et la distribution, les sites web peuvent se débarrasser de la diffusion et laisser les spécialistes – les développeurs – s’en charger.

Les API (interfaces permettant aux ordinateurs d’accéder directement à l’information) du Guardian (Open Platform) et du New-York Times (Developer Network) donnent une idée de ce à quoi pourrait ressembler un média réellement liquide. C’est ainsi que les médias pourront cesser de devenir des répertoires de données pour devenir des points d’échange obligés dans le parcours de l’information.

L’actif des médias, en plus de leur marque, reste leur audience. Sa valeur ne provient plus de sa capacité à être vendue aux annonceurs, mais des possibilités de l’intégrer au processus de création de l’information. Le crowdsourcing permet d’augmenter, d’après l’expression d’Eric Scherer, l’information préexistante. Que ce soit pour compléter une base de données (comme nous le faisons avec prixdeleau.fr) ou pour valider des informations (comme sur InfluenceNetworks), l’apport de l’audience différencie profondément un média, enrichisseur de données, d’une base de données « froide ».

Le marché de la confiance

Les médias ont, jusqu’à présent, évolué sur un marché où ils offraient une information à leurs lecteurs ou spectateurs et une audience à leurs annonceurs. A une époque où l’information était une ressource rare et où les annonceurs ne pouvaient pas toucher directement leur public, les médias créaient de la valeur aux deux bouts de la chaîne.

Aujourd’hui, cette position n’est plus tenable. Les lecteurs peuvent contourner les médias et s’informer via de nouveaux canaux (Wikipédia, Facebook, les sites d’institutions ou d’ONG) et les annonceurs peuvent toucher leur audience sans passer par les médias.

Cette dynamique redessine complètement le marché des médias et de l’information. Pour obtenir l’attention de leurs prospects sur un marché hyper-compétitif, les annonceurs ont intérêt à investir massivement dans la qualité du contenu. Unilever, l’un des plus gros annonceurs traditionnels, pénètre ainsi le marché du divertissement en produisant un jeu vidéo en ligne pour ses glaces Magnum (Pleasure Hunt).

Des ONG, qui se seraient auparavant contenté d’envoyer des communiqués de presse aux médias de masse, publient directement les résultats de leurs études et de leurs actions sur leurs sites. Les ONG sont devenues des médias comme les autres [en]. De nouveaux acteurs de l’info, comme Wikileaks et OpenLeaks, l’ont d’ailleurs reconnu clairement. Le premier en offrant les télégrammes diplomatiques évoquant le traité ACTA à la Quadrature du Net [en], une association militant pour les libertés numériques, le second en faisant en sorte d’accueillir en son sein autant d’ONG que de médias.

Les institutions ne sont pas en reste, même en France. Le Quai d’Orsay prend particulièrement au sérieux son nouveau rôle de média. Sur Twitter, @francediplo compte sept fois plus de followers que @France_Info_Com, par exemple. Le ministère des affaires étrangères publie également sa propre série de web-documentaires, Destinations.

La rareté, aujourd’hui, ne réside plus dans l’accès à l’audience (ce pourquoi les annonceurs allaient vers les médias) ni dans l’accès à l’information (ce pourquoi les consommateurs se tournaient vers les médias). La rareté, aujourd’hui, réside dans la confiance à accorder à une information.

Dans un univers de contenus surabondants, produits par tous, la valeur vient de la relation de confiance que l’on arrive à tisser avec son audience. Un tel changement de paradigme met sur un pied d’égalité tous les producteurs de contenus, média y compris.

]]>
http://owni.fr/2011/04/17/le-datajournalisme-vecteur-de-sens-et-de-profits/feed/ 7