VVOJ2012 verslag: Working with data (part II)

Conferentie

Datum: Vrijdag 16 november 2012
Tijd: 14:15-15:00 uur
Sprekers: Maarten Lambrechts en Arlen Poort
Aantal deelnemers: 25

Verslag: Michaël Aussems en Isabelle Gheldolf

Maarten Lambrechts en Arlen Poort beantwoordden in hun workshop heel wat vragen over de praktische kant van datajournalistiek in België en Nederland. Aan tips en tricks geen gebrek, zowel een nieuwkomer als ervaren rotten konden er wat van opsteken. Vier belangrijke tips voor wie een succesvol datajournalist wil worden.

Tip 1: gebruik bestaande databases voor nieuwe doeleinden
De overheid stelt een heleboel databases ter beschikking via het web maar ook via commerciële instanties. De kans dat iemand een gegevensbestand bijhoudt dat een exact antwoord op jouw vraag geeft, is echter klein. Een database wordt opgesteld met een bepaald doel, maar ze kan ook voor andere doeleinden gebruikt worden. Supermarkten als Albert Heijn en Delhaize bijvoorbeeld hebben al hun producten online staan. Door deze pagina’s te scrapen kan je de supermarktoorlog volgen.

Tip 2: Webscrapen!
Webscrapen is een techniek om op een geautomatiseerde wijze informatie van het web te halen. Stel dat je de prijsevolutie in de huizenmarkt wil nagaan: de website funda.nl verstrekt actuele gegevens over de prijs van huizen, maar je kan slechts zoeken op provincie en er verschijnen maximaal vijftien resultaten per pagina. Onbegonnen werk om zo wekelijks voor alle provincies de honderden webpagina’s te doorlopen.

Een webscraper biedt de oplossing. Zo’n zelfgeschreven programmaatje verzamelt de gegevens die je wil volledig automatisch. Helaas zit er een addertje onder het gras: wie een webscraper wil maken moet een beetje kunnen programmeren. “Helemaal niet zo moeilijk”, aldus Poort, “en meer dan de moeite waard.” Geïnteresseerden kunnen alvast kennis vergaren via scraperwiki.com

Tip 3: Combineer gegevensbestanden
Eén database is goed, twee is beter. Een reeks gegevens van het KMI kan interessant zijn om bijvoorbeeld te onderzoeken of bepaalde maanden droger waren dan anderen. Een ander gegevensbestand kan informatie bevatten over het aantal verkeersdoden per dag, inclusief de betrokken voortuigen. Leg die twee databases naast elkaar en er gaat een hele nieuwe wereld open. Wat is het verband tussen slecht weer en ongevallen? Sterven er meer motorrijders op de eerste dag mooi weer na een koude winter?

Tip 4: Invalshoeken
Via twee invalshoeken kan je aan datajournalistiek doen. Enerzijds kan je bezig zijn met een concreet onderzoek en daar relevante gegevens over zoeken. Anderzijds kan je vertrekken van beschikbare databases. Die bestanden onderzoek je om tot een verhaal te komen.
Michaël Aussems en Isabelle Gheldolf