#LROJ16 – Dealen met data (en de valkuilen)

VVOJ Activiteiten

Jasper Bunskoek is datajournalist bij RTL Nieuws. Hij werkte voor de Twentsche Courant Tubantia, waar hij zich specialiseerde in datajournalistiek. Daar maakte hij onder andere de Voetbalkaart van Nederland. Bij RTL Nieuws is hij samen met Frank Tieskens verantwoordelijk voor het begin dit jaar gelanceerde RTL Nieuws Buurtfacts. Een platform waar je nieuws en wetenswaardigheden op buurt-, wijk- en gemeenteniveau kunt vinden.

door MARLOUS BLOKKER

Datajournalistiek begint met een goed uitgewerkt idee en dat is voor Bunskoek het belangrijkste.

  • Wat wil ik onthullen of checken? Voorbeeld: hoe lang worden mensen in de bijstand niet gesproken door de gemeente.
  • Wat heb ik nodig om die vraag te beantwoorden? Voorbeeld: gegevens van mensen in de bijstand en wanneer ze gesproken zijn.
  • Wat is er beschikbaar? Zijn er onderzoeken naar gedaan? Heeft het CBS cijfers?
  • Wie heeft data? Voorbeeld: Ministerie van Sociale Zaken en Werkgelegenheid, VNG en andere partijen die mogelijk die data zouden hebben.
  • Hoe krijg ik data? Voorbeeld: gemeenten. Middels een WOB-verzoek aan 125 gemeenten gevraagd: kunnen jullie per bijstandsontvanger in maand X vertellen wanneer ze voor het laatst gesproken zijn.

Daarna ga je data verzamelen. Je kunt tellen en turven maar dat kost veel tijd. Open data leveren vrij beschikbare informatie:

  • CBS Statline.
  • Vektis.
  • Open State Foundation en Openspending.
  • Enquêtes.
  • Wees kritisch: wat wil de verstrekker? Iedereen legt cijfers graag op z’n eigen wijze uit.
  • Ook cijfers zijn soms subjectief of niet te checken.
  • Vriendelijk verzoeken.
  • Wees duidelijk.
  • Neem de tijd.
  • Lukt het niet? Zoek alternatieven die de data zouden kunnen hebben.
  • WOB-verzoek.
  • Weet wat je wil weten.
  • Weet waar je het kunt vinden.
  • Heb geduld.
  • Vraag Roger Vleugels, WOB-deskundige.

Scrapen. Het klinkt moeilijk, maar dat hoeft het volgens Bunskoek niet te zijn.

  • Google spreadsheets: tabel van een webpagina binnenhalen. Gebruik daarvoor deze formule: =IMPORTHTML(“”,”table”,””)
  • OutwitHub, Scraperwiki, KimonoLabs zijn programma’s die je kunnen helpen met scrapen.

Bewerken en analyseren doet Bunskoek het liefst met het programma Excel. Handige formules bij Excel:

  • Samenvoegen en tekst naar kolommen: via Gegevens -> tekst naar kolommen. Maakt van één cel meerdere cellen door te scheiden via het koppelteken.
  • =SPATIES.WISSEN. Haalt alle spaties voor en achter tekst weg.
  • Vert.zoeken en =INDEX(:VERGELIJKEN(::0)). Zoekt via twee kolommen met gelijke waarden in twee verschillende datasets naar de waarde die je zoekt en plaatst die in de dataset waar je verder mee wilt werken.
  • Filteren. Rangschikt je data van hoog naar laag, van a naar b of van oud naar nieuw. Handig als je wilt weten wie of wat het beste, slechtste hoogste of laagste scoort.
  • Draaitabellen maken. Maakt een nieuwe tabel op basis van je gegevens waarbij gelijke waarden worden opgeteld.
  • Tip: googel vooral naar de functionaliteiten en YouTube staat vol met Excel-handleidingen.

Visualiseren
Maak het je publiek zo gemakkelijk mogelijk. Denk aan wat je wil vertellen. Gebruik vooral voorbeelden bij je conclusies want cijfers gaan pas leven als het een gezicht of verhaal heeft.
Bunskoek raadt een paar handige tools aan:

  • CartoDB
  • Datawrapper
  • Fusion Tables
  • Tableau

Tips om valkuilen te omzeilen:

  • Wees kritisch, ook op cijfers.
  • Heb geduld. De aanhouder wint.
  • Reken op Excel, maar vooral op gezond verstand.
  • Gebruik Ctrl-S alsof het een lidwoord is
  • Corrigeer en weet meer.
  • Relateer, correleer en corrigeer, maar sluit toeval nooit uit.
  • Leg conclusies voor aan anderen. Heel belangrijk volgens Bunskoek.
  • Zoek voorbeelden bij je conclusies.

Voor vragen, ideeën of samenwerken? @jasperbunskoek of jasper.bunskoek@rtl.nl

 

  • [wpdm_hotlink id=75 link_label=’Hier vind je de Powerpointsheets van deze workshop.’]