Data scientist: de nieuwe hogepriester?

We worden om de oren geslagen met wonderlijke verhalen uit de wereld van data. Termen als ‘big data’, ‘business analytics’, ‘data mining’, ‘data-gestuurd werken’ et cetera zoemen zelfs rond in directiekamers; de roep om data scientists klinkt luid. Terecht? Allicht wel, maar er zijn ook kanttekeningen bij te plaatsen.

Rik MaesMeer van deze auteur

communicatie big data — © CC BY 2.0 - Flickr.com

CC BY 2.0 - Flickr.com

Data zijn per definitie onnauwkeurig omdat ze het resultaat zijn van talloze assumpties, interpretaties, selecties, rubriceringen, et cetera. Ze zijn, in navolging van wat mijn favoriete filosoof Rorty over taal zegt, geen afbeeldingen van de werkelijkheid maar instrumenten om met die werkelijkheid om te gaan en dus onderhevig aan vervorming en manipulatie. Statistische verwerking ervan verhelpt dit subjectieve karakter ervan niet, integendeel: het versterkt het alleen maar.

Data zijn daarenboven een heuse industrie geworden in de handen van brokers die de oorsprong en adequaatheid van hun data angstvallig geheimhouden. Dat deze databanken vol fouten zitten blijkt alleen al uit de recente heisa rond de World-Check zwarte lijst van ‘financieel criminelen’ (waar u en ik ook op zouden kunnen staan, al kunnen we dat niet nagaan). Ook hier geldt ‘garbage in, garbage out’.

Meer dan aan data scientists die de analytics genereren hebben we behoefte aan kundige gebruikers die de uitkomsten kunnen interpreteren en vertalen naar waarde creërende en bovenal verstandige beslissingen: ‘evidence based’ en ‘experience based’ gaan hand in hand. Onderdeel van hun expertise is dat zij middels onafhankelijke validatie nauwlettend oog hebben op de kwaliteit van de brondata en de veronderstellingen achter de analysemethoden, maar vooral voortdurend rekening houden met de quasi zekerheid dat de data niet perfect zijn. Strategieën en acties die bouwen op het blindelings volgen van de uitkomsten van data science in de automatische aanname dat deze accuraat zijn, leiden onvermijdelijk tot problemen en teleurstellingen. Omzichtigheid is het kenmerk van de goede beslisser, meer dan ooit in het data tijdperk.