Anonimiteit bij Big-Data-analyse een illusie
Het privacyrisico in dit soort gegevens schuilt in het feit dat het aankooppatroon van individuen uniek is. Je hebt maar heel weinig gegevens nodig van een persoon nodig om hem te koppelen aan de geanonimiseerde gegevens in de databank. Kennis van de plaats waar een persoon zich bevond op vier tijdstippen die overeenkomen met de gegevens in het databasestuwmeer, volstaat in 90 procent van de gevallen om de creditcardhouder in die database te identificeren. Als je daarenboven ook nog weet hoeveel er bij gelegenheid is gespendeerd, kun je nagenoeg iedereen in de database identificeren met slechts drie stukjes informatie. Je kunt de analyse wel moeilijker maken door in het datastuwmeer aankopen te aggregeren per dag of per week. Maar daarmee werd het niet onmogelijk om de personen te identificeren; het vroeg alleen wat meer externe informatie.
Voorzichtigheid geboden
De wetenschappers zijn wetenschapper genoeg om niet te pleiten voor een verbod op Big-Data-analyse. Maar het onderzoek laat wel zien dat je uiterst omzichtig om moet gaan met Big Data, zegt onderzoeksleider Yves-Alexandre de Montjoye. Waar er persoonlijk gevoelige informatie bij betrokken is is het openlijk delen van ruwe sets gegevens niet de weg naar de toekomst. Dergelijke gegevenssets zouden alleen voor analyse vrijgegeven moeten worden als toegang tot individuele records en de correlatieanalyse met externe gegevens geblokkeerd worden, meent hij.
De Montjoye en zijn team hebben hun bevindingen gepubliceerd in Science.
Reacties
Om een reactie achter te laten is een account vereist.
Inloggen Word abonnee