Nepnieuws te lijf met AI die nieuwe domeinen fileert

Machine learning kan helpen bij het analyseren van de doelstellingen op nieuw aangemelde internetdomeinen. Op die manier kunnen verdachte sites geblokkeerd worden voordat zij de reguliere communicatiekanalen voeden met desinformatie.

Thijs DoorenboschMeer van deze auteur

domeinnaambordjes — © CC0 (Pixabay licence)

CC0 (Pixabay licence)

Een groot probleem bij de verspreiding van desinformatie is dat het opzetten van nieuwe internetdomeinen weinig geld en tijd kost. Ze kunnen ook makkelijk weer worden verlaten wanneer duidelijk is dat hun bedoelingen niet oprecht zijn. Die hit-and-run-sites spelen een grote rol in de verspreiding van desinformatie. Ze zetten in op het virale effect dat optreedt wanneer opzienbarende berichten goed worden geplugd in reguliere kanalen.

Techgiganten als Google, Facebook en Twitter hebben moeite om daar mee om te gaan. Hun reactie is dan ook vaak erg traag, constateerden drie wetenschappers uit de VS en Engeland. Zij ontwikkelden daarom een gereedschap op basis van machinelearning-technologie dat in staat is de kans te berekenen dat nieuw geregistreerde websites worden ingezet om misinformatie verspreiden.

De aanvraag onder de loep

Ze maakten daarbij gebruik van gegevens van domain registrars en van browserdata van Mozilla. "Kwaadwillenden die valse informatie willen verspreiden hebben een voorkeur om uit het zicht te blijven. Wij hebben dat aspect gebruikt in ons model", zegt Anil Doshi van de School of Management van het University College of London (UCL) en een van de auteurs van het wetenschappelijk artikel Real-Time Prediction of Online False Information Purveyors and their Characteristics. Zo analyseert het systeem bijvoorbeeld wie voor de domeinnaam betaalt, welke extensie is gekozen, bij welke registrar, in welk land en of er verwijzingen naar politieke termen in de domeinnaam zijn verwerkt.

Doshi wil met zijn collega's - Sharat Raghavan van University of California, Berkeley en William Schmidt van Cornell University - het 'early warning'-systeem beschikbaar maken voor beleidsmakers en toezichthouders. Die kunnen daarmee werk uit handen nemen van de vaak krap bezette afdelingen die zich moeten buigen over het instellen van sancties of verscherpt toezicht.

Nauwkeurigheid getest

De onderzoekers presenteren in hun artikel resultaten die erop wijzen dat hun systeem behoorlijk accuraat is. Op basis van gegevens - verzameld rond de Amerikaanse presidentsverkiezingen van 2016 - wist het systeem 92 procent van de domeinen die valse informatie verspreiden, correct aan te wijzen. De analyse van domeinen die oprechte informatie verspreidden, was in 96,2 procent correct.

Een probleem is wel dat hier sprake is van een kat-en-muisspel met de verspreiders van desinformatie, waardoor de nauwkeurigheid van het gereedschap afneemt naarmate de werkwijze bekend wordt. Dat gebeurde ook met het speuren naar potentiële sites die zijn betrokken bij phishing en scam, zegt een woordvoerder van SophosLabs tegen The Register. De nepnieuwsverspreiders passen hun tactieken daarop aan. De onderzoekers verwachten echter dat door dit gereedschap in te zetten in combinatie met andere meer tekstgebaseerde technologie, er toch een bruikbaar hulpmiddel ontstaat.