Luis von Ahn: Spelletjes leren de computer menselijke vaardigheden
Voor zijn werk ontving de veel bekroonde Guatemalteek Luis von Ahn onder meer een MacArthur Award van een half miljoen dollar. De jonge Von Ahn is hoogleraar computerwetenschappen aan Carnegie Mellon University.
Het aanbod om voor Microsoft en menig ander softwarebedrijf te werken, sloeg hij af. Hij koos voor een academische loopbaan.
Waarom precies?
“Dit is iets waar ik heel lang over nagedacht heb. Microsoft had een prachtaanbod. Toch heb ik voor de universiteit gekozen omdat ik daar geen baas boven me heb. Microsoft had duidelijk niet in gedachten om mij als CEO in te huren. Aan de universiteit vertelt niemand mij wat ik moet doen. De spellingchecker van Google is ronduit subliem. Ze gebruiken daar geen woordenboek voor, maar Google zelf. Maar niemand weet wie dat gemaakt heeft. Als ik iets maak aan Carnegie Mellon University zal iedereen weten dat Luis von Ahn het gemaakt heeft. Misschien ben ik wel egocentrisch.”
Google heeft een licentie genomen op uw ESP Game, nu beter bekend als ‘Google Image Labeler’. Wat was de reden voor Google om het spel te licentiëren?
“Google Afbeeldingen is niet bijzonder goed in plaatjes. Het is best verbazingwekkend hoe goed ze nog zijn, gegeven het feit dat ze heel slecht geëquipeerd zijn voor het zoeken op afbeeldingen. Google maakt nu gebruik van een programma dat ik geschreven heb, in feite een game waarbij de spelers beelden voorzien van namen. Mensen houden er trouwens van om dat spel te spelen. Sommige spelers spelen het tot twintig uur per week. Het spel wordt gespeeld door twee spelers die elkaar niet kennen en die lukraak aan elkaar gekoppeld worden. De spelers kunnen niet met elkaar overleggen. Het enige wat ze met elkaar gemeen hebben, is het beeldmateriaal waarover ze beschikken: een plaatje. Beide spelers geven dat beeld namen tot het moment waarop beiden aan hetzelfde beeldmateriaal dezelfde naam hebben gegeven. De beloning bestaat uit punten. Als je beschikt over de afbeelding van een kat, dan wil je aan die afbeelding op zijn minst de naam ‘kat’ verbinden, maar ook de naam ‘dier’ en misschien ook wel de kleur van de kat. De bedoeling is op die manier het gericht zoeken naar beeld te verbeteren.”
Klinkt leuk, maar op die manier moet je massaal veel mensen vinden die bereid zijn het spel te spelen. Die vind je toch nooit?
“Maar die heb je ook niet nodig. We hebben uitgerekend dat als niet meer dan vijfduizend mensen gedurende twee hele maanden permanent dit spel spelen, alle beeldmateriaal op Google Afbeeldingen volledig geïnventariseerd is. Als we miljoenen foto’s hebben geïnventariseerd, kunnen we dat beeldmateriaal gebruiken om computers te trainen om naar beeld te leren kijken. Niemand is tot nu toe in staat gebleken om ‘computer vision’ op een redelijk niveau te brengen. Maar op deze manier moet het lukken. Massale input van data is van cruciaal belang bij het verbeteren ‘machine learning’.”
Hoeveel foto’s heeft Google momenteel al geïnventariseerd?
“Ze zijn nog maar net begonnen. De cijfers ken ik niet en als ik ze wel kende, zou ik ze niet openbaar mogen maken. Maar ESP Game op mijn eigen website is gespeeld door een tweehonderdduizend mensen die samen circa 25 miljoen ‘image labels’ verzameld hebben. De essentie van mijn werk is: mensen inzetten om computers menselijke vaardigheden aan te leren door middel van het spelen van spellen. Naarmate de computer beter wordt in menselijke vaardigheden is mijn beroep ten dode opgeschreven. Dat is althans wat ik hoop. Eén van de dingen die computers hard nodig hebben in dat verband is massaal veel gegevens. Maar in de praktijk blijkt dat het heel moeilijk is om mensen zo gek te krijgen dat ze bereidwillig meewerken aan het verzamelen van data. Mensen hebben geen echt goede reden om dat te doen. Daarom heb ik er een spel van gemaakt.”
Blijft het bij dit ene spel of is het denkbaar dat andere spellen computers andere taken kunnen aanleren?
“Ik heb nog een spel in ontwikkeling voor het labelen van geluiden en voor het verbeteren van machinevertalingen. Het is over het algemeen niet zo heel erg moeilijk om aan voldoende vertaalgegevens te komen als de brontaal Engels is. Maar als het over andere talen gaat, bijvoorbeeld Chinees en Spaans, wordt dat knap lastig. Verder is er nog een spel in de maak voor het verzamelen van ‘gezondverstandkennis’, van het type: een auto heeft gewoonlijk vier wielen. Dat is kennis die in het dagelijkse leven zeer van pas komt, maar die computers te enen male missen. Uiteindelijk zullen al die technologieën naar elkaar toegroeien, maar zover zijn we nog niet. Op dit moment beperk ik mij tot het verzamelen van de gegevens.”