Voorspellen blijkt mogelijk, zelfs als het de toekomst betreft
Deze contra-intuïtieve bevinding is de uitkomst van 4 jaar promotieonderzoek van Wouter Koolen, aan het Centrum Wiskunde & Informatica (CWI) in Amsterdam. Koolen ontwikkelde daar een zelflerend algoritme voor het kiezen tussen rivaliserende adviseurs. Bovendien toonde hij aan dat zijn algoritme geen andere ‘overhead’ (verspilling van informatie) met zich meebrengt dan de speltheoretisch minimaal benodigde ‘leerkosten’. Eén en ander wordt uit de doeken gedaan in het proefschrift, dat als titel meekreeg: “Combining Strategies Efficiently. High-Quality Decisions from Conflicting Advice”.
Experts, van vlees en bloed of in de vorm van kunstmatig intelligente softwaresystemen, zijn het in de praktijk zelden eens. Moeten kiezen tussen meerdere feilbare adviezen komt dan ook regelmatig voor. Waar vind je de betrouwbaarste weersvoorspelling? Welke routeplanner kiest de snelste weg? Welke expert adviseert het beste over de ontwikkeling van aandelenkoersen? Welk algoritme comprimeert welk bestand het efficiëntst?
'Question-the-leader'
In de praktijk kiezen de meeste mensen in dergelijke gevallen - bewust of onbewust - voor de ‘follow-the-leader’-strategie; die er op neerkomt dat men zijn vertrouwen vestigt op de expert die het de afgelopen tijd het meest bij het rechte einde had. Maar de praktijk wijst uit dat dat veel contraproductief gewissel met zich meebrengt. Op basis van een mix van informatica, informatietheorie en statistiek ontwikkelde Koolen een veel genuanceerder variant van de ‘follow-the-leader’-benadering.
Genuanceerder in de zin dat zijn strategie recht doet aan de tijdelijkheid en de betrekkelijkheid van ‘leiderschap’, door gezag niet 100 procent bij één leider te leggen, maar naar rato van mate van succes te verdelen over de diverse experts. Het resultaat is een programma dat door de tijd heen verbluffend succesvol ‘schakelt’ tussen wisselend succesvolle adviseurs. Op geringe leerkosten na, zelfs net zo succesvol als een hypothetische beslisser met complete voorkennis.
Niet iets om rijk van te worden
Een belangrijke beperking van Koolen’s algoritme is dat het alleen kan worden toegepast in situaties waar je snel en ondubbelzinnig terugkoppeling krijgt. Bijvoorbeeld op de effectenbeurs. Die effectenbeurs is sowieso een bijzonder geval, omdat de adviezen hier samenvallen met hun object. Met de koop (of het vasthouden) van een aandeel geeft elke belegger immers impliciet aan anderen het advies af om hetzelfde te doen. Je zou die ‘adviezen’ willen volgen (het aandeel hebben) welke berusten op een juiste inschatting van de waardeontwikkeling. En andersom willen negeren (het aandeel kwijt zijn) wat de plank misslaat.
Koolen probeerde die redenatie uit en ervoer dat hij het zo - althans bij aandelen met flink wisselende koersen - inderdaad beter doet dan de beurs zelf. Jammergenoeg bedroeg de marge minder dan de transactiekosten. Hij wil er nog verder aan werken, maar als speltheoreticus weet hij nu al dat het hem niet rijk zal maken: “Als ik het goed doe, dan gaan anderen het ook zo doen en ontstaat er consensus over de waarde van het aandeel. Dat betekent dat er dan te weinig koersfluctuatie zal zijn om het te laten werken.”
Gelukkig kreeg Koolen, wiens promotieaanstelling bij het CWI donderdag formeel wordt afgerond, eind vorig jaar een zogeheten Rubicon-subsidie toegekend, waarmee hij zijn onderzoek nog twee jaar kan doorzetten vanuit een positie als postdoctoral research fellow bij het Computer Learning Research Centre van Royal Holloway, University of Londen.
Reacties
Om een reactie achter te laten is een account vereist.
Inloggen Word abonnee