Innovatie & Strategie

Wetenschap
Poker

Nieuwe doorbraak prestatie Kunstmatige Intelligentie

Supercomputer verslaat Poker-kampioenen en effent de weg voor nieuw type toepassingen.

© CC0 - Pixabay moritz320
1 februari 2017

Supercomputer verslaat Poker-kampioenen en effent de weg voor nieuw type toepassingen.

Liberatus - een AI-programma ontwikkeld door Carnegie Mellon University - is er in geslaagd vier professionele pokerspelers in hun hemd te zetten.

De wedstrijd vond plaats over een periode van 20 dagen in een casino in Pittsburgh. Er was gekozen voor een extra lastige variant van het spel, de zogeheten No-Limit Texas Hold'em.

Hoewel poker niet zo hoog staat aangeschreven als schaak en go - spelen waarbij supercomputers eerder wereldkampioenen de baas waren - komen er bij poker bijzondere aspecten kijken waar computers veel lastiger mee om kunnen gaan.

Schaak en go zijn spelen waar alle informatie bekend is. Alle zetten die zijn gedaan, zijn bekend en alle opties zijn door te rekenen. Poker is daarentegen een onvolledig informatiespel. Een speler weet niet welke kaarten zijn tegenstanders hebben. Bovendien is bluf een belangrijke factor in het spel en bluf heeft veel met gevoel en risico-afweging te maken. Dat zijn aspecten die voor een computer moeilijk zijn.

Veel meer toepassingen dan pokerspel

Het succes in deze wedstrijd kan daarom een doorbraak betekenen voor de inzet van computers in een heel ander type besluitvorming, waar onvolledige en misleidende informatie een belangrijke rol spelen. Voorbeelden zijn zakelijke onderhandelingen, gezondheidsvraagstukken, veilingen, cybersecurity en militaire operaties.

De onderzoekers hebben het Liberatus-programma daarom zo ingericht dat het zijn strategie bepaalt aan de hand van het gedrag van de tegenspelers. Dat algoritme is ontwikkeld in ongeveer 15 miljoen uur rekentijd op de Bridges supercomputer van het Pittsburgh Supercomputing Center. Ook tijdens de speldagen werd de Bridges computer ingezet gedurende de rusttijden om het algoritme verder aan te scherpen.

CMU bakermat van AI

Het Pittsburgh Supercomputing Center van de Carnegie Mellon University (CMU) is een hotspot in de ontwikkeling van kunstmatige intelligentie. Zo werden hier belangrijke fundamenten gelegd die onderdeel vormden voor het Deep Blue-programma waarmee IBM schaakkampioen Kasparov versloeg in 1997. IBM's Watson die het Amerikaanse kennisspel Jeopardy in 2011 won, bevat eveneens belangrijke elementen die aan CMU zijn ontwikkeld en dat geldt ook voor Apples digitale assistent Siri.

Nash-evenwicht

Econometrist en pokeronderzoeker Rogier Potter van Loon legt in de Volkskrant uit dat Liberatus gebruik maakt van een methode die streeft naar het bereiken van het Nash-evenwicht, een optimale balans tussen risico en beloning.

John Nash kreeg voor het analyseren van deze methode in 1994 de Nobelprijs voor de economie. Bij dit evenwicht heeft iedere speler een optimale strategie die is gebaseerd op de input van de strategie van de andere spelers. Dit evenwicht komt niet alleen in spelsituaties voor maar ook in andere onderhandelingen. Het bekendste voorbeeld is het prisoners dilemma.

Zie ook Innovatie & Strategie op AG Connect Intelligence

Reactie toevoegen