Inleiding
Speltheorie is een hulpmiddel waarmee de interactie tussen ‘spelers’ geanalyseerd kan worden. Met behulp van modellen wordt geprobeerd de onderliggende interactie van ‘spelers’ die beslissingen nemen te begrijpen.
Daarbij maken we onderscheid tussen:
Simultaan spel
In de meeste gevallen analyseren we een situatie waarbij twee spelers kiezen tussen twee strategieën.
Er is in zo’n situatie geen overleg en beide spelers zijn bekend met de opbrengsten die horen bij de gekozen combinatie van strategieën. Spelers kiezen steeds de strategie die voor henzelf de hoogste opbrengst heeft; best response methode.
Een simultaan spel wordt geanalyseerd met behulp van een opbrengstenmatrix. Bijvoorbeeld:
In elke cel staat de opbrengst voor beide spelers bij deze combinatie van strategieën. Het eerste getal is de opbrengst voor de rijspeler, het tweede getal de opbrengst van de kolomspeler. In dit geval nog eens extra benadrukt met de kleuren blauw en rood.
Vervolgens zal elke speler voor zichzelf de beste reactie bepalen, gegeven de keuze van de andere speler.
Eerst bepalen we de beste reacties voor de rijspeler.
Hij moet zijn strategie bepalen voor twee mogelijke keuzes van de kolomspeler.
A
Indien de kolomspeler kiest voor Actie 1, dan zal de rijspeler kiezen voor Actie 2. Want 1.200 > 1.000.
B
Indien de kolomspeler kiest voor Actie 2, dan zal de rijspeler kiezen voor Actie 2. Want 1.100 > 900.
We zien dat de rijspeler in alle gevallen kiest voor Actie 2. We spreken in dat geval van een dominante strategie voor de rijspeler.
Dan bepalen we de beste reacties voor de kolomspeler.
Ook hij moet zijn strategie bepalen voor twee mogelijke keuzes van de rijspeler.
C
Indien de rijspeler kiest voor Actie 1, dan zal de kolomspeler kiezen voor Actie 2. Want 1.600 > 1.400.
D
Indien de rijspeler kiest voor Actie 2, dan zal de kolomspeler kiezen voor Actie 2. Want 1.500 > 1.300.
We zien dat ook de kolomspeler in alle gevallen kiest voor Actie 2. We spreken in dat geval van een dominante strategie voor de kolomspeler.
Wanneer we voor alle spelers de beste reactie onderstrepen, kunnen we het Nash evenwicht vinden.
Dit is de situatie waarbij geen enkele speler zijn opbrengst kan verbeteren door eenzijdig een andere keuze te maken.
In bovenstaande situatie is het Nash evenwicht ook de optimale uitkomst, want niemand kan zijn positie verbeteren zonder dat dit ten koste gaat van de ander.
Wanneer het Nash evenwicht NIET gelijk is aan de optimale uitkomst, is er sprake van een gevangenendilemma (of prisoners dilemma).
Bijvoorbeeld in onderstaande situatie.
In het Nash evenwicht is de opbrengst voor beide spelers 20. Indien beide spelers voor ‘geen doping’ hadden gekozen, zouden ze beiden een hogere opbrengst hebben. Het probleem is dat geen enkele speler deze situatie zelfstandig kan bereiken.
Overleg zou kunnen helpen, maar dan is er nog steeds vertrouwen nodig. Dit vertrouwen zal eerder ontstaan in een situatie die zich herhaald, dan in een situatie die eenmalig is.
Door zelfbinding kunnen spelers proberen het gevangenendilemma te doorbreken. Spelers wijken dan vrijwillig af van hun dominante strategie. Zelfbinding wordt geloofwaardig wanneer er voor deze speler negatieve (financiële) gevolgen ontstaan als hij tóch niet afwijkt van de dominante strategie.