De modellen in de Gazet zijn opgebouwd rond de nutstheorie. Het loont de moeite om het verband tussen de nutstheorie en de speltheorie te onderzoeken. Een goede illustratie is de toepassing van de beide benaderingen op de productie van zuiver publieke goederen. Bovendien is dit thema essentieel voor de bestuurskunde. Hierbij ontstaat het collectieve actie probleem van zwart rijden, leidend tot onder-productie. Een oplossing is het straffen van opportunisten. Voorts wordt een gewaagde toepassing van de Myerson waarde op de Nederlandse kabinets-formaties gepresenteerd.
Een eerdere column definieert instituties als een stelsel regels, dat de toelaatbare acties van actoren structureert. Een andere column voegt toe, dat instituties worden opgebouwd door actoren. Daarom zijn ze een vorm van zelf-controle (self-enforcing)1. Een organisatie kan worden opgevat als een corporatieve actor, en ook als een systeem van regels. In die laatste abstracte betekenis kan de organisatie worden gelijk gesteld aan een institutie, althans voor de individuen, die deel uitmaken van de betreffende organisatie. De Duitse socioloog Scharpf noemt de organisatie een institutionele omgeving (setting), evenals bijvoorbeeld een netwerk of een club2. Denk ook aan het huwelijk, of een religieus gebedshuis. De setting werkt in op de actie arena.
Aangezien instituties het gedrag meer voorspelbaar maken, scheppen zij stabiliteit. Idealiter ontstaat er een maatschappelijk evenwicht, ten minste op de korte termijn. Een deugdelijke institutie is redelijk bestand tegen maatschappelijke veranderingen3. Dankzij de stabiliteit kunnen de actoren strategisch (doelgericht) handelen. Soms is het resultaat van de gecombineerde strategieën een collectief actie probleem (afgekort CAP). De oplossing van een CAP vergt zelf weer nieuwe instituties. De speltheorie is nuttig om instituties te analyseren. Immers, zij definieert een stel spelregels, die de actoren, hun mogelijke strategieën en hun uitkomsten vastleggen. Het Nash evenwicht modelleert simpelweg een stabiele actie arena, in een redelijk duurzame maatschappij. Daarom is de zoektocht naar het Nash evenwicht maatschappelijke relevant4.
Hier is een ideologische kanttekening op haar plaats. Trouwe lezers van de Gazet weten, dat in de columns het mensbeeld zeker niet uitsluitend de homo economicus is, hoewel vaak wordt gebruik gemaakt van economische ideeën. Integendeel, regelmatig is de sociologie geraadpleegd, en het belang van de homo politicus is altijd erkend. Uw columnist vindt de richtingen-strijd tussen economen en sociologen zinloos, en streeft juist naar integratie5. Daarom analyseren de columns de instituties gewoonlijk met het actor-gerichte institutionalisme (afgekort AGI) of met de institutionele analyse en ontwikkeling (afgekort IAO). De actie arena of constellatie wordt steeds overkoepeld door de moraal. De inperking van gedrag door normen impliceert, dat de actoren niet meer geheel rationeel zijn. Dat feit botst met de speltheorie. Daarom meent uw columnist, dat een analyse altijd genuanceerd en relativerend moet zijn6.
De belangstelling van de Gazet voor de speltheorie is van recente datum. De eerste jaren verdiepten de columns zich vooral in de neoklassieke theorie, en in nutsmodellen, zoals die van Sam de Wolff. Uw columnist keert nu terug naar deze oude liefde, in een toepassing op zuiver publieke goederen. Er zal een verband worden gelegd tussen de benaderingen van de nutstheorie en van de speltheorie. In de speltheorie zijn de actoren onderling afhankelijk. Ieder kan zijn nut aansturen door zich te gedragen volgens een strategie, die is aangepast aan het gedrag van de anderen. In de niet-coöperatieve speltheorie is dat gedrag unilateraal. Hoewel elke actor rekening houdt met het nut van anderen, blijft zijn strategie uitsluitend gericht op de eigen behoeften. Er is geen automatische wederkerigheid, of wedijver, of enigerlei andere moraal7.
Het nu volgende betoog is een herformulering en uitbreiding van een zes jaren oude column over publieke goederen. Beschouw een actor k, die kan beschikken over een privaat goed en een zuiver publiek goed8. Zij c en g respectievelijk hun hoeveelheden, en p en q hun prijzen. Als de actor k beschikt over een inkomen yk, dan wordt zijn begroting gegeven door
(1) p × ck + q × gk = yk
Merk op, dat een zuiver publiek goed niet-exclusief is, zodat q geen marktprijs kan zijn. Vaak zal de staat voorzien in zo een publiek goed, en de productie kosten dekken via belastingen. Daarom zou men q de belasting prijs kunnen noemen9.
Een alternatieve interpretatie van q maakt gebruik van de grens van productie-mogelijkheden. Deze is weergegeven als een rode kromme in de figuur 1a, voor de hypothetische maatschappij met één privaat goed en één publiek goed. De vorm van de grenskromme wordt bepaald door de beschikbare productie-technologieën. De totale hoeveelheden van de twee typen goederen zijn respectievelijk C en G. De raaklijn aan de grenskromme wordt de marginale transformatie-voet MTV genoemd (marginal rate of transformation, of MRT)10. In wiskundige termen, er geldt MTV = -dC/dG. Merk op, dat de MTV verandert met G. Nu kan q/p gelijk worden gesteld aan de MTV. Dat wil zeggen, er geldt q = p × MTV 11. In deze vorm geeft q de marginale kosten weer van het publieke goed, uitgedrukt in de waarde van het private goed12.
Merk op, dat de actor k het publieke goed niet kan verwerven door een ruil-actie op de markt. De analyse met de Edgeworth box is hier niet bruikbaar. De actor k wil bij voorkeur, dat het publieke goed wordt geleverd door andere actoren. Dan kan hij zijn eigen begroting helemaal besteden aan de consumptie van private goederen, en daarmee zijn nut uk maximaal maken. Een ruil van private goederen voor publieke goederen is onzinnig. Hij zal alleen gk toevoegen aan het publieke goed, wanneer de anderen er in zijn beleving onvoldoende aan bijdragen. Dan is de maatschappelijke productie niet optimaal. Dat impliceert voor een bepaalde nutswaarde uk de eis -(∂uk/∂gk) / (∂uk/∂ck) > q/p. Dankzij de toevoeging neemt de totale hoeveelheid G van het goed toe, en C neemt af. Deze ingreep verandert de maatschappelijke productie. Er wordt overgestapt op een meer efficiënte productie-technologie.
Stel dat de actor k een nut uk(G, ck) heeft van zijn consumptie. Hierin is G de beschikbare hoeveelheid publieke goederen. Bij n actoren is G = Σk=1n gk, zodat elke actor een bijdrage gk levert aan G. Een indifferentie kromme van de actor k heeft de vorm uk = constant. Veronderstel bovendien, dat de hypothetische maatschappij bestaat uit twee actoren (n=2). Enkele indifferentie krommen van de actor k=1 zijn ingetekend in de figuur 1a, in groen. Een column van ruim zes jaren terug legt uit, dat de helling van een indifferentie kromme van actor k=1 wordt gegeven door de marginale substitutie verhouding MSV(1). De MSV drukt uit, hoeveel eenheden van het private goed de actor k=1 wil opgeven om een extra eenheid van het publieke goed te krijgen.
Stel dat de staat uit overwegingen van beleid het nut van de actor 1 vastlegt op het niveau van de dikke indifferentie kromme in de figuur 1a. Dit perkt de private consumptie van de actor k=2 in. Immers, weliswaar kunnen beide actoren gebruik maken van dezelfde hoeveelheid G, omdat het een publiek goed is. Maar dat geldt niet voor het private goed C, want dat is exclusief. Daarvan kan de actor 2 nog slechts c2 = C − c1 consumeren. Deze consumptie is het gebied, dat in de figuur 1a is ingeklemd tussen de grenskromme van de productie mogelijkheden en de dikke indifferentie kromme van de actor 1. De functie c2(G) is getekend in de figuur 1b, eveneens in rood. Zij wordt de restant (leftover) kromme genoemd13. De figuur 1b toont bovendien enkele indifferentie krommen van de actor 2, in blauw.
In deze situatie mag de actor 2 zijn nut u2 maximaal maken, door de staat te vragen om een optimale hoeveelheid Go. Het optimum wordt bepaald door de indifferentie kromme van 2 (in dik blauw), die nog juist raakt aan de restant kromme. Het punt (Go, c2(Go)) realiseert de Pareto efficiëntie. In het raakpunt hebben de indifferentie kromme en de restant kromme dezelfde helling. De helling van de indifferentie kromme is weer de MSV, nu voor actor k=2. De helling van de restant kromme is dC/dG − dc1/dG, en dit is juist -MTV + MSV(1). Aldus leidt de eis van efficiëntie tot
(2) MTV = MSV(1) + MSV(2) = Σk=12 MSV(k)
De formule 2 blijkt ook geldig te zijn voor n>2. Zij wordt de voorwaarde van Samuelson voor maatschappelijke efficiëntie genoemd14. Dezelfde voorwaarde is ook afgeleid in een column van ruim zes jaren terug. Maar die afleiding geldt enkel voor een quasi-lineair nut uk. Merk op, dat de staat met de keuze van de dikke indifferentie kromme voor actor 1 heeft gekozen voor een bepaalde maatschappelijke verdeling. De staat had ook een ander nut kunnen geven aan k=1 (bijvoorbeeld minder), en dat zou leiden tot een ander optimaal punt Go. Ook actor k=2 zou een ander nut hebben (bijvoorbeeld meer). De verdeling en de efficiëntie zijn dus gekoppeld aan elkaar. Merk voorts op, dat elke eenheid van het publieke goed aan beiden ten goede komt, omdat het niet rivaliserend is. Aangezien echter de MSV(k) daalt met G, willen de beide actoren per se ook iets van het private goed consumeren.
De figuur 1a-b laat zien, dat de begroting van de formule 1 niet de hele consumptie van de actor k bepaalt15. Immers, hij kan ook de publieke goederen consumeren, die worden betaald door andere actoren. Duidt die hoeveelheid goederen aan als G-k (let op de min). Er geldt natuurlijk G-k = G − gk. Dan wordt de reële begroting van k
(3) p × ck + q × G = yk + q × G-k = Rk
De grootheid Rk wordt het volledige inkomen genoemd16. Merk echter op, dat de actor k zijn fonds q × G-k niet kan gebruiken om extra private goederen te kopen. De consumptie G-k is verplicht. Hij kan natuurlijk wel zijn eigen bijdrage gk verminderen. De figuur 2a toont nogmaals de indifferentie krommen van de actor k, waarin nu enkele begrotings-lijnen volgens de formule 3 zijn getekend (in rood)17. Stel, dat het volledige inkomen Rk is gegeven als ρ (constant). De figuur 2a laat zien, dat de actor zijn nut uk maximaal kan maken door de indifferentie kromme juist te laten raken aan deze begrotingslijn. In dat optimum (Go, ck,o) met nut uo is zijn MSV(k) gelijk aan q/p. Alle andere punten op Rk=ρ geven een lager nut. De indifferentie kromme uk = uo snijdt elke andere lijn Rk>ρ op twee punten. Deze punten liggen links en rechts van het optimum G=G0. De zwarte kromme in de figuur 2a is het optimale groeipad.
De indifferentie krommen van de figuur 2a kunnen ook worden getekend in het (gk, G-k) vlak. Blijkens de formule 3 moet daarvoor een beperking worden opgelegd, namelijk dat het inkomen yk is gegeven. Dat beperkt tevens de bijdrage van actor k aan G tot gk < yk/q. Beschouw de indifferentie kromme uk = uo uit de figuur 2a. De minimale waarde van Rk op deze kromme is ρ, en dan is G-k = (ρ − yk)/q en gk,o = Go − G-k 18. Voor grotere waarden Rk>ρ moet G-k gelijk mee-stijgen. Op de indifferentie kromme (uo) in het (G, ck) veld van de figuur 2a is er bij elke Rk één G<Go, en één G>Go. In het (gk, G-k) veld van de figuur 2b wordt dat gk = G − G-k. Daarom krijgt de indifferentie kromme (uo) er de vorm van de figuur 2b (in blauw)19. Men kan dezelfde methode van constructie toepassen op alle indifferentie krommen. Het optimale groeipad blijkt dan steeds het dal van zo een kromme te kruisen. Zie de zwarte kromme in de figuur 2b.
De figuur 2b maakt het mogelijk om het Nash evenwicht te bepalen van de bijdragen aan het publieke goed, in een maatschappij met twee actoren (n=2). Namelijk, het zwart getekende groeipad is feitelijk de (beste) reactie kromme van de actor k, omdat hij zijn keuze van gk baseert op de aangeboden hoeveelheid G-k 20. Stel k=1. In een maatschappij met n=2 moet G-1 gelijk zijn aan g2. Dat maakt het mogelijk om de indifferentie krommen van de actor 2 te tekenen in de figuur 2b 21. Het (g2, g1) veld van de actor 2 moet simpelweg worden gespiegeld in de lijn g1 = g2 van de figuur 2b. Dit is gedaan in de figuur 3a, waar de indifferentie krommen van de actor 2 groen zijn ingetekend. De reactie kromme van actor 2 is eveneens weergegeven als een zwarte kromme. Het Nash evenwicht wordt gegeven door het snijpunt van de twee reactie krommen, en is weergegeven als een dikke rode punt.
Het is direct duidelijk, dat het gevonden Nash evenwicht niet Pareto optimaal is. Immers, beschouw de indifferentie krommen van de actoren 1 en 2, die het Nash evenwicht doorsnijden. Deze twee krommen omsluiten rechts-boven het evenwicht een verzameling van punten (g1, g2), die een hoger nut beloven aan beide actoren. In de Edgeworth box wordt zo een ingesloten gebied een oog genoemd22. Pareto efficiëntie vereist, dat de twee indifferentie krommen elkaar juist raken in het desbetreffende punt. Immers dan is er geen ingesloten verzameling van punten met een hoger nut meer. Het pad van Pareto optimale allocatie wordt in de figuur 3a getoond als de rode kromme. Merk op, dat het Nash evenwicht ontstaat door unilateraal aanpassend gedrag. Anderzijds vereist de realisatie van het Pareto optimum een bilaterale onderhandeling, zonder compenserende betalingen (side payments).
Een maatschappij met n=2 actoren kan diverse evenwichten van bijdragen aan het collectieve goed hebben23. Dat is geïllustreerd in de figuur 3b, waar de reactie kromme van de actor 1 (blauw) diverse snijnpunten heeft met de reactie kromme van de actor 2 (groen). Alleen de twee evenwichten aan de uiteinden zijn stabiel. Het middelste punt is instabiel, omdat het minder aantrekkelijk is dan de evenwichten aan de uiteinden voor één van de twee actoren.
De huidige paragraaf zal laten zien, dat het gevangenen- en chicken-spel kunnen worden vertaald in een nutsveld (g1, g2) 24. In het spel is de strategie-keuze van elke actor discreet. De actor k kan kiezen uit niet of wel een eenheid van het publieke goed bijdragen. Dit correspondeert met gk = 0 of 1, met k=1 of 2. De instituties van het spel zijn star en laten niet toe om bijvoorbeeld een kwart van de totale kosten bij te dragen. Bovendien is het spel helemaal symmetrisch in de beide actoren. De strategieën van de actoren leiden tot uitkomsten met een bepaald individueel nut. Gemaks halve worden de nutswaarden van deze spellen ordinaal uitgedrukt, waarbij een oplopend nut wordt aangegeven door u = 1, 2, 3 en 4. De lezer zij verwezen naar een eerdere column voor de twee 2×2 spel-matrices.
Beschouw allereerst het gevangenen-spel. Het Nash evenwicht is u = (2, 2). Dat evenwicht is sub-optimaal, omdat het wordt gedomineerd door de uitkomst met nut u = (3, 3). De uitkomsten met nutten u = (3, 3), (1, 4) en (4, 1) zijn allemaal Pareto optimaal. Al deze eigenschappen zijn vastgelegd in het nutsveld, dat is weergegeven in de figuur 4a. 25. Alleen het nutsveld van de actor 1 is ingetekend. Het nutsveld van de actor 2 kan worden verkregen door een spiegeling in de as g1 = g2. Immers, het spel is symmetrisch. Dankzij de spiegeling verwisselen de g1- en g2-assen van plaats. Zie de figuur 3b. De blauwe krommen zijn het indifferentie veld van k=1.
De zwarte kromme is het beste reactie pad van de actor 1. Het loopt als het ware over de kam van de nutsberg van de actor 1. Het groene punt is het Nash evenwicht, waar de twee reactie krommen elkaar snijden. Merk op, dat afgezien van dit ene punt het reactie pad helemaal in het gebied ligt, waar één van de gk negatief is. Die reacties zijn dus practisch onmogelijk. De rode kromme is het pad van Pareto optimale allocatie. Op deze kromme raken de indifferentie krommen van de twee actoren elkaar26. Dit vereist een besluit via een onderhandeling, waarbij de beide nutten worden meegewogen27.
Beschouw vervolgens het lafaard (chicken) spel. Er zijn twee Nash evenwichten, te weten u = (2, 4) en (4,2). Zij zijn Pareto optimaal, evenals het punt u = (3, 3). Bovendien kunnen de actoren een Nash evenwicht bereiken, wanneer zij een gemengde strategie hanteren, waarbij ieder met een kans van ½ wel of niet een eenheid van het publieke goed bijdraagt. Dat evenwicht heeft als uitkomst u = (5/2, 5/2), en is dus niet Pareto optimaal28. Het lafaard spel kan niet eenvoudig worden vertaald naar een nutsveld. Immers, de figuur 2b laat zien, dat op de reactie kromme van de actor 1 diens MSV gelijk moet zijn aan nul (horizontaal). In het gecombineerde nutsveld van de figuur 3a is op de reactie kromme van de actor 2 diens MSV oneindig (verticaal). Dien ten gevolge staan in het evenwicht, waar de twee reactie krommen elkaar kruisen, de indifferentie krommen loodrecht op elkaar.
Anderzijds is zonet aangetoond, dat op het pad van de Pareto optimale allocatie die indifferentie krommen aan elkaar moeten raken. De MSV van de twee actoren moeten gelijk zijn. Daarom kan er worden geconcludeerd, dat in de gepresenteerde nuts-analyse een Nash evenwicht nooit Pareto optimaal kan zijn!29 Kennelijk kunnen actoren, die hun eigen nut maximaal maken, geen maatschappelijke optimaliteit bereiken. In de speltheorie lukt dat wel, omdat de spelregels enkel een discrete keuze toestaan aan de actoren, te weten: een eenheid van het publieke goed bijdragen, of helemaal niets. Dan is de vrije keuze van de twee actoren institutioneel ingeperkt30. De figuur 4b geeft de situatie grafisch weer. Alleen het nutsveld van de actor 1 is ingetekend. Het nutsveld van de actor 2 kan worden verkregen door spiegeling. De blauwe krommen zijn het indifferentie veld.
De zwarte kromme is het beste reactie pad van de actor 1. De drie groene punten zijn de Nash evenwichten, waar de twee reactie krommen elkaar snijden. De rode kromme is het pad van Pareto optimale allocatie. Het nutsveld is hier zodanig getekend, dat het beste-reactie pad beneden het pad van Pareto optimaliteit ligt. Dat geldt dan eveneens voor de Nash evenwichten. De strijdigheid tussen de speltheorie en de nutstheorie kan op twee manieren worden uitgelegd. Ten eerste, wegens de institutionele inperking door de spelregels zou het pad van echte Pareto optimaliteit niet bereikbaar kunnen zijn. De discrete uitkomsten van het spel zijn niet meer dan evenwichten. Of, ten tweede, de institutionele beperking van het spel zou de actoren kunnen dwingen om een discreet Pareto optimaal punt te kiezen. Zij kiezen het optimum, dat zich het dichtst bij hun evenwicht bevindt. Dat optimum is een kunstmatig evenwicht. De figuur 4b beeldt deze tweede uitleg af31.
Het is boeiend om te zien, dat de verschillende kosten-baten afweging van de actoren in de twee spellen leidt tot een totaal ander nutsveld. Hoewel het publieke goed zelf in beide spellen geen verschil vertoont, komen de actoren tot een totaal ander gedrag. In het gevangenen-spel weigert de actor om bij te dragen aan het goed. In het lafaard spel zal hij enkel weigeren, zolang de andere actor wel (voldoende) bijdraagt. Die strategie verschuift zijn nutsberg naar (relatief ten opzichte van het gevangenen-spel) grotere bijdragen aan het publieke goed. Overigens ziet uw columnist nog geen practische toepassing van dit nieuwe inzicht32.
In de realiteit komen actie arena's of constellaties met n=2 actoren veel voor. Maar vaak zijn er meer dan twee actoren betrokken bij de collectieve actie. Gelukkig kan men ook zulke spellen vrij eenvoudig modelleren. Als voorbeeld wordt het spel van het gevangenen dilemma met n actoren beschouwd33. De tabel 1 geeft de uitkomsten in de normale vorm, als een 2×n matrix. De bekende notatie wordt gehanteerd. De strategie s' is bijdragen aan het publieke goed, en s'' is niet bijdragen. De baten van een eenheid van het publieke goed zijn b, en de kosten zijn c. Er geldt b < c < 2×b. De aggregatie technologie is sommatie. De actor k=1 moet kiezen tussen de strategie s' en s''. In de tabel dragen m van de n−1 overige actoren bij aan het goed.
m | 0 | 1 | 2 | 3 | n − 1 | |
---|---|---|---|---|---|---|
actor 1 | s' | b − c | 2×b − c | 3×b − c | 3×b − c | n×b − c |
s'' | 0 | b | 2×b | 3×b − c | (n−1) × b |
De actor k=1 behaalt betere resultaten met strategie s'' voor alle waarden van m. Hij zal dus niet bijdragen aan het publieke goed. Maar aangezien het spel symmetrisch is voor alle actoren, zal dan geen enkele actor bijdragen (m=0). Allen verkiezen de strategie s''. Dan is in het Nash evenwicht het netto nut gelijk aan uk = 0 voor alle k=1, ..., n. Dit is (natuurlijk) hetzelfde resultaat als voor n=2. Des al niettemin wordt het maatschappelijke optimum gegeven door de collectieve keuze voor bijdragen, te weten uk(s') = n×b − c. Immers, dit nut is groter dan het nut van 0 in het evenwicht.
Een interessant geval doet zich voor, wanneer de aggregatie technologie een drempel heeft34. Dat wil zeggen, er geldt uk=0 voor alle actoren, zolang het aantal m van bijdragende actoren (met strategie s') niet de drempel overschrijdt. Beneden de drempel zijn geen baten, maar ook geen kosten c. Zodra de drempel is bereikt, is het nut weer net zoals in de tabel 1. Een voorbeeld is een groep gemeenten, die tezamen een bosbrand willen bestrijden. Men heeft een minimum aantal brandweer corpsen nodig om de brand te kunnen uitdoven. De drempel kan institutioneel worden vastgelegd. Dat wil zeggen, zij kan behoren tot de spelregels van de maatschappelijke constellatie. Stel dat de drempel ligt bij m=3. Dan geeft de tabel 2 de uitkomsten matrix.
m | 0 | 1 | 2 | 3 | n − 1 | |
---|---|---|---|---|---|---|
actor 1 | s' | 0 | 0 | 3×b − c | 4×b − c | n×b − c |
s'' | 0 | 0 | 0 | 3×b | (n−1) × b |
Blijkens de tabel 2 loont het voor de actor k=1 om bij te dragen in de situatie met m=2. De situatie, waarin drie actoren bijdragen, is een Nash evenwicht. Zodra drie actoren hebben bijdragen, wordt weer de beste uitkomst verkregen door niet bij te dragen. Een dergelijk evenwicht wordt mogelijk gerealiseerd, wanneer de n actoren achter eenvolgens (sequentieel) hun strategie bekend maken. Dan zullen precies drie actoren kiezen voor s'. Als de eerste actoren slim zijn, dan kiezen zij toch voor de strategie s''. In dat geval moeten de laatste drie actoren de bijdragers zijn. Zij worden voor het blok gezet door hun voorgangers, en kunnen redelijker wijze niet meer kiezen voor s''. Nochtans is op deze manier het aantal bijdragen gestegen ten opzichte van de situatie in de tabel 1 (zonder drempel). Instituties kunnen daadwerkelijk helpen.
Volledigheids halve toont de figuur 5a-d de marginale baten b(m) als functie van het aantal contribuanten m, bij in totaal n actoren35. Als wordt aangenomen, dat n groot is, dan heeft b(m) een continu verloop. In alle gevallen is b(m) een stijgende functie van m. De reden is natuurlijk de niet-rivaliteit van zuiver publieke goederen. Het gaat om meer productie, en niet om een stijgende efficiëntie van productie. Ter vergelijking zijn de marginale baten ingetekend van een privaat goed, als groene stippellijn. Elk van de panelen representeert een bepaalde constellatie. De figuur 5a geldt voor het gevangenen spel, en beeldt de onderste rij in de tabel 1 af. Dit verband is al getoond in een eerdere column, bij de presentatie van het model van Elster36. De figuur 5b is het gevangenen spel met een drempel, en beeldt de onderste rij van de tabel 2 af. Hier zijn de marginale baten b(m) een stapfunctie.
De figuur 5c toont marginale baten met een afnemende groei. Dit correspondeert met een beste-poging technologie. De behoeften zijn al redelijk vervuld, wanneer slechts enkele actoren bijdragen (lage m). Voor n=2 heeft men een lafaard (chicken) spel. De figuur 5d toont marginale baten met een toenemende groei. Dit is verwant aan de zwakste-schakel technologie. Naarmate meer zwakkere schakels worden verwijderd, nemen de baten sterk toe. Voor n=2 heeft men een verzekerings-spel37. Enkele practische voorbeelden van aggregatie technologieën zijn: (i) bescherming van de ozon laag (sommatie); (ii) inperking van een biologische plaag (zwakkere schakel); (iii) ontdekking van nieuwe anti-biotica (betere poging)38.
Een eerdere column heeft laten zien, dat een zuiver publiek goed uitnodigt tot zwart rijden (free riding). Het heeft noch rivaliteit, noch uitsluitbaarheid. Stel, dat het goed een sommatie technologie van aggregatie heeft. De betaling van het publieke goed is dan een collectief actie probleem (afgekort CAP) van de eerste orde. Dit is het zonet beschreven spel van het gevangenen dilemma. Dit probleem kan worden opgelost door inspectie en handhaving. Daardoor kunnen parasitaire actoren worden gestraft. Deze paragraaf zal een eenvoudig model van straffen presenteren. Het uitgangspunt is een constellatie met n actoren, waarvan m (<n) besluiten om bij te dragen aan het publieke goed. Elke van de m actoren levert een eenheid goed met baten b, en maakt daarvoor kosten c. Er geldt b < c < 2×c, zodat alleengang (m=1) niet loont voor de actor, maar levering met meerderen (m≥2) wel. Immers de geaggregeerde baten zijn m×b.
Voor een homo economicus heeft bijdragen een marginaal nut uk(m) = m×b − c, en zwart rijden leidt tot uk(m) = m×b 39. Noem deze strategieën respectievelijk s' en s''. Dan is zwart rijden (s'') de dominante strategie De nuts-lijnen als functie van m zijn weergegeven door de stippel-lijnen in de figuur 6a-b, in rood voor s' en in groen voor s''. Stel nu, dat de actoren van de s' groep besluiten om elke actor van de s'' groep wegens zijn gedrag te disciplineren met een vaste intensiteit (inspanning) ε. De inspanning produceert een boete λ(ε, m) per actor in de s'' groep. Daarvoor moet elke actor uit de s' groep kosten maken ter grootte van γ(ε, m). Uitgedrukt als formule scheppen de m actoren in de s' groep een (marginale) nut voor de actor k ter grootte van40
(4a) uk(s', m) = m × b − c − γ(ε, m)
(4b) uk(s'', m) = m × b − λ(ε, m)
Als er geldt λ > c, dan hebben actoren uit de s'' groep een prikkel om ook bij te dragen. Merk op, dat hierbij een CAP van de tweede orde ontstaat, omdat een actor in de groep s' het straffen ervaart als een last γ. Hij heeft een prikkel om zelf niet te straffen, en zwart te rijden binnen zijn eigen groep. Er zijn twee oplossingen voor dit CAP. Ten eerste kan de staat proberen om alle homines economici te heropvoeden. Dan verdwijnt het eerste orde CAP, en is straffen onnodig. Hij kan hen aanmoedigen om zich te gedragen als een homo sociologicus Een eerdere column heeft laten zien, dat voorbij het kantel (tipping) punt m* elke massa-mens dezelfde voorkeuren en strategie (zoals s') hanteert. Ten tweede kan de staat de actoren aanmoedigen om zich te gedragen als een homo politicus (of identiteits-bewaker). Deze heeft een interne voorkeur voor een bepaalde strategie (zoals s'). Die strategie geeft hem vanzelf een nut β. Hier is β>c vereist.
Nochtans is denkbaar, dat sommige van de homines economici zich onverbeterlijk tonen. In dat geval moet de staat het tweede orde CAP oplossen. Opnieuw moet de staat actoren aanmoedigen om zich te gedragen als homo sociologicus (massa-mens) of homo politicus (identiteits-bewaarder). Veronderstel, dat deze poging succes heeft bij een flink deel van de bevolking. Nu moet de staat hen bovendien aansporen om de resterende homines economici te bestraffen voor hun opportunistische gedrag. In deze constellatie betekent het voor de homo politicus, dat de interne (morele) baten moeten voldoen aan β > c+γ. Als de homo economicus een voldoende hoge boete krijgt opgelegd, dan zal hij vanzelf kiezen voor bijdragen aan het goed (strategie s').
Het is interessant om te filosoferen over de vorm van de functies λ en γ. De econoom W.D. Ferguson stelt voor om ook de kosten γ constant te nemen (naast de inspanning ε per boete)41. Dat heeft het voordeel, dat de actor in de s' groep zijn kosten voor straffen kent (onafhankelijk van m). Maar het betekent allerminst, dat ook λ constant is. Immers, er zijn m actoren in de s' groep en n − m actoren in de s'' groep. Daarom moet een straf met geaggregeerde intensiteit m×ε worden verdeeld over n − m subjecten. Dit impliceert dat geldt λ = m×ε / (n−m). De figuur 6a toont het verloop van de marginale nutsfuncties uk(s', m) en uk(s'', m) als functie van m. Er treedt een kantelpunt op bij uk(s', m) = uk(s'', m). Men rekent simpel uit, dat geldt
(5) m* = n × (1 − ε / (c + γ + ε))
Het kantelpunt ligt laag, wanneer ε groot is, terwijl c en γ laag blijven. Voor m boven het kantelpunt is de homo economicus zelfs bereid om anderen te straffen. Zou hij dat niet doen, en voortaan slechts c bijdragen aan het goed, dan is hij nog altijd een parasiet. Merk op, dat voorbij het kantelpunt de actoren in de s'' groep steeds zwaarder worden gestraft. Homines politici, die een intern nut β ontlenen aan de strategie s'', zouden hiervan het slachtoffer kunnen worden. Hun last wordt dermate zwaar, dat tenslotte de maatschappelijke welvaart W = m × uk(s', m) + (n−m) × uk(s'', m) er onder lijdt42. Daarom doet uw columnist een ander voorstel voor γ, namelijk γ = (n−m) × a×ε, met a<1 een constante. Immers, nu heeft de boete per subject een geaggregeerde intensiteit van λ = m×ε, zodat de boete in de s'' groep simpelweg hun baten b van het goed verlaagt met ε. De figuur 6b toont het verloop van uk(s', m) en uk(s'', m). Het kantelpunt ligt bij
(6) m* = n × (c/n + a×ε) / ((a+1) × ε)
Het kantelpunt is relatief laag, wanneer ε groter is dan c/n. In dit geval is het probleem, dat voor kleine waarden van m elke actor in de s' groep hoge kosten moet maken om te straffen. In dat bereik wordt de maatschappelijke welvaart W onwenselijk laag. Het geeft een grote prikkel aan de s' groep om zwart te rijden bij het straffen. Dit wettigt de conclusie, dat bij lage waarden van m de kosten γ het beste constant kunnen worden gehouden (figuur 6a). Bij hogere waarden van m (zeg, voorbij het kantelpunt) is het beter om de kostenfunctie γ van uw columnist (figuur 6b) te hanteren. Het is niet per se billijk om de resterende homines politici, die hechten aan strategie s'', materieel of maatschappelijk te ruïneren.
De huidige paragraaf illustreert duidelijk, dat in de practijk de actoren gemengde motieven moeten hanteren43. Hun actor-model is meerzijdig. De actor maakt een kosten-baten analyse m×b−c, als homo economicus. Maar het CAP is enkel oplosbaar, wanneer vele actoren tevens een homo sociologicus zijn en/of een homo politicus. De homo sociologicus is een massa-mens, die extern kan worden geprikkeld om bij te dragen aan het publieke goed. Desnoods is de massa-mens ook bereid om het opportunistische gedrag van homines economici af te straffen. De homo politicus heeft het voordeel, dat hij intern is gemotiveerd. Ook hij is bereid tot straffen. Het doel van straffen en beboeten is om een ruim aanbod van het publieke goed te realiseren, wat gunstig is voor de kosten-baten balans. Echter straffen vernietigt nut, zowel bij de s' groep als de s'' groep. Daarom moet per geval worden bekeken, wat het optimale niveau van uitgaven γ voor bestraffing is.
In enkele eerdere columns is de coöperatieve speltheorie toegepast om de nationale verkiezing van 1977 te analyseren44. Zowel de Shapley waarde als de Myerson waarde zijn uitgerekend voor de drie betrokken politieke partijen, te weten het CDA, de PvdA en de VVD. Het bleek, dat indertijd de PvdA haar macht overschatte, zeker wanneer de centrale positie van het CDA wordt meegewogen. Kennelijk is de Shapley waarde een handig instrument voor zulke analyses. De huidige paragraaf past dezelfde methode toe om de nationale verkiezingen van 1982, 1994, 2003, 2006 en 2017 te analyseren. Op die manier kan een schatting worden gemaakt van de kansen van de diverse partijen tijdens de kabinets-formatie. De figuur 7 toont de belangrijkste partijen in ieder van die formaties. De partijen zijn primair geselecteerd, omdat zij indertijd gewoon de meeste stemmen kregen. Men ziet, dat de selectie verschilt per constellatie.
Soms raakten onverwacht tamelijk kleine partijen betrokken bij de formatie, omdat de toegang van andere, wat grotere partijen om ideologische redenen werd geblokkeerd. Dat blijkt ook uit de onderlinge contacten. De rode verbindings-lijnen geven de affiniteit van de partijen weer. Zij is mede afgeleid uit de stellingname tijdens de formatie-besprekingen. Vaak is de affiniteit ideologisch. Bijvoorbeeld onderhouden de VVD en de SP nauwelijks contact, zodat een derde partij nodig is als bemiddelaar. Maar de affiniteit kan ook een gevolg zijn van de verkiezings-uitslag, namelijk, wanneer die duidelijk dringt in de richting van een bepaald kabinet. Dat maakt de affiniteit opportunistisch en dynamisch. Ook de wens om het aantal partijen k in het kabinet laag te houden schept affiniteit. Uw columnist geeft meteen toe, dat zijn keuze van affiniteiten subjectief is. Nochtans wordt de Myerson waarde erdoor bepaald, omdat die de structuur van het netwerk meeweegt45.
De uitslagen van de verkiezingen zijn vermeld in de tabel 3, als fractie van het totaal aantal zetels in de tweede kamer. Een kabinet heeft een meerderheid met meer dan de helft van alle zetels. De kolom met kop "1/k" geeft aan, welke partijen in het kabinet komen. De getalswaarde is 1/k, waarbij k het aantal partijen in het kabinet is. De kolom met kop ζ(Sh) toont de Shapley waarde voor de betrokken partijen. Zij wordt berekend met een coalitie-functie ν(C), die ν=1 is voor coalities C met een parlementaire meerderheid, en ν=0 is voor alle andere coalities. Deze Shapley waarde telt winnende coalities, en niet het aantal zetels. Partijen, die uw columnist meent te moeten weglaten in zijn model, kunnen natuurlijk geen invloed hebben op de hier berekende Shapley waarde. De waarde ζ negeert de netwerk-structuur van de figuur 7. De Myerson waarde μ brengt die wèl in rekening.
jaar | 1982 | 1994 | 2003 | 2006 | 2017 | |||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
actor | zetels | 1/k | ζ(Sh) | μ(My) | zetels | 1/k | ζ(Sh) | μ(My) | zetels | 1/k | ζ(Sh) | μ(My) | zetels | 1/k | ζ(Sh) | μ(My) | zetels | 1/k | ζ(Sh) | μ(My) |
CDA | 0.300 | 0.5 | 0.33 | 0.50 | 0.227 | - | 0.25 | 0.08 | 0.280 | 0.33 | 0.33 | 0.58 | 0.273 | 0.33 | 0.33 | 0.47 | 0.127 | 0.25 | 0.18 | 0.10 |
VVD | 0.240 | 0.5 | 0.33 | 0.50 | 0.217 | 0.33 | 0.25 | 0.42 | 0.187 | 0.33 | 0.17 | 0.08 | 0.147 | - | 0.17 | 0.02 | 0.220 | 0.25 | 0.32 | 0.38 |
PvdA | 0.313 | - | 0.33 | 0.00 | 0.247 | 0.33 | 0.25 | 0.42 | 0.293 | - | 0.33 | 0.25 | 0.220 | 0.33 | 0.23 | 0.47 | 0.060 | - | 0.07 | 0.02 |
D66 | - | - | - | - | 0.160 | 0.33 | 0.25 | 0.08 | 0.040 | 0.33 | 0.17 | 0.08 | - | - | - | - | 0.127 | 0.25 | 0.18 | 0.10 |
SP | - | - | - | - | - | - | - | - | - | - | - | - | 0.167 | - | 0.17 | 0.02 | 0.093 | - | 0.10 | 0.05 |
GL | - | - | - | - | - | - | - | - | - | - | - | - | 0.047 | - | 0.05 | 0.02 | 0.093 | - | 0.10 | 0.29 |
CU | - | - | - | - | - | - | - | - | - | - | - | - | 0.040 | 0.33 | 0.05 | 0.02 | 0.033 | 0.25 | 0.07 | 0.03 |
De kabinets-formatie van 1982 is de enige in de figuur 7, die een partij isoleert, namelijk de PvdA. De PvdA toonde in het kabinet Van Agt II veel vechtgedrag, en de positie van haar partijleider (Den Uyl) stond intern ter discussie. Daarom kwam zij na de verkiezingen niet aan bod tijdens de formatie. De VVD scoorde goed in de verkiezingen, zodat een kabinet van CDA en VVD voor de hand lag. De Shapley waarde ζj van partij j is hier louter hypothetisch, wegens het isolement van de PvdA46. Het netwerk tijdens de formatie is een dyade, zodat de Myerson waarde μj hier een uitstekende maat is voor de reële constellatie. Het politieke leven van toen was niet eenvoudig, maar wel duidelijk. De uitkomst is natuurlijk slecht voor de PvdA, die toch de grootste partij was47.
Wim Kok heeft geprobeerd om de PvdA in sociaal-liberale richting te sturen. Dit had het voordeel, dat de politieke polarisatie verminderde. Hoewel in 1994 alle grote politieke partijen goede contacten onderhielden, ook de PvdA en VVD, suggereert het netwerk in de figuur 7 toch enige polarisatie. De reden is, dat D66 hechtte aan de vorming van een Paars kabinet, en daarom de facto weigerde een coalitie met het CDA te vormen. Ook verwierp het CDA de vorming van een centrum-links kabinet. Daarom zijn in het netwerk de verbindingen D66 − VVD, CDA − PvdA en natuurlijk ook D66 − CDA weggelaten. De Shapley waarde van elke partij j is ζj = 0.25, wat redelijk overeenkomt met het egalitaire verkiezings-resultaat. Maar wegens het gepolariseerde netwerk is de Myerson waarde voor de PvdA en VVD ieder hoog. Voor D66 en het CDA blijft dan weinig over. En inderdaad mislukte de formatie van Paars bijna48.
De kabinets-formatie van 2003 had een merkwaardig verloop. Het PvdA en CDA waren de grote winnaars, en zouden eigenlijk een coalitie moeten vormen. Maar hun formatie-poging mislukte. Opnieuw greep de PvdA mis. Ter linkerzijde van de PvdA waren Groen Links en de SP allebei groter dan D66. Op rechts was de LPF groter dan D66. Maar de ideologie van links blokkeerde de toegang tot de formatie, en de LPF was intussen een politieke paria geworden. Daarom ontbreken GL, de SP en de LPF voor 2003 in de figuur 7 en de tabel 3. Dat heeft effect op ζ. Het kleine D66 kreeg een spilpositie. Aangezien het animo voor Paars intussen was gedoofd, besloten D66 en de VVD tot een coalitie met het CDA. Het verloop van de formatie laat zien, dat per saldo het CDA steeds centraal staat. Dit blijkt niet uit de Shapley waarde, maar wel uit de Myerson waarde, voor de getekende netwerk structuur. Zie de tabel 3. Alle paden liepen via het CDA.
De kabinets-formatie van 2006 wordt gedicteerd door de uitslag van de verkiezingen. Hier was de SP de grote winnaar, en de VVD boekte juist een matig resultaat. Maar zoals de figuur 7 illustreert, had de SP geen directe verbinding met het CDA. Daarom was het CDA onwillig om de SP toegang te geven tot de formatie. Daarop blokkeerde de PvdA de toegang van de VVD. Aldus vormde tenslotte de coalitie van CDA, PvdA en de Christen Unie. Groen Links en de PVV waren ieder groter dan de CU. Maar de PVV is een politieke paria, en Groen Links had evenmin als de SP een directe verbinding met het CDA. Blijkens de tabel 3 zijn de Shapley waarden voor het CDA en de PvdA tamelijk groot. De figuur 7 toont een links en een rechts blok, met de PvdA en het CDA als woordvoerders. Wegens deze constellatie hebben beide partijen zeer grote Myerson waarden. De CU werd verkozen als partner vanwege haar plooibaarheid.
In de verkiezingen van 2017 zet de electorale fragmentering door. De val van de PvdA is dramatisch. De VVD heeft zich goed gehandhaaft, en blijft de grootste partij. De figuur 7 laat zien, dat Groen Links de nieuwe spreekbuis van het linkse blok wordt. De partijtop heeft intussen een redelijk contact met de VVD, waardoor GL prominent aanwezig is in de formatie besprekingen. Zie de vrij grote μ van GL in de tabel 3. Maar de partij-basis volgt haar leiding niet, zodat GL tenslotte toch afhaakt. Natuurlijk zijn er feitelijk meer verbindingen dan de figuur 7 weergeeft. Bijvoorbeeld onderhouden D66 en GL een goed contact. Inderdaad is een centrum-linkse coalitie in beginsel mogelijk. Echter zo een coalitie zou moeten bestaan uit tenminste zes partijen, en is dan lastig te besturen. Daarom kunnen in deze constellatie de verbindingen D66 − GL, PvdA − CDA en dergelijke, worden genegeerd. Uiteindelijk vormt de coalitie van VVD, CDA, D66, en CU.
De reken-exercitie van de tabel 3 heeft vooral het doel om de toepasbaarheid van de Shapley en Myerson waarden te illustreren. Voor de Shapley waarde ζ moet men simpelweg alle winnende coalities tellen. Dat maakt de berekende waarde van ζ tamelijk nauwkeurig, al beschouwt de tabel niet alle bestaande partijen. Wegens deze omissie blijkt ζj gewoonlijk iets boven het stemmen-percentage van de partij j te liggen. Nochtans is ζj ook bij een volledige berekening nooit identiek aan de stembus-uitslag van partij j. Een winnende coalitie moet slechts de drempel van 50% overschrijden, en niet per se de grootste geaggregeerde uitslag hebben. Des al niettemin is formeren meer dan het tellen van winnende coalities. Men moet rekening houden met de partij-verhoudingen. Hier komt de Myerson waarde μ te hulp.
De netwerken in de figuur 7 zijn een poging om de gecombineerde gevolgen van ideologie, stembus-uitslag, en practische bestuurbaarheid uit te beelden. In de practijk zijn coalities van veel kleine partijen natuurlijk bestuurlijk onaantrekkelijk. De Myerson waarde μj laat zien, dat de structuur van het netwerk een enorme invloed heeft op de waardering van de diverse partij-posities j. Dankzij μj kan men de verwachte winnaars van de formatie ontwaren. Partijen in een centrale positie bepalen, wie er mag meedoen aan de formatie.
Helaas vereist het schetsen van deze netwerken een diepgaande kennis van de affiniteiten van de diverse partij-elites. En zelfs voor zulke deskundigen is dit geschets een speculatieve bezigheid. De analist moet de wens-coalities van alle onderhandelaars tijdens de formatie inschatten. De hypothese voor een bepaalde netwerk-structuur moet realistisch zijn, dat wil zeggen, verenigbaar met de diverse wens-coalities. Daarom zijn de netwerken in de figuur 7 slechts een eerste aanzet, en zeker niet het laatste woord. Het doel is vooral om de mogelijkheden van de speltheorie te illustreren. Structuren zoals die in de figuur 7 lenen zich goed voor een collectieve reflectie op de toenmalige politieke verhoudingen49.