Speltheorie in de bestuurskunde (3)

Plaatsing in Heterodoxe Gazet Sam de Wolff: 10 februari 2020

E.A. Bakkum is blogger voor het Sociaal Consultatiekantoor. Hij denkt graag na over de arbeiders beweging.

De modellen in de Gazet zijn opgebouwd rond de nutstheorie. Het loont de moeite om het verband tussen de nutstheorie en de speltheorie te onderzoeken. Een goede illustratie is de toepassing van de beide benaderingen op de productie van zuiver publieke goederen. Bovendien is dit thema essentieel voor de bestuurskunde. Hierbij ontstaat het collectieve actie probleem van zwart rijden, leidend tot onder-productie. Een oplossing is het straffen van opportunisten. Voorts wordt een gewaagde toepassing van de Myerson waarde op de Nederlandse kabinets-formaties gepresenteerd.


Instituties in de speltheorie

Een eerdere column definieert instituties als een stelsel regels, dat de toelaatbare acties van actoren structureert. Een andere column voegt toe, dat instituties worden opgebouwd door actoren. Daarom zijn ze een vorm van zelf-controle (self-enforcing)1. Een organisatie kan worden opgevat als een corporatieve actor, en ook als een systeem van regels. In die laatste abstracte betekenis kan de organisatie worden gelijk gesteld aan een institutie, althans voor de individuen, die deel uitmaken van de betreffende organisatie. De Duitse socioloog Scharpf noemt de organisatie een institutionele omgeving (setting), evenals bijvoorbeeld een netwerk of een club2. Denk ook aan het huwelijk, of een religieus gebedshuis. De setting werkt in op de actie arena.

Aangezien instituties het gedrag meer voorspelbaar maken, scheppen zij stabiliteit. Idealiter ontstaat er een maatschappelijk evenwicht, ten minste op de korte termijn. Een deugdelijke institutie is redelijk bestand tegen maatschappelijke veranderingen3. Dankzij de stabiliteit kunnen de actoren strategisch (doelgericht) handelen. Soms is het resultaat van de gecombineerde strategieën een collectief actie probleem (afgekort CAP). De oplossing van een CAP vergt zelf weer nieuwe instituties. De speltheorie is nuttig om instituties te analyseren. Immers, zij definieert een stel spelregels, die de actoren, hun mogelijke strategieën en hun uitkomsten vastleggen. Het Nash evenwicht modelleert simpelweg een stabiele actie arena, in een redelijk duurzame maatschappij. Daarom is de zoektocht naar het Nash evenwicht maatschappelijke relevant4.

Hier is een ideologische kanttekening op haar plaats. Trouwe lezers van de Gazet weten, dat in de columns het mensbeeld zeker niet uitsluitend de homo economicus is, hoewel vaak wordt gebruik gemaakt van economische ideeën. Integendeel, regelmatig is de sociologie geraadpleegd, en het belang van de homo politicus is altijd erkend. Uw columnist vindt de richtingen-strijd tussen economen en sociologen zinloos, en streeft juist naar integratie5. Daarom analyseren de columns de instituties gewoonlijk met het actor-gerichte institutionalisme (afgekort AGI) of met de institutionele analyse en ontwikkeling (afgekort IAO). De actie arena of constellatie wordt steeds overkoepeld door de moraal. De inperking van gedrag door normen impliceert, dat de actoren niet meer geheel rationeel zijn. Dat feit botst met de speltheorie. Daarom meent uw columnist, dat een analyse altijd genuanceerd en relativerend moet zijn6.


Indifferentie krommen van het publieke goed

De belangstelling van de Gazet voor de speltheorie is van recente datum. De eerste jaren verdiepten de columns zich vooral in de neoklassieke theorie, en in nutsmodellen, zoals die van Sam de Wolff. Uw columnist keert nu terug naar deze oude liefde, in een toepassing op zuiver publieke goederen. Er zal een verband worden gelegd tussen de benaderingen van de nutstheorie en van de speltheorie. In de speltheorie zijn de actoren onderling afhankelijk. Ieder kan zijn nut aansturen door zich te gedragen volgens een strategie, die is aangepast aan het gedrag van de anderen. In de niet-coöperatieve speltheorie is dat gedrag unilateraal. Hoewel elke actor rekening houdt met het nut van anderen, blijft zijn strategie uitsluitend gericht op de eigen behoeften. Er is geen automatische wederkerigheid, of wedijver, of enigerlei andere moraal7.

Het nu volgende betoog is een herformulering en uitbreiding van een zes jaren oude column over publieke goederen. Beschouw een actor k, die kan beschikken over een privaat goed en een zuiver publiek goed8. Zij c en g respectievelijk hun hoeveelheden, en p en q hun prijzen. Als de actor k beschikt over een inkomen yk, dan wordt zijn begroting gegeven door

(1)     p × ck + q × gk = yk

Merk op, dat een zuiver publiek goed niet-exclusief is, zodat q geen marktprijs kan zijn. Vaak zal de staat voorzien in zo een publiek goed, en de productie kosten dekken via belastingen. Daarom zou men q de belasting prijs kunnen noemen9.

Een alternatieve interpretatie van q maakt gebruik van de grens van productie-mogelijkheden. Deze is weergegeven als een rode kromme in de figuur 1a, voor de hypothetische maatschappij met één privaat goed en één publiek goed. De vorm van de grenskromme wordt bepaald door de beschikbare productie-technologieën. De totale hoeveelheden van de twee typen goederen zijn respectievelijk C en G. De raaklijn aan de grenskromme wordt de marginale transformatie-voet MTV genoemd (marginal rate of transformation, of MRT)10. In wiskundige termen, er geldt MTV = -dC/dG. Merk op, dat de MTV verandert met G. Nu kan q/p gelijk worden gesteld aan de MTV. Dat wil zeggen, er geldt q = p × MTV 11. In deze vorm geeft q de marginale kosten weer van het publieke goed, uitgedrukt in de waarde van het private goed12.

Merk op, dat de actor k het publieke goed niet kan verwerven door een ruil-actie op de markt. De analyse met de Edgeworth box is hier niet bruikbaar. De actor k wil bij voorkeur, dat het publieke goed wordt geleverd door andere actoren. Dan kan hij zijn eigen begroting helemaal besteden aan de consumptie van private goederen, en daarmee zijn nut uk maximaal maken. Een ruil van private goederen voor publieke goederen is onzinnig. Hij zal alleen gk toevoegen aan het publieke goed, wanneer de anderen er in zijn beleving onvoldoende aan bijdragen. Dan is de maatschappelijke productie niet optimaal. Dat impliceert voor een bepaalde nutswaarde uk de eis -(∂uk/∂gk) / (∂uk/∂ck) > q/p. Dankzij de toevoeging neemt de totale hoeveelheid G van het goed toe, en C neemt af. Deze ingreep verandert de maatschappelijke productie. Er wordt overgestapt op een meer efficiënte productie-technologie.

Samuelson voorwaarde voor maatschappelijke efficiëntie

Grafieken van transformatie- en isonuts-krommen van publiek goed
Figuur 1: Transformatie- en indifferentie-krommen
   voor (a) actor 1 en (b) actor 2

Stel dat de actor k een nut uk(G, ck) heeft van zijn consumptie. Hierin is G de beschikbare hoeveelheid publieke goederen. Bij n actoren is G = Σk=1n  gk, zodat elke actor een bijdrage gk levert aan G. Een indifferentie kromme van de actor k heeft de vorm uk = constant. Veronderstel bovendien, dat de hypothetische maatschappij bestaat uit twee actoren (n=2). Enkele indifferentie krommen van de actor k=1 zijn ingetekend in de figuur 1a, in groen. Een column van ruim zes jaren terug legt uit, dat de helling van een indifferentie kromme van actor k=1 wordt gegeven door de marginale substitutie verhouding MSV(1). De MSV drukt uit, hoeveel eenheden van het private goed de actor k=1 wil opgeven om een extra eenheid van het publieke goed te krijgen.

Stel dat de staat uit overwegingen van beleid het nut van de actor 1 vastlegt op het niveau van de dikke indifferentie kromme in de figuur 1a. Dit perkt de private consumptie van de actor k=2 in. Immers, weliswaar kunnen beide actoren gebruik maken van dezelfde hoeveelheid G, omdat het een publiek goed is. Maar dat geldt niet voor het private goed C, want dat is exclusief. Daarvan kan de actor 2 nog slechts c2 = C − c1 consumeren. Deze consumptie is het gebied, dat in de figuur 1a is ingeklemd tussen de grenskromme van de productie mogelijkheden en de dikke indifferentie kromme van de actor 1. De functie c2(G) is getekend in de figuur 1b, eveneens in rood. Zij wordt de restant (leftover) kromme genoemd13. De figuur 1b toont bovendien enkele indifferentie krommen van de actor 2, in blauw.

In deze situatie mag de actor 2 zijn nut u2 maximaal maken, door de staat te vragen om een optimale hoeveelheid Go. Het optimum wordt bepaald door de indifferentie kromme van 2 (in dik blauw), die nog juist raakt aan de restant kromme. Het punt (Go, c2(Go)) realiseert de Pareto efficiëntie. In het raakpunt hebben de indifferentie kromme en de restant kromme dezelfde helling. De helling van de indifferentie kromme is weer de MSV, nu voor actor k=2. De helling van de restant kromme is dC/dG − dc1/dG, en dit is juist -MTV + MSV(1). Aldus leidt de eis van efficiëntie tot

(2)     MTV = MSV(1) + MSV(2) = Σk=12  MSV(k)

De formule 2 blijkt ook geldig te zijn voor n>2. Zij wordt de voorwaarde van Samuelson voor maatschappelijke efficiëntie genoemd14. Dezelfde voorwaarde is ook afgeleid in een column van ruim zes jaren terug. Maar die afleiding geldt enkel voor een quasi-lineair nut uk. Merk op, dat de staat met de keuze van de dikke indifferentie kromme voor actor 1 heeft gekozen voor een bepaalde maatschappelijke verdeling. De staat had ook een ander nut kunnen geven aan k=1 (bijvoorbeeld minder), en dat zou leiden tot een ander optimaal punt Go. Ook actor k=2 zou een ander nut hebben (bijvoorbeeld meer). De verdeling en de efficiëntie zijn dus gekoppeld aan elkaar. Merk voorts op, dat elke eenheid van het publieke goed aan beiden ten goede komt, omdat het niet rivaliserend is. Aangezien echter de MSV(k) daalt met G, willen de beide actoren per se ook iets van het private goed consumeren.

Transformatie van de indifferentie krommen

De figuur 1a-b laat zien, dat de begroting van de formule 1 niet de hele consumptie van de actor k bepaalt15. Immers, hij kan ook de publieke goederen consumeren, die worden betaald door andere actoren. Duidt die hoeveelheid goederen aan als G-k (let op de min). Er geldt natuurlijk G-k = G − gk. Dan wordt de reële begroting van k

(3)     p × ck + q × G = yk + q × G-k = Rk

Grafieken van indifferentie krommen van publiek goed
Figuur 2: Indifferentie krommen voor (a) het (G, ck) veld
   en (b) het (gk, G-k) veld (bij gegeven yk)

De grootheid Rk wordt het volledige inkomen genoemd16. Merk echter op, dat de actor k zijn fonds q × G-k niet kan gebruiken om extra private goederen te kopen. De consumptie G-k is verplicht. Hij kan natuurlijk wel zijn eigen bijdrage gk verminderen. De figuur 2a toont nogmaals de indifferentie krommen van de actor k, waarin nu enkele begrotings-lijnen volgens de formule 3 zijn getekend (in rood)17. Stel, dat het volledige inkomen Rk is gegeven als ρ (constant). De figuur 2a laat zien, dat de actor zijn nut uk maximaal kan maken door de indifferentie kromme juist te laten raken aan deze begrotingslijn. In dat optimum (Go, ck,o) met nut uo is zijn MSV(k) gelijk aan q/p. Alle andere punten op Rk=ρ geven een lager nut. De indifferentie kromme uk = uo snijdt elke andere lijn Rk>ρ op twee punten. Deze punten liggen links en rechts van het optimum G=G0. De zwarte kromme in de figuur 2a is het optimale groeipad.

De indifferentie krommen van de figuur 2a kunnen ook worden getekend in het (gk, G-k) vlak. Blijkens de formule 3 moet daarvoor een beperking worden opgelegd, namelijk dat het inkomen yk is gegeven. Dat beperkt tevens de bijdrage van actor k aan G tot gk < yk/q. Beschouw de indifferentie kromme uk = uo uit de figuur 2a. De minimale waarde van Rk op deze kromme is ρ, en dan is G-k = (ρ − yk)/q en gk,o = Go − G-k 18. Voor grotere waarden Rk>ρ moet G-k gelijk mee-stijgen. Op de indifferentie kromme (uo) in het (G, ck) veld van de figuur 2a is er bij elke Rk één G<Go, en één G>Go. In het (gk, G-k) veld van de figuur 2b wordt dat gk = G − G-k. Daarom krijgt de indifferentie kromme (uo) er de vorm van de figuur 2b (in blauw)19. Men kan dezelfde methode van constructie toepassen op alle indifferentie krommen. Het optimale groeipad blijkt dan steeds het dal van zo een kromme te kruisen. Zie de zwarte kromme in de figuur 2b.

Het Nash evenwicht

Grafieken van indifferentie krommen en evenwicht
Figuur 3: (a) Indifferentie krommen voor actor 1 en actor 2.
   De rode punt is het evenwicht. (b) Reactie krommen
   met drie evenwichten

De figuur 2b maakt het mogelijk om het Nash evenwicht te bepalen van de bijdragen aan het publieke goed, in een maatschappij met twee actoren (n=2). Namelijk, het zwart getekende groeipad is feitelijk de (beste) reactie kromme van de actor k, omdat hij zijn keuze van gk baseert op de aangeboden hoeveelheid G-k 20. Stel k=1. In een maatschappij met n=2 moet G-1 gelijk zijn aan g2. Dat maakt het mogelijk om de indifferentie krommen van de actor 2 te tekenen in de figuur 2b 21. Het (g2, g1) veld van de actor 2 moet simpelweg worden gespiegeld in de lijn g1 = g2 van de figuur 2b. Dit is gedaan in de figuur 3a, waar de indifferentie krommen van de actor 2 groen zijn ingetekend. De reactie kromme van actor 2 is eveneens weergegeven als een zwarte kromme. Het Nash evenwicht wordt gegeven door het snijpunt van de twee reactie krommen, en is weergegeven als een dikke rode punt.

Het is direct duidelijk, dat het gevonden Nash evenwicht niet Pareto optimaal is. Immers, beschouw de indifferentie krommen van de actoren 1 en 2, die het Nash evenwicht doorsnijden. Deze twee krommen omsluiten rechts-boven het evenwicht een verzameling van punten (g1, g2), die een hoger nut beloven aan beide actoren. In de Edgeworth box wordt zo een ingesloten gebied een oog genoemd22. Pareto efficiëntie vereist, dat de twee indifferentie krommen elkaar juist raken in het desbetreffende punt. Immers dan is er geen ingesloten verzameling van punten met een hoger nut meer. Het pad van Pareto optimale allocatie wordt in de figuur 3a getoond als de rode kromme. Merk op, dat het Nash evenwicht ontstaat door unilateraal aanpassend gedrag. Anderzijds vereist de realisatie van het Pareto optimum een bilaterale onderhandeling, zonder compenserende betalingen (side payments).

Een maatschappij met n=2 actoren kan diverse evenwichten van bijdragen aan het collectieve goed hebben23. Dat is geïllustreerd in de figuur 3b, waar de reactie kromme van de actor 1 (blauw) diverse snijnpunten heeft met de reactie kromme van de actor 2 (groen). Alleen de twee evenwichten aan de uiteinden zijn stabiel. Het middelste punt is instabiel, omdat het minder aantrekkelijk is dan de evenwichten aan de uiteinden voor één van de twee actoren.

Indifferentie krommen in de speltheorie

De huidige paragraaf zal laten zien, dat het gevangenen- en chicken-spel kunnen worden vertaald in een nutsveld (g1, g2) 24. In het spel is de strategie-keuze van elke actor discreet. De actor k kan kiezen uit niet of wel een eenheid van het publieke goed bijdragen. Dit correspondeert met gk = 0 of 1, met k=1 of 2. De instituties van het spel zijn star en laten niet toe om bijvoorbeeld een kwart van de totale kosten bij te dragen. Bovendien is het spel helemaal symmetrisch in de beide actoren. De strategieën van de actoren leiden tot uitkomsten met een bepaald individueel nut. Gemaks halve worden de nutswaarden van deze spellen ordinaal uitgedrukt, waarbij een oplopend nut wordt aangegeven door u = 1, 2, 3 en 4. De lezer zij verwezen naar een eerdere column voor de twee 2×2 spel-matrices.

Figuren van nutsvelden van spellen
Figuur 4: Nutsvelden van spellen, met indifferentie krommen,
    het reactie pad, Nash evenwichten en het optimale pad.
      (a) gevangenen spel;   (b) chicken spel

Beschouw allereerst het gevangenen-spel. Het Nash evenwicht is u = (2, 2). Dat evenwicht is sub-optimaal, omdat het wordt gedomineerd door de uitkomst met nut u = (3, 3). De uitkomsten met nutten u = (3, 3), (1, 4) en (4, 1) zijn allemaal Pareto optimaal. Al deze eigenschappen zijn vastgelegd in het nutsveld, dat is weergegeven in de figuur 4a. 25. Alleen het nutsveld van de actor 1 is ingetekend. Het nutsveld van de actor 2 kan worden verkregen door een spiegeling in de as g1 = g2. Immers, het spel is symmetrisch. Dankzij de spiegeling verwisselen de g1- en g2-assen van plaats. Zie de figuur 3b. De blauwe krommen zijn het indifferentie veld van k=1.

De zwarte kromme is het beste reactie pad van de actor 1. Het loopt als het ware over de kam van de nutsberg van de actor 1. Het groene punt is het Nash evenwicht, waar de twee reactie krommen elkaar snijden. Merk op, dat afgezien van dit ene punt het reactie pad helemaal in het gebied ligt, waar één van de gk negatief is. Die reacties zijn dus practisch onmogelijk. De rode kromme is het pad van Pareto optimale allocatie. Op deze kromme raken de indifferentie krommen van de twee actoren elkaar26. Dit vereist een besluit via een onderhandeling, waarbij de beide nutten worden meegewogen27.

Beschouw vervolgens het lafaard (chicken) spel. Er zijn twee Nash evenwichten, te weten u = (2, 4) en (4,2). Zij zijn Pareto optimaal, evenals het punt u = (3, 3). Bovendien kunnen de actoren een Nash evenwicht bereiken, wanneer zij een gemengde strategie hanteren, waarbij ieder met een kans van ½ wel of niet een eenheid van het publieke goed bijdraagt. Dat evenwicht heeft als uitkomst u = (5/2, 5/2), en is dus niet Pareto optimaal28. Het lafaard spel kan niet eenvoudig worden vertaald naar een nutsveld. Immers, de figuur 2b laat zien, dat op de reactie kromme van de actor 1 diens MSV gelijk moet zijn aan nul (horizontaal). In het gecombineerde nutsveld van de figuur 3a is op de reactie kromme van de actor 2 diens MSV oneindig (verticaal). Dien ten gevolge staan in het evenwicht, waar de twee reactie krommen elkaar kruisen, de indifferentie krommen loodrecht op elkaar.

Anderzijds is zonet aangetoond, dat op het pad van de Pareto optimale allocatie die indifferentie krommen aan elkaar moeten raken. De MSV van de twee actoren moeten gelijk zijn. Daarom kan er worden geconcludeerd, dat in de gepresenteerde nuts-analyse een Nash evenwicht nooit Pareto optimaal kan zijn!29 Kennelijk kunnen actoren, die hun eigen nut maximaal maken, geen maatschappelijke optimaliteit bereiken. In de speltheorie lukt dat wel, omdat de spelregels enkel een discrete keuze toestaan aan de actoren, te weten: een eenheid van het publieke goed bijdragen, of helemaal niets. Dan is de vrije keuze van de twee actoren institutioneel ingeperkt30. De figuur 4b geeft de situatie grafisch weer. Alleen het nutsveld van de actor 1 is ingetekend. Het nutsveld van de actor 2 kan worden verkregen door spiegeling. De blauwe krommen zijn het indifferentie veld.

De zwarte kromme is het beste reactie pad van de actor 1. De drie groene punten zijn de Nash evenwichten, waar de twee reactie krommen elkaar snijden. De rode kromme is het pad van Pareto optimale allocatie. Het nutsveld is hier zodanig getekend, dat het beste-reactie pad beneden het pad van Pareto optimaliteit ligt. Dat geldt dan eveneens voor de Nash evenwichten. De strijdigheid tussen de speltheorie en de nutstheorie kan op twee manieren worden uitgelegd. Ten eerste, wegens de institutionele inperking door de spelregels zou het pad van echte Pareto optimaliteit niet bereikbaar kunnen zijn. De discrete uitkomsten van het spel zijn niet meer dan evenwichten. Of, ten tweede, de institutionele beperking van het spel zou de actoren kunnen dwingen om een discreet Pareto optimaal punt te kiezen. Zij kiezen het optimum, dat zich het dichtst bij hun evenwicht bevindt. Dat optimum is een kunstmatig evenwicht. De figuur 4b beeldt deze tweede uitleg af31.

Het is boeiend om te zien, dat de verschillende kosten-baten afweging van de actoren in de twee spellen leidt tot een totaal ander nutsveld. Hoewel het publieke goed zelf in beide spellen geen verschil vertoont, komen de actoren tot een totaal ander gedrag. In het gevangenen-spel weigert de actor om bij te dragen aan het goed. In het lafaard spel zal hij enkel weigeren, zolang de andere actor wel (voldoende) bijdraagt. Die strategie verschuift zijn nutsberg naar (relatief ten opzichte van het gevangenen-spel) grotere bijdragen aan het publieke goed. Overigens ziet uw columnist nog geen practische toepassing van dit nieuwe inzicht32.


Spellen met vele actoren

In de realiteit komen actie arena's of constellaties met n=2 actoren veel voor. Maar vaak zijn er meer dan twee actoren betrokken bij de collectieve actie. Gelukkig kan men ook zulke spellen vrij eenvoudig modelleren. Als voorbeeld wordt het spel van het gevangenen dilemma met n actoren beschouwd33. De tabel 1 geeft de uitkomsten in de normale vorm, als een 2×n matrix. De bekende notatie wordt gehanteerd. De strategie s' is bijdragen aan het publieke goed, en s'' is niet bijdragen. De baten van een eenheid van het publieke goed zijn b, en de kosten zijn c. Er geldt b < c < 2×b. De aggregatie technologie is sommatie. De actor k=1 moet kiezen tussen de strategie s' en s''. In de tabel dragen m van de n−1 overige actoren bij aan het goed.

Tabel 1: uitkomsten matrix van het gevangenen spel met n actoren
m 0123n − 1
actor 1  s'  b − c2×b − c3×b − c3×b − cn×b − c
  s''  0b2×b3×b − c(n−1) × b

De actor k=1 behaalt betere resultaten met strategie s'' voor alle waarden van m. Hij zal dus niet bijdragen aan het publieke goed. Maar aangezien het spel symmetrisch is voor alle actoren, zal dan geen enkele actor bijdragen (m=0). Allen verkiezen de strategie s''. Dan is in het Nash evenwicht het netto nut gelijk aan uk = 0 voor alle k=1, ..., n. Dit is (natuurlijk) hetzelfde resultaat als voor n=2. Des al niettemin wordt het maatschappelijke optimum gegeven door de collectieve keuze voor bijdragen, te weten uk(s') = n×b − c. Immers, dit nut is groter dan het nut van 0 in het evenwicht.

Een interessant geval doet zich voor, wanneer de aggregatie technologie een drempel heeft34. Dat wil zeggen, er geldt uk=0 voor alle actoren, zolang het aantal m van bijdragende actoren (met strategie s') niet de drempel overschrijdt. Beneden de drempel zijn geen baten, maar ook geen kosten c. Zodra de drempel is bereikt, is het nut weer net zoals in de tabel 1. Een voorbeeld is een groep gemeenten, die tezamen een bosbrand willen bestrijden. Men heeft een minimum aantal brandweer corpsen nodig om de brand te kunnen uitdoven. De drempel kan institutioneel worden vastgelegd. Dat wil zeggen, zij kan behoren tot de spelregels van de maatschappelijke constellatie. Stel dat de drempel ligt bij m=3. Dan geeft de tabel 2 de uitkomsten matrix.

Tabel 2: uitkomsten matrix van het gevangenen spel met n actoren en een drempel van m=3
m   0    1    2  3n − 1
actor 1  s'  003×b − c4×b − cn×b − c
  s''  0003×b(n−1) × b
Grafieken van marginale baten versus participatie
Figuur 5: Marginale baten als
   functie van het aantal
    contribuanten m

Blijkens de tabel 2 loont het voor de actor k=1 om bij te dragen in de situatie met m=2. De situatie, waarin drie actoren bijdragen, is een Nash evenwicht. Zodra drie actoren hebben bijdragen, wordt weer de beste uitkomst verkregen door niet bij te dragen. Een dergelijk evenwicht wordt mogelijk gerealiseerd, wanneer de n actoren achter eenvolgens (sequentieel) hun strategie bekend maken. Dan zullen precies drie actoren kiezen voor s'. Als de eerste actoren slim zijn, dan kiezen zij toch voor de strategie s''. In dat geval moeten de laatste drie actoren de bijdragers zijn. Zij worden voor het blok gezet door hun voorgangers, en kunnen redelijker wijze niet meer kiezen voor s''. Nochtans is op deze manier het aantal bijdragen gestegen ten opzichte van de situatie in de tabel 1 (zonder drempel). Instituties kunnen daadwerkelijk helpen.

Volledigheids halve toont de figuur 5a-d de marginale baten b(m) als functie van het aantal contribuanten m, bij in totaal n actoren35. Als wordt aangenomen, dat n groot is, dan heeft b(m) een continu verloop. In alle gevallen is b(m) een stijgende functie van m. De reden is natuurlijk de niet-rivaliteit van zuiver publieke goederen. Het gaat om meer productie, en niet om een stijgende efficiëntie van productie. Ter vergelijking zijn de marginale baten ingetekend van een privaat goed, als groene stippellijn. Elk van de panelen representeert een bepaalde constellatie. De figuur 5a geldt voor het gevangenen spel, en beeldt de onderste rij in de tabel 1 af. Dit verband is al getoond in een eerdere column, bij de presentatie van het model van Elster36. De figuur 5b is het gevangenen spel met een drempel, en beeldt de onderste rij van de tabel 2 af. Hier zijn de marginale baten b(m) een stapfunctie.

De figuur 5c toont marginale baten met een afnemende groei. Dit correspondeert met een beste-poging technologie. De behoeften zijn al redelijk vervuld, wanneer slechts enkele actoren bijdragen (lage m). Voor n=2 heeft men een lafaard (chicken) spel. De figuur 5d toont marginale baten met een toenemende groei. Dit is verwant aan de zwakste-schakel technologie. Naarmate meer zwakkere schakels worden verwijderd, nemen de baten sterk toe. Voor n=2 heeft men een verzekerings-spel37. Enkele practische voorbeelden van aggregatie technologieën zijn: (i) bescherming van de ozon laag (sommatie); (ii) inperking van een biologische plaag (zwakkere schakel); (iii) ontdekking van nieuwe anti-biotica (betere poging)38.


Bestraffen van zwart rijden

Een eerdere column heeft laten zien, dat een zuiver publiek goed uitnodigt tot zwart rijden (free riding). Het heeft noch rivaliteit, noch uitsluitbaarheid. Stel, dat het goed een sommatie technologie van aggregatie heeft. De betaling van het publieke goed is dan een collectief actie probleem (afgekort CAP) van de eerste orde. Dit is het zonet beschreven spel van het gevangenen dilemma. Dit probleem kan worden opgelost door inspectie en handhaving. Daardoor kunnen parasitaire actoren worden gestraft. Deze paragraaf zal een eenvoudig model van straffen presenteren. Het uitgangspunt is een constellatie met n actoren, waarvan m (<n) besluiten om bij te dragen aan het publieke goed. Elke van de m actoren levert een eenheid goed met baten b, en maakt daarvoor kosten c. Er geldt b < c < 2×c, zodat alleengang (m=1) niet loont voor de actor, maar levering met meerderen (m≥2) wel. Immers de geaggregeerde baten zijn m×b.

Voor een homo economicus heeft bijdragen een marginaal nut uk(m) = m×b − c, en zwart rijden leidt tot uk(m) = m×b 39. Noem deze strategieën respectievelijk s' en s''. Dan is zwart rijden (s'') de dominante strategie De nuts-lijnen als functie van m zijn weergegeven door de stippel-lijnen in de figuur 6a-b, in rood voor s' en in groen voor s''. Stel nu, dat de actoren van de s' groep besluiten om elke actor van de s'' groep wegens zijn gedrag te disciplineren met een vaste intensiteit (inspanning) ε. De inspanning produceert een boete λ(ε, m) per actor in de s'' groep. Daarvoor moet elke actor uit de s' groep kosten maken ter grootte van γ(ε, m). Uitgedrukt als formule scheppen de m actoren in de s' groep een (marginale) nut voor de actor k ter grootte van40

(4a)     uk(s', m) = m × b − c − γ(ε, m)
(4b)     uk(s'', m) = m × b − λ(ε, m)

Als er geldt λ > c, dan hebben actoren uit de s'' groep een prikkel om ook bij te dragen. Merk op, dat hierbij een CAP van de tweede orde ontstaat, omdat een actor in de groep s' het straffen ervaart als een last γ. Hij heeft een prikkel om zelf niet te straffen, en zwart te rijden binnen zijn eigen groep. Er zijn twee oplossingen voor dit CAP. Ten eerste kan de staat proberen om alle homines economici te heropvoeden. Dan verdwijnt het eerste orde CAP, en is straffen onnodig. Hij kan hen aanmoedigen om zich te gedragen als een homo sociologicus Een eerdere column heeft laten zien, dat voorbij het kantel (tipping) punt m* elke massa-mens dezelfde voorkeuren en strategie (zoals s') hanteert. Ten tweede kan de staat de actoren aanmoedigen om zich te gedragen als een homo politicus (of identiteits-bewaker). Deze heeft een interne voorkeur voor een bepaalde strategie (zoals s'). Die strategie geeft hem vanzelf een nut β. Hier is β>c vereist.

Grafieken van nut van publiek goed met straf
Figuur 6: Nut van publiek goed met straf
   voor strategie s' en s'' en (a) constante kosten;
   (b) constante boete per actor voor elk subject

Nochtans is denkbaar, dat sommige van de homines economici zich onverbeterlijk tonen. In dat geval moet de staat het tweede orde CAP oplossen. Opnieuw moet de staat actoren aanmoedigen om zich te gedragen als homo sociologicus (massa-mens) of homo politicus (identiteits-bewaarder). Veronderstel, dat deze poging succes heeft bij een flink deel van de bevolking. Nu moet de staat hen bovendien aansporen om de resterende homines economici te bestraffen voor hun opportunistische gedrag. In deze constellatie betekent het voor de homo politicus, dat de interne (morele) baten moeten voldoen aan β > c+γ. Als de homo economicus een voldoende hoge boete krijgt opgelegd, dan zal hij vanzelf kiezen voor bijdragen aan het goed (strategie s').

Het is interessant om te filosoferen over de vorm van de functies λ en γ. De econoom W.D. Ferguson stelt voor om ook de kosten γ constant te nemen (naast de inspanning ε per boete)41. Dat heeft het voordeel, dat de actor in de s' groep zijn kosten voor straffen kent (onafhankelijk van m). Maar het betekent allerminst, dat ook λ constant is. Immers, er zijn m actoren in de s' groep en n − m actoren in de s'' groep. Daarom moet een straf met geaggregeerde intensiteit m×ε worden verdeeld over n − m subjecten. Dit impliceert dat geldt λ = m×ε / (n−m). De figuur 6a toont het verloop van de marginale nutsfuncties uk(s', m) en uk(s'', m) als functie van m. Er treedt een kantelpunt op bij uk(s', m) = uk(s'', m). Men rekent simpel uit, dat geldt

(5)     m* = n × (1 − ε / (c + γ + ε))

Het kantelpunt ligt laag, wanneer ε groot is, terwijl c en γ laag blijven. Voor m boven het kantelpunt is de homo economicus zelfs bereid om anderen te straffen. Zou hij dat niet doen, en voortaan slechts c bijdragen aan het goed, dan is hij nog altijd een parasiet. Merk op, dat voorbij het kantelpunt de actoren in de s'' groep steeds zwaarder worden gestraft. Homines politici, die een intern nut β ontlenen aan de strategie s'', zouden hiervan het slachtoffer kunnen worden. Hun last wordt dermate zwaar, dat tenslotte de maatschappelijke welvaart W = m × uk(s', m) + (n−m) × uk(s'', m) er onder lijdt42. Daarom doet uw columnist een ander voorstel voor γ, namelijk γ = (n−m) × a×ε, met a<1 een constante. Immers, nu heeft de boete per subject een geaggregeerde intensiteit van λ = m×ε, zodat de boete in de s'' groep simpelweg hun baten b van het goed verlaagt met ε. De figuur 6b toont het verloop van uk(s', m) en uk(s'', m). Het kantelpunt ligt bij

(6)     m* = n × (c/n + a×ε) / ((a+1) × ε)

Het kantelpunt is relatief laag, wanneer ε groter is dan c/n. In dit geval is het probleem, dat voor kleine waarden van m elke actor in de s' groep hoge kosten moet maken om te straffen. In dat bereik wordt de maatschappelijke welvaart W onwenselijk laag. Het geeft een grote prikkel aan de s' groep om zwart te rijden bij het straffen. Dit wettigt de conclusie, dat bij lage waarden van m de kosten γ het beste constant kunnen worden gehouden (figuur 6a). Bij hogere waarden van m (zeg, voorbij het kantelpunt) is het beter om de kostenfunctie γ van uw columnist (figuur 6b) te hanteren. Het is niet per se billijk om de resterende homines politici, die hechten aan strategie s'', materieel of maatschappelijk te ruïneren.

De huidige paragraaf illustreert duidelijk, dat in de practijk de actoren gemengde motieven moeten hanteren43. Hun actor-model is meerzijdig. De actor maakt een kosten-baten analyse m×b−c, als homo economicus. Maar het CAP is enkel oplosbaar, wanneer vele actoren tevens een homo sociologicus zijn en/of een homo politicus. De homo sociologicus is een massa-mens, die extern kan worden geprikkeld om bij te dragen aan het publieke goed. Desnoods is de massa-mens ook bereid om het opportunistische gedrag van homines economici af te straffen. De homo politicus heeft het voordeel, dat hij intern is gemotiveerd. Ook hij is bereid tot straffen. Het doel van straffen en beboeten is om een ruim aanbod van het publieke goed te realiseren, wat gunstig is voor de kosten-baten balans. Echter straffen vernietigt nut, zowel bij de s' groep als de s'' groep. Daarom moet per geval worden bekeken, wat het optimale niveau van uitgaven γ voor bestraffing is.


Nationale verkiezingen

In enkele eerdere columns is de coöperatieve speltheorie toegepast om de nationale verkiezing van 1977 te analyseren44. Zowel de Shapley waarde als de Myerson waarde zijn uitgerekend voor de drie betrokken politieke partijen, te weten het CDA, de PvdA en de VVD. Het bleek, dat indertijd de PvdA haar macht overschatte, zeker wanneer de centrale positie van het CDA wordt meegewogen. Kennelijk is de Shapley waarde een handig instrument voor zulke analyses. De huidige paragraaf past dezelfde methode toe om de nationale verkiezingen van 1982, 1994, 2003, 2006 en 2017 te analyseren. Op die manier kan een schatting worden gemaakt van de kansen van de diverse partijen tijdens de kabinets-formatie. De figuur 7 toont de belangrijkste partijen in ieder van die formaties. De partijen zijn primair geselecteerd, omdat zij indertijd gewoon de meeste stemmen kregen. Men ziet, dat de selectie verschilt per constellatie.

Schema van partijen bij vijf kabinets-formaties
Figuur 7: Partijen bij vijf kabinets-formaties, en hun verbindingen

Soms raakten onverwacht tamelijk kleine partijen betrokken bij de formatie, omdat de toegang van andere, wat grotere partijen om ideologische redenen werd geblokkeerd. Dat blijkt ook uit de onderlinge contacten. De rode verbindings-lijnen geven de affiniteit van de partijen weer. Zij is mede afgeleid uit de stellingname tijdens de formatie-besprekingen. Vaak is de affiniteit ideologisch. Bijvoorbeeld onderhouden de VVD en de SP nauwelijks contact, zodat een derde partij nodig is als bemiddelaar. Maar de affiniteit kan ook een gevolg zijn van de verkiezings-uitslag, namelijk, wanneer die duidelijk dringt in de richting van een bepaald kabinet. Dat maakt de affiniteit opportunistisch en dynamisch. Ook de wens om het aantal partijen k in het kabinet laag te houden schept affiniteit. Uw columnist geeft meteen toe, dat zijn keuze van affiniteiten subjectief is. Nochtans wordt de Myerson waarde erdoor bepaald, omdat die de structuur van het netwerk meeweegt45.

De uitslagen van de verkiezingen zijn vermeld in de tabel 3, als fractie van het totaal aantal zetels in de tweede kamer. Een kabinet heeft een meerderheid met meer dan de helft van alle zetels. De kolom met kop "1/k" geeft aan, welke partijen in het kabinet komen. De getalswaarde is 1/k, waarbij k het aantal partijen in het kabinet is. De kolom met kop ζ(Sh) toont de Shapley waarde voor de betrokken partijen. Zij wordt berekend met een coalitie-functie ν(C), die ν=1 is voor coalities C met een parlementaire meerderheid, en ν=0 is voor alle andere coalities. Deze Shapley waarde telt winnende coalities, en niet het aantal zetels. Partijen, die uw columnist meent te moeten weglaten in zijn model, kunnen natuurlijk geen invloed hebben op de hier berekende Shapley waarde. De waarde ζ negeert de netwerk-structuur van de figuur 7. De Myerson waarde μ brengt die wèl in rekening.

Tabel 3: nationale verkiezingen: uitslag, kabinet, Shapley waarde en Myerson waarde
jaar19821994200320062017
actorzetels1/kζ(Sh)μ(My)zetels1/kζ(Sh)μ(My)zetels1/kζ(Sh)μ(My)zetels1/kζ(Sh)μ(My)zetels1/kζ(Sh)μ(My)
CDA0.3000.50.330.500.227-0.250.080.2800.330.330.580.2730.330.330.470.1270.250.180.10
VVD0.2400.50.330.500.2170.330.250.420.1870.330.170.080.147-0.170.020.2200.250.320.38
PvdA0.313-0.330.000.2470.330.250.420.293-0.330.250.2200.330.230.470.060-0.070.02
D66----0.1600.330.250.080.0400.330.170.08----0.1270.250.180.10
SP------------0.167-0.170.020.093-0.100.05
GL------------0.047-0.050.020.093-0.100.29
CU------------0.0400.330.050.020.0330.250.070.03

De kabinets-formatie van 1982

De kabinets-formatie van 1982 is de enige in de figuur 7, die een partij isoleert, namelijk de PvdA. De PvdA toonde in het kabinet Van Agt II veel vechtgedrag, en de positie van haar partijleider (Den Uyl) stond intern ter discussie. Daarom kwam zij na de verkiezingen niet aan bod tijdens de formatie. De VVD scoorde goed in de verkiezingen, zodat een kabinet van CDA en VVD voor de hand lag. De Shapley waarde ζj van partij j is hier louter hypothetisch, wegens het isolement van de PvdA46. Het netwerk tijdens de formatie is een dyade, zodat de Myerson waarde μj hier een uitstekende maat is voor de reële constellatie. Het politieke leven van toen was niet eenvoudig, maar wel duidelijk. De uitkomst is natuurlijk slecht voor de PvdA, die toch de grootste partij was47.

De kabinets-formatie van 1994

Wim Kok heeft geprobeerd om de PvdA in sociaal-liberale richting te sturen. Dit had het voordeel, dat de politieke polarisatie verminderde. Hoewel in 1994 alle grote politieke partijen goede contacten onderhielden, ook de PvdA en VVD, suggereert het netwerk in de figuur 7 toch enige polarisatie. De reden is, dat D66 hechtte aan de vorming van een Paars kabinet, en daarom de facto weigerde een coalitie met het CDA te vormen. Ook verwierp het CDA de vorming van een centrum-links kabinet. Daarom zijn in het netwerk de verbindingen D66 − VVD, CDA − PvdA en natuurlijk ook D66 − CDA weggelaten. De Shapley waarde van elke partij j is ζj = 0.25, wat redelijk overeenkomt met het egalitaire verkiezings-resultaat. Maar wegens het gepolariseerde netwerk is de Myerson waarde voor de PvdA en VVD ieder hoog. Voor D66 en het CDA blijft dan weinig over. En inderdaad mislukte de formatie van Paars bijna48.

De kabinets-formatie van 2003

De kabinets-formatie van 2003 had een merkwaardig verloop. Het PvdA en CDA waren de grote winnaars, en zouden eigenlijk een coalitie moeten vormen. Maar hun formatie-poging mislukte. Opnieuw greep de PvdA mis. Ter linkerzijde van de PvdA waren Groen Links en de SP allebei groter dan D66. Op rechts was de LPF groter dan D66. Maar de ideologie van links blokkeerde de toegang tot de formatie, en de LPF was intussen een politieke paria geworden. Daarom ontbreken GL, de SP en de LPF voor 2003 in de figuur 7 en de tabel 3. Dat heeft effect op ζ. Het kleine D66 kreeg een spilpositie. Aangezien het animo voor Paars intussen was gedoofd, besloten D66 en de VVD tot een coalitie met het CDA. Het verloop van de formatie laat zien, dat per saldo het CDA steeds centraal staat. Dit blijkt niet uit de Shapley waarde, maar wel uit de Myerson waarde, voor de getekende netwerk structuur. Zie de tabel 3. Alle paden liepen via het CDA.

De kabinets-formatie van 2006

De kabinets-formatie van 2006 wordt gedicteerd door de uitslag van de verkiezingen. Hier was de SP de grote winnaar, en de VVD boekte juist een matig resultaat. Maar zoals de figuur 7 illustreert, had de SP geen directe verbinding met het CDA. Daarom was het CDA onwillig om de SP toegang te geven tot de formatie. Daarop blokkeerde de PvdA de toegang van de VVD. Aldus vormde tenslotte de coalitie van CDA, PvdA en de Christen Unie. Groen Links en de PVV waren ieder groter dan de CU. Maar de PVV is een politieke paria, en Groen Links had evenmin als de SP een directe verbinding met het CDA. Blijkens de tabel 3 zijn de Shapley waarden voor het CDA en de PvdA tamelijk groot. De figuur 7 toont een links en een rechts blok, met de PvdA en het CDA als woordvoerders. Wegens deze constellatie hebben beide partijen zeer grote Myerson waarden. De CU werd verkozen als partner vanwege haar plooibaarheid.

De kabinets-formatie van 2017

In de verkiezingen van 2017 zet de electorale fragmentering door. De val van de PvdA is dramatisch. De VVD heeft zich goed gehandhaaft, en blijft de grootste partij. De figuur 7 laat zien, dat Groen Links de nieuwe spreekbuis van het linkse blok wordt. De partijtop heeft intussen een redelijk contact met de VVD, waardoor GL prominent aanwezig is in de formatie besprekingen. Zie de vrij grote μ van GL in de tabel 3. Maar de partij-basis volgt haar leiding niet, zodat GL tenslotte toch afhaakt. Natuurlijk zijn er feitelijk meer verbindingen dan de figuur 7 weergeeft. Bijvoorbeeld onderhouden D66 en GL een goed contact. Inderdaad is een centrum-linkse coalitie in beginsel mogelijk. Echter zo een coalitie zou moeten bestaan uit tenminste zes partijen, en is dan lastig te besturen. Daarom kunnen in deze constellatie de verbindingen D66 − GL, PvdA − CDA en dergelijke, worden genegeerd. Uiteindelijk vormt de coalitie van VVD, CDA, D66, en CU.

Evaluatie

De reken-exercitie van de tabel 3 heeft vooral het doel om de toepasbaarheid van de Shapley en Myerson waarden te illustreren. Voor de Shapley waarde ζ moet men simpelweg alle winnende coalities tellen. Dat maakt de berekende waarde van ζ tamelijk nauwkeurig, al beschouwt de tabel niet alle bestaande partijen. Wegens deze omissie blijkt ζj gewoonlijk iets boven het stemmen-percentage van de partij j te liggen. Nochtans is ζj ook bij een volledige berekening nooit identiek aan de stembus-uitslag van partij j. Een winnende coalitie moet slechts de drempel van 50% overschrijden, en niet per se de grootste geaggregeerde uitslag hebben. Des al niettemin is formeren meer dan het tellen van winnende coalities. Men moet rekening houden met de partij-verhoudingen. Hier komt de Myerson waarde μ te hulp.

De netwerken in de figuur 7 zijn een poging om de gecombineerde gevolgen van ideologie, stembus-uitslag, en practische bestuurbaarheid uit te beelden. In de practijk zijn coalities van veel kleine partijen natuurlijk bestuurlijk onaantrekkelijk. De Myerson waarde μj laat zien, dat de structuur van het netwerk een enorme invloed heeft op de waardering van de diverse partij-posities j. Dankzij μj kan men de verwachte winnaars van de formatie ontwaren. Partijen in een centrale positie bepalen, wie er mag meedoen aan de formatie.

Helaas vereist het schetsen van deze netwerken een diepgaande kennis van de affiniteiten van de diverse partij-elites. En zelfs voor zulke deskundigen is dit geschets een speculatieve bezigheid. De analist moet de wens-coalities van alle onderhandelaars tijdens de formatie inschatten. De hypothese voor een bepaalde netwerk-structuur moet realistisch zijn, dat wil zeggen, verenigbaar met de diverse wens-coalities. Daarom zijn de netwerken in de figuur 7 slechts een eerste aanzet, en zeker niet het laatste woord. Het doel is vooral om de mogelijkheden van de speltheorie te illustreren. Structuren zoals die in de figuur 7 lenen zich goed voor een collectieve reflectie op de toenmalige politieke verhoudingen49.

  1. Soms stellen de uitvoerende actoren in de actie arena niet zelf de regels op. Als regels extern worden gedicteerd, dan is volgens de socioloog J.S. Coleman het gezag "los" (disjoint). Zelfbinding treedt natuurlijk vooral op voor het geval van een eigen (verenigd, conjoint) gezag. (terug)
  2. Zie p.31 en 47 in Games real actors play (1997, Westview Press) van F.W. Scharpf. Op p.152 in Collective action and exchange (2013, Stanford University Press) van W.D. Ferguson wordt de organisatie opgevat als een deel van het institutionele systeem. De organisatie-regels worden dan losgekoppeld van de organisatie zelf. Maar op p.154 wordt toch gesteld: "As an institution, we take [the organization] as a set of understood rules and procedures". (terug)
  3. Zie p.158 in Collective action and exchange. (terug)
  4. Op p.248 in The limits of public choice (1996, Routledge) merkt L. Udehn terecht op, dat het spel de groep of gemeenschap negeert. De actoren van het spel handelen unilateraal, zonder overleg of enigerlei onderlinge binding. De gedeelde moraal, die eigenlijk een maatschappelijk fenomeen is, wordt gereduceerd tot formele spelregels. In realiteit is er maatschappelijke druk, waardoor bijvoorbeeld de individuele voorkeur uk van de actor k veranderlijk is (p.275). Al deze abstracties zijn geen probleem, mits men zich ervan bewust is. (terug)
  5. Op p.250 in The limits of public choice verzucht Udehn: "The ambition now seems to be some kind of marriage between economics and sociology. It will probably be a more stormy than happy marriage". Uw columnist begrijpt zulk sarcasme niet. Het perspectief van Udehn blijkt ook uit dit citaat (p.59): "In my opinion, Marx and Weber are the greatest classical sociologists and they are also the greatest political sociologists". Opvallend is ook (p.254): "We all know the difference between opportunists and honest people". Zijn boek lijkt op de vergelijking van een half vol glas met een half leeg glas. Zulke betogen gaan snel vermoeien. (terug)
  6. Algemeen wordt erkend, dat samenwerking meer kansen heeft, naarmate de groep kleiner is. De sociale controle werkt disciplinerend. De econoom P. Frijters meent, dat actoren in een groep neigen naar toewijding. Maar vaak dient een moraal of norm toch het materiële eigen belang. De wiskundige K. Binmore ziet de empathie als de voornaamste bindende factor in de maatschappij. Op p.224, 236, 245 en 265 in The limits of public choice wordt opgemerkt, dat vaak leiders (een elite of avant-garde) propaganda maken voor de productie van een (zuiver) publiek goed. Kennelijk is macht een belangrijke factor voor samenwerking. De leiders kunnen daarbij worden gemotiveerd door hun eigen belang. (terug)
  7. De nutsafweging vergelijkt de verwachte baten en de kosten van de actie of strategie. In een eerdere column is een inventarisatie gemaakt van de factoren, die inwerken op het verwachte nut. Er wordt uitgelegd, dat de baten niet louter materieel zijn. Zelfs het proces van de interactie kan baten opleveren aan sommige actoren (een vondst van Tullock). In die inventarisatie wordt ook de individuele of maatschappelijke moraal genoemd als een bron van nut. Zulke factoren impliceren, dat het model van de homo economicus wordt verlaten, althans in zijn orthodoxe vorm. Overigens stemmen actoren toch vaak hun moraal af op hun materiële belang. Daarom heeft de homo politicus enige verwantschap met de homo economicus. Op p.244 in The limits of public choice stelt Udehn, dat de veronderstelling van een nut van processen botst met de doel-rationaliteit van de rationele keuze-leer. Inderdaad wordt de eenvoud (soberheid, parsimony) van de leer er door aangetast. (terug)
  8. De nu volgende argumentatie is overgenomen van p.152-154 in Economics of the public sector (2000, W.W. Norton & Company, Inc.) van J.E. Stiglitz, en p.106-108 in Öffentliche Finanzen in der Demokratie (2011, Verlag Franz Vahlen GmbH) van C.B. Blankart. (terug)
  9. Zie p.142 in Economics of the public sector. (terug)
  10. De marginale transformatie-voet wordt uitgelegd in paragraaf 7.6.3 van de experimentele ringband Vooruitgang der economische wetenschap (2011, Uitgeverij E. de Bibelude) van uw columnist E.A. Bakkum. Merkwaardiger wijze is nadien het concept nooit expliciet genoemd in de Gazet. Aangezien de ringband een uiterst beperkte oplage had, zijn hier twee andere referenties: p.572 en verder in Micro-economie (1996, Stenfert Kroese) van F.J. Dietz, W.J.M. Heijman en E.P. Kroese, of p.157 in Volkswirtschaftslehre (2003, Oldenbourg Wissenschaftsverlag GmbH) van M. Heine en H. Herr. Elk ander fatsoenlijk boek over micro-economie moet ook volstaan. (terug)
  11. Zie p.144 van The theory of externalities, public goods and club goods (1996, Cambridge University Press) van R. Cornes en T. Sandler. Daar wordt de formule 1 gegeneraliseerd voor de maatschappij. Stel dat de maatschappij beschikt over L werkers, die elk een loon w ontvangen. Dan is de begroting Y = w×L = p×C + q×G, waarbij C de totale private consumptie is, en G de totale publieke consumptie. Of, zo men wil, L = (p/w) × C + (q/w) × G. De productie-technologie gebruikt enkel arbeid L, zonder schaal-effecten. De grens van productie-mogelijkheden is dan een rechte lijn. De variabelen p en q bepalen nu, hoe de beschikbare arbeidskracht wordt verdeeld over de private en publieke sector. Aangezien L constant is, geldt er MTV = -dC/dG = q/p. (terug)
  12. Zie p.145 in Economics of the public sector. (terug)
  13. Zie p.152 in Economics of the public sector, of p.106 van Öffentliche Finanzen in der Demokratie. (terug)
  14. De lezer van de Gazet vindt misschien de term "maatschappelijke efficiëntie" wat verwarrend in deze context. Immers, in vele columns is efficiëntie gekoppeld aan de maximalisatie van de maatschappelijke welvaarts-functie (SWF). De SWF representeert een algemeen belang, dat wordt afgeleid uit een moraal van billijkheid. Maar de maatschappelijke efficiëntie van Samuelson vereist slechts, dat de toestand Pareto optimaal is. Dat is mogelijk zonder een interpersoonlijke afweging van behoeften. Dit verschil is een jaar terug behandeld in de column over prestatie-sturing en besluitvorming. (terug)
  15. Het hier volgende betoog baseert op hoofdstuk 6 in The theory of externalities, public goods and club goods. (terug)
  16. Zie p.149 in The theory of externalities, public goods and club goods. (terug)
  17. Hier zijn yk en G-k nog niet gespecificeerd. De fijn gestippelde rode horizontale lijn in de figuur 2a definieert yk = p×ck en G-k=0. Als geldt G-k>0, dan begint natuurlijk in de figuur 2a de begrotings-lijn pas bij G = G-k, en is ter linkerzijde van dat punt horizontaal volgens de fijn stippelde lijn. Het beginpunt is het snijpunt van de begrotings-lijn Rk=ρ en de fijn gestippelde lijn. Het fonds G-k kan niet privaat worden geconsumeerd door de actor k. Ter rechterzijde van het punt blijft de helling van de lijn -q/p. (terug)
  18. Dat wil zeggen, de actor k kiest zijn gk,o zodanig, dat G-k + gk precies gelijk is aan de optimale waarde Go. In zekere zin gebruikt de actor k de voorziening G-k om zwart te rijden, al draagt hij ook zelf iets bij. Op p.159 in The theory of externalities, public goods and club goods noemen Cornes en Sandler dit gedrag easy riding (als een variant op free riding). (terug)
  19. Een andere manier om de figuur 2b te verklaren gaat als volgt. Het stijgende deel van de indifferentie kromme voor gk > gk,o wordt veroorzaakt, doordat de actor k steeds minder ruimte in zijn begroting yk krijgt voor de consumptie ck van private goederen. Die inperking holt zijn nut uit, en dat moet worden gecompenseerd via extra G-k. (terug)
  20. Deze opmerking wordt gemaakt op p.146 in The theory of externalities, public goods and club goods. (terug)
  21. Zie p.153 en verder in The theory of externalities, public goods and club goods. (terug)
  22. Zie bijvoorbeeld p.82 in Mikroökonomische Theorie (2011, UVK Verlagsgesellschft mbH) van W. Hoyer en W. Eibner. (terug)
  23. Dit wordt uitgelegd op p.156 in The theory of externalities, public goods and club goods. (terug)
  24. De uitleg baseert op hoofdstuk 9 in The theory of externalities, public goods and club goods. (terug)
  25. De figuur wijkt nogal af van de figuur op p.307 in The theory of externalities, public goods and club goods. Bij Cornes en Sandler kruisen de reactie krommen van de actoren elkaar dicht bij het punt (0, 0), maar niet exact er in. Volgens de auteurs is in het gevangenen-spel de keuze institutioneel beperkt tot gk = 0 of 1. De keuze g1 = g2 = 0 geeft de twee actoren dan toch het meeste nut, ook al valt het niet helemaal samen met het gewenste evenwicht. De figuur van het chicken spel in de huidige column is eveneens anders dan in het boek. (terug)
  26. In het punt (g1, g2) = (1, 1) moet de MSV natuurlijk 1 zijn voor beide actoren. Uw columnist koos voor het punt (1, 0) een MSV(1) van ½, en voor (0, 1) een MSV(1) van 2. Het pad van Pareto optimale allocatie correspondeert met een beweging over de grens van nutsmogelijkheden. Deze grens correspondeert natuurlijk weer met de grens van productie-mogelijkheden. Maar de verdeling van de geproduceerde goederen verloopt niet via een marktruil tussen de actoren. In The theory of externalities, public goods and club goods wordt het pad van Pareto optimale allocatie voor het gevangenen-spel helemaal niet behandeld. Het is inderdaad in deze context een complex onderwerp, en uw columnist hoopt, dat hij hier geen denkfout maakt. Het onderwerp is (momenteel) onvoldoende belangrijk om er dagen lang over na te denken. Uw columnist waardeert eventuele commentaren van lezers. (terug)
  27. Op p.262 in The limits of public choice constateert Udehn, dat het gevangenen-spel en de nutstheorie een verschillende uitkomst geven. Immers, in het gevangenen-spel ontstaat geen enkel publiek goed. In de nutstheorie is er slechts een onderproductie van publieke goederen. Elke actor heeft tenminste enige behoefte aan het publieke goed, en is bereid daarvoor desnoods te betalen. Udehn klaagt, dat dit laatste een onbepaalde uitspraak is, omdat het in de practijk nauwelijks mogelijk is om te bepalen, wanneer er inderdaad onderproductie is. Dat is waar. Maar de nutstheorie kent wel het determinisme van de individuele begroting yk van de actor k, alsmede het aanbod van private goederen ck, wat allebei ontbreekt in het gevangenen spel. (terug)
  28. Bij de berekening van nutswaarden voor de gemengde strategie wordt uitgegaan van een cardinale benadering. Dit is een strengere eis dan ordinaliteit. Op p.221 in The limits of public choice wordt terecht opgemerkt, dat de uitkomst van het lafaard spel onbepaald is, wegens de diverse evenwichten. Daarom kan het model geen voorspelling doen van de ontwikkelingen. (terug)
  29. Op p.309 van The theory of externalities, public goods and club goods wordt de nuts-analyse toegepast op het chicken spel. Merkwaardiger wijze wordt de in de hoofdtekst geconstateerde onverenigbaarheid van evenwicht en Pareto optimaliteit helemaal niet genoemd. Dat is vreemd, want de auteurs hebben deze problematiek ongetwijfeld onderkend. (terug)
  30. Deze voorstelling van zaken wordt gegeven op p.306 in The theory of externalities, public goods and club goods. (terug)
  31. Merk op, dat in deze tweede uitleg de optimale punten (g1, g2)= (1, 0) en (0, 1) niet liggen in het oog, dat wordt ingeklemd tussen de twee indifferentie krommen, die de Nash evenwichten doorsnijden. De optimale punten zijn weliswaar efficiënt, maar de actor 1 heeft baat bij de inperking door de spelregels, terwijl de actor 2 nut verliest ten opzichte van het nabij gelegen Nash evenwicht. Daarom veroorzaken de spelregels tevens een herverdeling. Uw columnist vindt het hele betoog toch wat moeizaam. Op p.309 van The theory of externalities, public goods and club goods wordt eveneens een nutsveld geschetst, dat zou passen bij het chicken spel. Maar de getekende indifferentie krommen zijn er zodanig, dat de reactie krommen elkaar onmogelijk op drie plaatsen kunnen snijden. En de helling van de indifferentie krommen is zodanig, dat die van de actoren 1 en 2 elkaar niet raken in de optimale punten (g1, g2) = (1, 0) en (0, 1). Uw columnist is van mening, dat zijn eigen figuur 4b een verbetering is ten opzichte van het boek. (terug)
  32. De beschouwing stimuleert vooral tot reflectie. De speltheorie van publieke goederen is wat ongrijpbaar. Bijvoorbeeld, wat wordt er bedoeld, wanneer er wordt gesproken over de situatie met twee bijdragende actoren? Worden de kosten gehalveerd? Of is dat een verdubbeling van het goed, dat beschikbaar is bij één contribuant? In The theory of externalities, public goods and club goods wordt de laatste interpretatie gehanteerd. Maar waarom kan het publieke goed alleen in discrete eenheden beschikbaar komen? Natuurlijk is de keuze van een eenheid subjectief. Maar worden de kosten per eenheid dan niet beïnvloed door schaal-effecten? De aandacht voor de aggregatie techniek van publieke goederen wordt mede door dit soort problemen geprikkeld. Maar de grote variëteit aan aggregatie technieken maakt de speltheoretische modellen minder overzichtelijk. (terug)
  33. Hier raadpleegt uw columnist p.56-57 en p.90-92 in Global collective action (2004, Cambridge University Press) van T. Sandler. Maar hij kende het ook al van p.208 in Game theory and political theory (1993, Cambridge University Press) van P.C. Ordeshook. Kennelijk gaat het model uit van een representatieve consument. De baten en kosten van elke actor zijn gelijk. Er is als het ware anonimiteit. Nog anders geformuleerd, de groep van n actoren is volkomen homogeen. Dit commentaar illustreert de hoge mate van abstractie van het gepresenteerde model van n actoren. (terug)
  34. Zie p.90-96 in Global collective action. (terug)
  35. De figuren zijn aangepaste versies van de afbeelding op p.228 in The limits of public choice. (terug)
  36. Volgens p.217 van The limits of public choice is de Nobelprijs winnaar T.C. Schelling de uitvinder van dit soort diagrammen. (terug)
  37. Op p.80-85 in Global collective action worden inderdaad ook de zwakkere-schakel technologie en de betere-poging technologie beschouwd. Dan verloopt de toename van de marginale baten geleidelijk, en niet schoks-gewijze. (terug)
  38. Zie p.82 in Global collective action. (terug)
  39. Kennelijk gaat het model uit van een representatieve consument. Immers, hier worden de baten en kosten voorgesteld als hoeveelheden nut. De last c van de bijdrage aan het goed weegt voor elke actor even zwaar, ongeacht zijn inkomen en vermogen. In werkelijkheid varieert het geldnut per actor. Meer realistische modellen nemen aan, dat de hogere inkomens-groepen meer bijdragen aan het publieke goed dan de armen. Omgekeerd hebben de rijken soms meer baten bij een publiek goed dan de armen. Dit heet het Mattheüs effect. Daarom is de idee van de representatieve consument enigszins omstreden. Dit commentaar illustreert de hoge mate van abstractie van het gepresenteerde model van bestraffing. Een eerdere column schrijft dit soort modellen toe aan de socioloog Jon Elster. Maar volgens p.217 van The limits of public choice is de Nobelprijs winnaar T.C. Schelling de uitvinder. (terug)
  40. Vier jaren terug integreerde een column de formules 4a-b in één expressie. De expressie is voorgesteld door de econoom P. Frijters. Het CAP betreft daar de herverdeling van de primaire inkomens yk binnen een groep. Elke actor k beboet andere actoren j, die naar zijn eigen mening onvoldoende bijdragen aan de herverdeling. Dat wil zeggen, de bijdrage τkj van j is kleiner dan de door k gewenste bijdrage σkj. De boete λkj neemt toe in hoogte, naarmate de afwijking x = σkj − τkj van de gewenste bijdrage groter is. Voor zover uw columnist zich kan herinneren, doet Frijters verder geen suggestie voor de functionele gedaante van de boete-functie λkj(x). (terug)
  41. Zie p.102-104 in Collective action and exchange. (terug)
  42. Merkwaardiger wijze wordt op p.103 in Collective action and exchange de nuts-kromme uk(s'', m) afgebeeld als een hellende lijn. Dat is onjuist. Merk voorts op, dat kennelijk een homo politicus niet altijd een zegen is voor de maatschappij, namelijk wanneer hij verkeerde ideeën heeft. (terug)
  43. Deze opvatting wordt ook met kracht verdedigd door Udehn op p.256 en 260 in The limits of public choice. Udehn is een aanhanger van Elster, een landgenoot en marxist. (terug)
  44. Uw columnist raadpleegde vooral Kooperative Spieltheorie (2005, Oldenbourg Wissenschaftsverlag GmbH) van H. Wiese. Hoofdstuk 12 van Social and economic networks (2008, Princeton University Press) van M.O. Jackson behandelt dezelfde materie, maar geavanceerder, kritischer èn (helaas) zeer beknopt. Uw columnist mist voor alsnog het inzicht om het betoog van Jackson eerlijk te beoordelen. Op p.305 in The theory of externalities, public goods and club goods wordt gewaarschuwd, dat de (coöperatieve) speltheorie de aanname maakt, dat onderhandelen en coördinatie geen transactie-kosten veroorzaken. Dit herinnerde uw columnist aan zijn eigen column, waarin hij de zwakten van de social choice theorie opsomt. Merk voorts op, dat het thema van deze paragraaf weinig te maken heeft met de voorgaande tekst. Hoogstens is er een verband via de wens-coalities, die elke actor bij aanvang van de onderhandelingen inbrengt. De wens-coalities worden unilateraal gekozen, zodat het resulterende netwerk ontstaat door middel van een niet-coöperatief spel. In het meest extreme geval wil niemand een coalitie vormen met anderen, zodat de actoren atomistisch blijven. Er wordt geen collectieve meerwaarde voortgebracht. Dat zou men kunnen interpreteren als een gevangenen spel. Jackson analyseert vooral deze voorbereidende spelfase. (terug)
  45. Op p.425 in Social and economic networks toont Jackson zich ontevreden over de Myerson waarde. Namelijk, hij vindt de eerste fase van coalitie-vorming geen niet-coöperatief spel. De oplossing van verdeling is een onderwerp van onderhandeling. Anderzijds is de Myerson waarde μk gebaseerd op de Shapley waarde ζk, en die is normatief (axiomatisch). Uw columnist ziet het probleem niet zo. Immers, in een onderhandeling worden ook normatieve argumenten aangevoerd. Voorts meent Jackson, dat de oplossing van verdeling rekening moet houden met alle denkbare netwerken. Maar de Myerson waarde weegt slechts één netwerk mee. Wellicht is dit stof voor een nieuwe column. (terug)
  46. Merk op, dat wegens het efficiëntie-axioma geldt Σj=13  ζj = ν({PvdA, CDA, VVD}) = 1. Dat geldt niet voor de gesommeerde stembus-uitslag, omdat hier vele partijen worden weggelaten. Daarom is de berekende waarde van ζj hier iets te groot voor elke partij j. Merk voorts op, dat ζVVD aanzienlijk groter is dan de stembus-uitslag van de VVD. In de Shapley waarde telt de winnende coalitie, en niet het aantal zetels. (terug)
  47. Op p.427-428 in Social and economic networks betoogt Jackson juist voor dit geval, dat de Myerson waarde onredelijk is. Zelfs al heeft het CDA niet de PvdA als wens-partner, dan toch is in beginsel een CDA-PvdA coalitie mogelijk. Dit geeft macht aan het CDA, zodat logischer wijze de waarde van het CDA groter moet zijn dan die van de VVD. Kennelijk denkt Jackson, dat een actor kosteloos zijn netwerk kan wijzigen, nieuwe contacten kan vormen, en oude contacten kan verbreken. Hij noemt zijn aanpak de actor-gebaseerde flexibel-netwerk oplossing. Uw columnist is (nog) niet geheel overtuigd. Immers, het CDA wil kennelijk de VVD in zijn wens-coalitie. Op dat moment wordt de dreiging om een CDA-PvdA coalitie te vormen ongeloofwaardig. (terug)
  48. Men zou natuurlijk in de figuur van 1994 de PvdA en D66 kunnen verwisselen. Dan zou D66 een brug-functie vervullen voor de PvdA. Maar die voorstelling van zaken zou suggereren, dat ook een coalitie CDA-VVD-D66 denkbaar was. En dat is onjuist. De analyse volgens de figuur 7 is nogal ex post. Vooraf was deze verhouding nauwelijks te voorzien. (terug)
  49. Het is hier niet de bedoeling om een politieke evaluatie van de diverse formaties te geven. Uw columnist heeft vooral formaties geselecteerd, die hij zelf redelijk kent. Dat vereenvoudigt het tekenen van de structuur van het netwerk. Recente fenomenen, zoals de opkomst van nationaal-conservatieve partijen (LPF, PVV, FvD), en het politieke activisme van pressie-groepen (ouderen, migranten) blijven buiten beeld. Het eenmalige succes van de SP komt wel ter sprake. De speltheoretische analyse kan een beschrijving zijn of een verklaring. Dat laatste is natuurlijk het meest bevredigend, maar ook speculatief. Uw columnist heeft op het internet gezocht naar soortgelijke analyses van de Nederlandse politieke verhoudingen, gebaseerd op de Shapley waarde. Die zoektocht heeft niets opgeleverd. Kennelijk zien bijvoorbeeld de groepen rondom speltheoretici zoals Marco Slikker en Vincent Buskens er geen brood in. Dat stemt tot nadenken. Deskundigheid is voor een groot deel weten wat zinloos is en niet kan. Anderzijds, men moet iets doen met zijn kennis. (terug)