Speltheorie in de bestuurskunde

Plaatsing in Heterodoxe Gazet Sam de Wolff: 28 december 2019

E.A. Bakkum is blogger voor het Sociaal Consultatiekantoor. Hij denkt graag na over de arbeiders beweging.

Eerst wordt in de niet-coöperatieve speltheorie een taxonomie van matrix spellen gepresenteerd, gebaseerd op het voorstel van Holzinger. Coördinatie en verdeling zijn belangrijke kenmerken. Als toepassing wordt een beleid van standaardisatie gepresenteerd. De coöperatieve speltheorie introduceert de moraal via de oplossingen van Shapley en Nash. De Shapley waarde wordt geanalyseerd. De Aumann-Drèze waarde brengt maatschappelijke verdeeldheid in rekening. Dit wordt toegelicht met enkele voorbeelden. Aldus levert de speltheorie een moreel kompas, ook voor de bestuurskunde.

De bestuurskundige F.W. Scharpf heeft in de negentiger jaren van de vorige eeuw gepleit voor de toepassing van speltheorie in de beleids- en bestuurs-kunde. Zijn ideeën hebben een enthousiast onthaal gevonden in de Gazet, en zijn samengevat in een reeks columns. De huidige column bouwt voort op het werk van Scharpf, en presenteert nog meer toepassingen van de speltheorie op collectieve actie problemen (CAP).


Taxonomie van matrix spellen

Beschouw actie situaties, waarin geen overleg plaatsvindt tussen de betrokken actoren. In de niet-coöperatieve speltheorie worden zulke situaties in normaal vorm gemodelleerd door matrices. Met name is veel onderzoek gedaan naar situaties met twee actoren k, die ieder beschikken over twee strategieën s1(k) en s2(k). Dit leidt tot 2×2 matrices. Daarbij ligt de nadruk op de symmetrische spellen, waarbij dus elke actor beschikt over dezelfde twee strategieën. Het bekendste voorbeeld van zo een spel is het gevangenen-dilemma (prisoner's dilemma). Het blijkt, dat elk abstract spel kan worden toegepast op tal van menselijke interacties, ook in het openbaar bestuur. Bijvoorbeeld beschrijft het gevangenen-dilemma het probleem om publieke goederen te financieren, variërend van defensie tot straatverlichting. Algemeen worden dit collectieve actie problemen (afgekort CAP) genoemd.

De bestuurskundige Katharina Holzinger doet in haar boek Transnational common goods (afgekort TG) een voorstel om al deze spellen te categoriseren1. Elke cel in de matrix correspondeert met een bepaalde strategie combinatie s = (sn(1), sm(2)), met n, m = 1 of 2. Elk van beide actoren k kent een zekere waarde toe aan elke uitkomst uk(s). Het grootste deel van de opgebouwde kennis betreft de symmetrische spellen. Die hebben de gedaante van de tabel 1 2. Gewoonlijk is R > P. Daarom is R de beloning (reward), en P is de straf (punishment). Aangezien meestal geldt T > S, is T de verleiding (temptation), en S is de fooi (sucker's pay-off). Deze conventie sluit aan bij het gevangenen-spel, dat s1 definieert als samenwerking en s2 als opportunisme. Asymmetrische spellen impliceren, dat de twee actoren verschillen in hun voorkeuren. Dit wordt heterogeniteit genoemd (p.83-85 in TG).

Tabel 1: uitkomsten matrix van het symmetrische spel
  actor 2
  s1s2
actor 1  s1    (R, R)    (S, T)  
  s2    (T, S)    (P, P)  

Stel dat de voorkeuren van elke actor ordinaal worden geordend, dus in oplopende voorkeur 1, 2, 3 of 4. De actor k heeft 4! = 24 manieren om zijn voorkeuren te verdelen over de 4 cellen (p.150 in TG). Met twee actoren zijn er dan 24×24 = 576 matrices denkbaar. Maar hierin zitten vele dubbel-tellingen, omdat het irrelevant is welke actor of strategie men nummert als 1 of 2. Uiteindelijk blijven er 78 verschillende matrices over. Natuurlijk is een groot gedeelte van deze spellen niet symmetrisch, te weten 66. Holzinger baseert haar taxonomie op twee kenmerken, te weten de verdeling van de uitkomst over de twee actoren, en de problemen met de coördinatie van hun acties. Zie de figuur 1.

Afbeelding van taxonomie van matrix spellen
Figuur 1: Taxonomie van 2×2 matrix spellen

De coördinatie bepaalt de totale hoeveelheid meerwaarde van de acties. Natuurlijk is coördinatie slechts hypothetisch in deze niet-coöperatieve spellen. Maar soms heeft coördinatie echt geen zin. Dit is het geval bij spellen, die instabiel zijn en dus geen situatie van evenwicht hebben. De grootste groep van spellen (57) brengt één evenwicht voort. Ook dan is coördinatie overbodig. Maar een groep van 12 spellen heeft meer dan één evenwicht. Nu zijn er twee mogelijkheden: (a) een evenwicht is sub-optimaal, of (b) de actoren hebben een smaakverschil inzake de evenwichten. Zie de rode kaders in de figuur 1. In de figuur 1 is het optimale evenwicht weergegeven door een streep boven de uitkomst (u(1), u(2)). Een sub-optimaal evenwicht is weergegeven door een streep onder de uitkomst. Zonder coördinatie kan de evenwichtige uitkomst dus sub-optimaal zijn3. De evenwichten bij de smaakverschillen gelden allebei als optimaal4.

De verdeling meet de mate van gelijkheid van de uitkomsten u1 en u2. Merk op, dat dit nutsfuncties u(q(k)) zijn, die afhangen van de reële opbrengst q(k) van actor k 5. Een gelijke uitkomst u1 = u2 betekent niet per se, dat geldt q(1) = q(2). Het constante-som spel voldoet aan u1 + u2 = constant. De winst van de ene actor gaat ten kosten van de andere6. Er zijn 3 spellen van dit type. Het geval in de figuur 1 is instabiel. In 22 spellen vertoont de verdeling harmonie. Dat wil zeggen, er is één evenwicht, en dat heeft een egalitaire verdeling. Het gevangenen-spel heeft ook één evenwicht, met u1 = u2. Nochtans is het niet harmonieus, omdat het evenwicht daar sub-optimaal is7. Er wordt armoede verdeeld. Ook bij de 6 coördinatie spellen voldoen de evenwichten aan u1 = u2.

De resterende spellen zijn enigszins conflictueus. Het rambo spel is niet symmetrisch. Hier hanteert één actor altijd dezelfde strategie. De andere actor moet zich aanpassen bij dit dictaat. Er zijn 26 van deze rambo spellen. Het chicken-spel en de strijd van de seksen lijden onder een smaakverschil. Er zijn twee evenwichten. Het conflict wordt enigszins getemperd, doordat er een symmetrie is, en geen keuze-dictaat. Elke actor heeft een kans op zijn hoogste nut. Dit type komt voor bij 6 spellen. Aldus vat Holzinger de figuur 1 samen in zeven categorieën van collectieve actie problemen (CAP): geen probleem (harmonie), of problemen van verdeling, opportunisme, coördinatie, smaakverschil, instabiliteit, en van conflict (p.155-159 in TG). Aangezien slechts 22 spellen harmonieus zijn, veroorzaken 56 een CAP in enigerlei vorm. Overleg is onmisbaar om bevredigende uitkomsten te bereiken.

De speltheorie besteedt veel aandacht aan de zogenaamde gemengde strategie. Hierin wisselt een actor zijn strategie af met een zekere kans p. Men kan bewijzen, dat er altijd een gemengde strategie bestaat, die een evenwicht realiseert8. Dit lijkt een uitweg te bieden voor de instabiele constellaties. Een gemengde strategie is zeker denkbaar, want mensen en organisaties zijn geen machines. Bijvoorbeeld controleert een inspectie-dienst vaak de doelgroep steekproefs-gewijze, zeg met een kans p per actor. Echter er is een nogal complexe berekening nodig om de juiste mengfactor p te vinden, die leidt tot het evenwicht. In practische constellaties zullen de actoren zelden of nooit in staat zijn om die berekening uit te voeren. Wellicht zou coördinatie helpen, maar dan wordt het spel coöperatief en zijn andere manieren beschikbaar om stabiliteit te realiseren.

Holzinger waarschuwt, dat het lastig is om te bepalen, welke categorieën van spellen het meest relevant zijn voor de beleids-analyse (p.158-159). Bijvoorbeeld wil het grote aantal spellen met één evenwicht (57) niet zeggen, dat de meeste echt bestaande actie situaties en constellaties een unieke stabiele oplossing hebben. Anderzijds bestaan er slechts 4 spellen van opportunistisch gedrag (zoals het gevangenen-spel). Maar die zijn wel essentieel om de zo vaak optredende problemen bij de productie van publieke goederen te begrijpen. Zij modelleren het probleem van zwart rijden (free riding). Kennelijk zit de waarde van de figuur 1 vooral in het snelle overzicht, dat zij verschaft inzake een aantal veel gebruikte speltypen. Ook wordt de samenhang tussen productie van meerwaarde en haar verdeling nog eens benadrukt.

Het is opmerkelijk, dat de spellen-taxonomie van Holzinger overeen komt met de taxonomie van Scharpf met betrekking tot onderhandelingen. Zie de column over interacties en instituties9. Ook in onderhandelingen moeten de actoren enerzijds de totale meerwaarde van hun interacties vergroten. Anderzijds zal die meerwaarde op een bepaalde manier worden verdeeld over de actoren. Merk evenwel op, dat in de niet-coöperatieve speltheorie de onderhandelingen achterwege blijven. De actoren handelen unilateraal. Coördinatie is hier slechts een onbereikbare wenselijkheid. Nochtans geeft de taxonomie van Scharpf inzicht in de soorten van coördinatie, die behoren bij een bepaald speltype. Daarom volgt hier een korte uitweiding. Er wordt aangenomen, dat de nutswaarden of uitkomsten uk rekening houden met de materiële èn normatieve voorkeuren van de actor10.

In de genoemde column karakteriseert Scharpf de productie van meerwaarde volgens de complexiteit van de interacties. Zolang de actie arena wordt gekenmerkt door een uniek en optimaal evenwicht, is coördinatie eigenlijk overbodig. De oplossing dwingt zichzelf af. Hoogstens kan de stabiliteit van de uitkomst in een rambo spel lijden onder een te grote ongelijkheid. Een CAP zoals het gevangenen-spel en coördinatie spellen kunnen worden opgelost door een gezamelijke zoektocht naar de optimale oplossing. Bij het gevangenen-spel moet aansluitend een afdwingbaar contract worden opgesteld. Bij spellen met een smaakverschil moet worden onderhandeld, omdat de verdeling leidt tot botsende belangen. Zuivere conflicten, zoals constante-som spellen, zijn niet vatbaar voor overleg11. En in realiteit is de actie arena altijd dynamisch, zodat de uitkomsten veranderlijk zijn.


Toepassing: standaardisatie van beleid

Ter illustratie van de taxonomie van 2×2 matrix spellen wordt de standaardisatie van beleid beschreven. Dit thema is al behandeld in een eerdere column, maar wordt nu nader uitgewerkt. Het voorbeeld is gebaseerd op TG, met name p.129-131. Ter herinnering: twee gemeenten willen tezamen hun beleid harmoniseren. Echter, gemeente k=1 wil veel regulering, terwijl gemeente k=2 juist weinig regulering wil. Het netto nut van een beleid met weinig regulering is voor iedere gemeente Δu = b − c, waarin b de baten van het beleid zijn, en c de kosten. Het netto nut van een beleid met veel regulering is het dubbele (Δuv = 2×Δu), aangezien zowel de kosten als de baten verdubbelen. Bovendien veroorzaakt de regulering van de ene gemeente een positieve externaliteit e bij de andere gemeente, ter grootte van de baten van de betreffende regulering12. Met andere woorden, e=b of e=2×b. Dit is allemaal materieel nut.

Het nut van de harmonisatie tot één standaard van regulering heeft materiële en normatieve (morele en ideologische) effecten. Er zijn twee componenten. Ten eerste geeft de harmonisatie zelf een nut h, wellicht omdat de kosten afnemen, of omdat men hecht aan universaliteit. Ten tweede leidt een standaardisatie, die niet de eigen keuze is, tot een last v. Dus de gemeente k=1 verliest v aan nut bij weinig regulering, en k=2 bij veel regulering. De term v drukt uit, dat de gemeenten tezamen een heterogeen gebied vormen. Aldus wordt de totale uitkomst van gemeente k bepaald door vier bijdragen: het netto nut, het externe effect door de andere gemeente, de winst door harmonisatie, en de last van een ongewilde aanpassing. De strategieën van elke gemeente k zijn s1(k) = "weinig regulering", en s2(k) = "veel regulering". De tabel 2 geeft het spel in zijn normale vorm.

Tabel 2: uitkomsten matrix van het standaardisatie spel
  gemeente 2
  weinigveel
gemeente 1  weinig  Δu + b + h − v, Δu + b + hΔu + 2×b − v, 2×Δu + b − v
  veel  2×Δu + b, Δu + 2×b2×(Δu + b) + h, 2×(Δu + b) + h − v

Veronderstel nu dat geldt Δu < 0. In isolement loont de regulering niet voor de gemeente, zelfs niet in de zelf gewilde vorm (waarin v=0)13. Kennelijk wordt de regulering extern opgelegd, wellicht door de staat. De regulering is een algemeen belang, en een publiek goed tussen de gemeenten onderling. Dit blijkt ook uit de tabel 2, waarin de positieve externaliteiten e en 2×e worden meegeteld. Het is voor een goed redelijk om aan te nemen, dat geldt Δu + e = Δu + b > 0. Dan laat de tabel 2 al meteen zien, dat gemeente 2 nut heeft van weinig regulering. Het nut bij de overige uitkomsten is afhankelijk van de politieke voorkeuren h en v.

Figuur van standaardisatie in matrix spel
Figuur 2: Standaardisatie in matrix
    spel voor (h, v);    effen = (s1, s1)
    gearceerd = (s1, s1) en (s2, s2)

De harmonisatie bij s2 ("veel") is alleen een evenwicht, wanneer is voldaan aan twee voorwaarden. Er moet gelden: v < Δu + h. Anders zal de gemeente 2 toch kiezen voor de constellatie (s2, s1). Maar ook moet gelden v > -(Δu + h), want anders zal gemeente 1 een voorkeur hebben voor de constellatie (s1, s2). Als Δu < -h, dan is deze harmonisatie geen stabiele standaardisatie. Alleen Δu > -h laat een evenwicht toe. Kennelijk vereist de stabiele harmonisatie op s2 ("veel"), dat geldt 0 < v < Δu + h met Δu > -h. Dit is het groen-blauw gearceerde gebied in de figuur 2. Een positieve uitkomst uk is niet verplicht voor een evenwicht. Maar als v < 2×(Δu + b) + h, dan hebben beide gemeenten nut van harmonisatie bij s2 ("veel"). De eis van stabiliteit garandeert, dat v hieraan voldoet.

De harmonisatie bij s1 ("weinig") is alleen een evenwicht, wanneer is voldaan aan twee voorwaarden. Er moet gelden: v < -Δu + h. Anders zal de gemeente 1 toch kiezen voor de constellatie (s2, s1). Maar ook moet gelden v > Δu − h, want anders zal gemeente 2 een voorkeur hebben voor de constellatie (s1, s2). Aan deze voorwaarde wordt altijd voldaan. Kennelijk vereist de stabiele harmonisatie op s1 ("weinig"), dat geldt 0 < v < -Δu + h. Dit is het groene gebied in de figuur 2. De bovengrens is klaarblijkelijk minder streng dan die voor harmonisatie op s2, en Δu wordt niet ingeperkt door h. Een positief nut uk is opnieuw niet verplicht. Maar als v < Δu + b + h, dan hebben beide gemeenten nut van harmonisatie bij s1 ("weinig"). Als geldt Δu > -b/2, dan wordt de positieve uitkomst afgedwongen door de eis van stabiliteit. Maar als Δu < -b/2, dan kan in het evenwicht de uitkomst negatief zijn.

Aldus wordt het volgende beeld gevonden. Als 0 < v < Δu + h, dan zijn er twee stabiele (Nash) evenwichten van standaardisatie. Bovendien zijn de uitkomsten ongelijk. De constellatie is een asymmetrisch spel van smaakverschil14. Als Δu + h < v < -Δu + h, dan is alleen (s1, s1) ("weinig") een stabiele standaardisatie. Opnieuw zijn de uitkomsten ongelijk. Dat is zonet het rambo spel, harmonie spel of gevangenen spel genoemd15. Als v > -Δu + h, dan vindt de gemeente 1 de standaardisatie op s1 een dermate zware last, dat zij er helemaal vanaf ziet. In dat geval zal de gemeente 2 altijd kiezen voor s1 ("weinig"), en de gemeente 1 zal kiezen voor s2 ("veel"). Dit is een harmonie spel, maar zwak, wegens de ongelijkheid16. Het reken-voorbeeld illustreert de mogelijke dynamiek in beleid. Als de gemeenten polariseren, of hun enthousiasme voor harmonisatie verliezen, dan kan de actie situatie veranderen.

Samenvattend: het type spel (de constellatie of actie situatie) blijkt af te hangen van materiële en normatieve afwegingen. Naarmate de gemeenten minder homogeen zijn (zie de v waarde), wordt de standaardisatie moeilijker. Echter, een sterke wil om te standaardiseren (zie de h waarde) kan zelfs een tamelijk grote heterogeniteit nog compenseren. Een sterk negatief netto nut Δu prikkelt tot standaardisatie op s1, ook bij veel heterogeniteit. Merk op, dat Δu wordt gedicteerd door de staat, dat wil zeggen, door de configuratie, waarbinnen de gemeenten moeten functioneren. De speltypen van de constellatie variëren, al naar gelang van de diverse waarden (Δu, b, v, h). Daarmee verandert ook het type van de wenselijke coördinatie en communicatie.

Meer algemeen kan worden geconstateerd, dat de speltheorie bruikbaar is om echt bestaande constellaties van beleids-harmonisatie te onderzoeken. De analist moet een inschatting maken van de situatie. Hij moet de voorkeuren van de actoren kwantificeren in de waarden van b, c, h, en v. Daarbij moet ook worden onderzocht, of die waarden verschillen per actor. Aldus worden kenmerken van de situatie vastgelegd, zoals de bereidheid van de actoren om zelf (in isolement) te reguleren. De omvang van de externaliteiten moet worden ingeschat. Ook moeten bepaalde verbanden worden vastgelegd, zoals de verhouding α>1, die hoort bij Δuv = α × Δu. De actoren handelen binnen een configuratie van beleid. Als zij geen intrinsieke prikkel tot beleid hebben, dan kan het toch worden afgedwongen door een hoger beleids-orgaan. Zelfs wanneer het niet lukt om al deze variabelen te kwantificeren, dan nog kan zo een model tenminste een kwalitatieve analyse mogelijk maken.


De moraal in de rationele-keuze leer

Economische theorieën baseren meestal op de leer van de rationele-keuze (rational choice, RC). Zij blijkt ook nuttig te zijn in de psychologie, sociologie, politicologie en beleids-analyse. Vooral de psychologie en sociologie hebben intussen de RC leer geïntegreerd in hun eigen discipline. Rationele-keuze modellen maken relatief veel gebruik van wiskundige methoden. Wegens de wiskundige notatie is het soms lastig om de normatieve grondslagen van zulke modellen te doorzien. Feitelijk is die normatieve stellingname natuurlijk juist de drijfveer om de modellen te gebruiken (of niet). De huidige paragraaf wil de moraal van twee bekende concepten onderzoeken, te weten de Shapley en Nash oplossingen. Uw columnist heeft her en der gezocht in de literatuur, ook op internet, maar merkwaardiger wijze geen gedegen ethische evaluatie van de concepten kunnen vinden.

De Shapley oplossing

In een eerdere column over de Shapley oplossing is gewezen op haar normatieve betekenis. De oplossing doet een suggestie voor de billijke verdeling van de totale opbrengst ν onder de actoren in de actie arena. De Shapley oplossing ζk(ν) voor de actor k baseert op vier axioma's, die ieder een morele norm representeren.

Aldus belichaamt de Shapley oplossing egalitarisme, loon naar werken, en zuinigheid. Dat is niet slecht voor een wiskundig model. De Shapley oplossing veronderstelt, dat deze normen breed worden ondersteund in de maatschappij. Helaas heeft uw columnist geen critici kunnen vinden van de Shapley oplossing17. Wel heeft zij enkele beperkingen. De Shapley waarde houdt geen rekening met enigerlei bestaande ongelijkheid. Zij is niet gericht op her-verdeling, bijvoorbeeld om een bestaans-minimum te waarborgen. Daarom wordt zij wel opgevat als een machts-index. Voorts veronderstelt de Shapley oplossing, dat de actie arena vrij toegankelijk is voor allen. De vorming van exclusieve coalities wordt verworpen. Inderdaad zouden groepen rente kunnen zoeken voor hun leden door de arena te monopoliseren voor zichzelf.

De Nash oplossing

In een eerdere column over de Nash oplossing is gewezen op haar normatieve betekenis. De oplossing doet een suggestie voor de billijke verdeling van de totale opbrengst onder de twee onderhandelaren. De Nash oplossing σk voor de actor k baseert op vijf axioma's, die ieder een morele norm representeren.

Aldus belichaamt de Nash oplossing egalitarisme, zuinigheid en consistentie. De veronderstelling is, dat deze normen breed worden ondersteund in de maatschappij. Een rationele actor zal deze normen inbrengen en verdedigen tijdens de onderhandeling. Er bestaat kritiek op de billijkheid van de Nash oplossing. Namelijk, de Nash oplossing σk wordt vooral bepaald door de verzameling van mogelijke opbrengsten. Zij weegt de baten niet inter-persoonlijk af. Bijvoorbeeld, als twee actoren een verzameling loten moeten verdelen, dan geeft de Nash oplossing aan allebei evenveel loten, ook wanneer de ene actor veel meer krijgt uitbetaald per lot dan de andere19. Experimenten tonen aan, dat in werkelijkheid de actoren willen delen in de grote winsten van hun wederpartij. Kennelijk zou het egalitarisme van σk rekening moeten houden met de (inter-persoonlijke!) afgunst. Voorts heeft de Nash oplossing het nadeel, dat zij de al bestaande ongelijkheid accepteert.


Kanttekeningen bij de Shapley oplossing

De uitwijdingen over de moraal verdienen een nader onderzoek. Een eerdere column heeft de Nash oplossing al grondig geanalyseerd. Daarom zal in deze paragraaf alle aandacht worden gericht op de Shapley oplossing (waarde) ζk(ν). Hoewel ζ zonet is gefundeerd op normatieve axioma's, is het merkwaardiger wijze ook mogelijk om haar te schrijven in de vorm van een wiskundige formule!20 Bij de afleiding wordt gewoonlijk aangenomen dat het nut van elke actor overdraagbaar (transferable) is aan andere actoren. Deze aanname is nogal een versimpeling, omdat het nut wordt bepaald door persoonlijke voorkeuren. Daarom wordt overdraagbaar nut meestal gelijk gesteld aan geld. Het geldnut is ruwweg gelijk voor allen. Dankzij geld kunnen de actoren in een coalitie elkaar via betalingen (side payments) compenseren voor eventuele nadelen21.

Beschouw nu een verzameling N van n actoren. Bij de berekening van ζ is de ordening van de actoren belangrijk. Stel men nummert de actoren in N als {1, 2, ..., n}. Nu elke actor een nummer heeft, kan men die ordening wijzigen op allerlei manieren, door actoren onderling te verwisselen. Zo een verwisseling wordt een permutatie π genoemd22. Bij n actoren zijn er n! (n faculteit) permutaties. De actoren kunnen zich door een vrije keuze verenigen in coalities C, waarin dus C een deelverzameling van N is. Er zijn c actoren in C, met c=|C| ≤ n. De coalitie-functie ν(C) geeft de waarde van de coalitie weer.

Foto van RVS kwartet kaart
Figuur 3: RVS kwartet kaart

Aangezien de ordening π van N belangrijk is voor ζ, moet die ordening behouden blijven in de coalities C in N, die dan worden geschreven als C(π). Bij een coalitie C van c actoren zijn er evenveel coalities C(π) als permutaties π, namelijk c!. Stel nu dat de actor k de laatste plaats bezet in de rij van c actoren. Hij is als het ware de laatst toegetreden actor in C. Hij wordt wel de spil-speler (pivot, of spil-actor) genoemd, omdat hij de coalitie voltooit23. Duidt deze coalitie aan als C(π, k). In de leer van verzamelingen wordt de coalitie zonder k geschreven als C(π, k) \ {k}. Noem deze kortweg C(π, -k). Zij bestaat uit c − 1 actoren. Dankzij deze voorstelling van zaken kan de waarde van k worden gedefinieerd als zijn marginale bijdrage aan de coalitie C. In formule is dat24

(1)     MBk(C, π, ν) = ν(C(π, k)) − ν(C(π, -k))

In zekere zin is MBk een merkwaardig begrip. Immers, de Shapley waarde negeert kennelijk de bijdragen van k aan coalities met dezelfde c actoren, maar met k niet als laatste in de ordening. Zijn waarde is expliciet gekoppeld aan de spilfunctie van k. De veronderstelling is, dat de spil-actor een bijzondere macht heeft, omdat kennelijk door zijn toetreding een verdere uitbreiding van de coalitie overbodig wordt25. De waarde van ζk(ν) wordt nu berekend door MBk(C, π, ν) te middelen over al de mogelijke permutaties π in N. Met andere woorden, de Shapley waarde is gedefinieerd als26

(2)     ζk(ν) = (1/n!) × Σalle π van n actoren  MBk(C, π, ν)

Aangezien de sommatie loopt over π, wordt daarmee gesommeerd over alle mogelijke coalities C, optredend in combinatie met N\C (de rest, zeg: N zonder C). Immers, k als laatst toegetredene bepaalt bij elke π de coalitie C. De Shapley waarde wordt wel geïnterpreteerd als een machts-index, met name indien de actie arena een stemming inhoudt27. Een illustratie van dit machts-perspectief is het unanimiteits-spel in N. Dat spel heeft een harde kern van t actoren, die tezamen de hele waarde voortbrengen, mits zij optreden als collectief. Dat wil zeggen, hun coalitie is winnend. De overige n−t actoren zijn eigenlijk overbodig. Daarom wordt de spil-functie vervuld door de laatste van de t actoren, die toetreedt tot de coalitie C. Elk van die t actoren heeft dezelfde macht. En inderdaad blijken zij allen dezelfde Shapley waarde te hebben. De resterende actoren hebben een macht van nul28.

Of beschouw een practisch voorbeeld, de emotionele en roemruchte coalitie-vorming na de Nederlandse verkiezingen van 1977. De PvdA heeft 10 zetels gewonnen, en komt op 53 zetels. Het CDA haalt 49 zetels, en de VVD stijgt naar 28 zetels, dankzij 6 zetels winst. Als grootste winnaar zijn de sociaal-democraten overtuigd, dat het tweede kabinet Den Uyl moet ontstaan29. Echter de Shapley oplossing geeft als machts-index een ander beeld. Dat komt door het meerderheids-stelsel, dat besluitvorming mogelijk maakt met meer dan 75 zetels. Het overschrijden van deze drempel is belanger dan het totale aantal zetels van de coalitie. Daardoor zijn PvdA-CDA, PvdA-VVD, CDA-VVD, en PvdA-CDA-VVD allemaal winnende coalities30. Ieder van deze partijen is een spil-actor. Definieer ν(winnende coalitie) = 1, dan is de Shapley waarde voor iedere partij 1/3.

Een kritiek op de formule 2 is, dat de waardering van de actor k uitsluitend baseert op zijn spil-functie31. Uw columnist tilt niet zwaar aan dit bezwaar. Immers, de formule 2 volgt dwingend uit de vier genoemde axioma's. De zin van de Shapley oplossing moet worden getoetst aan de zin van die axioma's, en niet aan de resulterende wiskundige formule.


Exclusie in de maatschappij: de Aumann-Drèze oplossing

Zonet is benadrukt, dat de Shapley oplossing een vrije toegang tot coalities vereist, en exclusie verwerpt. Echter, de diverse groepen kunnen er baat bij hebben om buitenstaanders daadwerkelijk duurzaam uit te sluiten, en in zekere zin uit te buiten. Een intussen bekend voorbeeld is het rente zoeken van belangen-groepen bij de staat, op kosten van andere maatschappelijke groepen. Maar zulk gedrag is maatschappelijk schadelijk. Het bekende boek Why nations fail van Acemoglu en Robinson laat zien, dat exclusieve staten neigen tot een maatschappelijke stagnatie. Ook M. Olson heeft gewaarschuwd tegen de effecten van pressie-groepen op de maatschappelijke welvaart. De huidige paragraaf wil de aanpak van Shapley toepassen op zo een verdeelde verzameling actoren. De aldus gevonden oplossing ψk(ν, P) is genoemd naar Aumann en Drèze32. Hierin beschrijft P de verdeeldheid in de verzameling actoren N.

De verdeeldheid P wordt de partitie van de verzameling N genoemd. De partitie P groepeert de n actoren van N in een verzameling van vaste coalities Cr, met r = 1, ..., R. De Cr definiëren dus de partitie, en worden de componenten van P genoemd. De componenten kunnen elke omvang hebben, maar zij overlappen niet. Hun wiskundige doorsnede is leeg. Hun wiskundige vereniging vormt de totale verzameling N. Elke actor k zit dus in een bepaalde component Cr, eventueel met andere actoren. Zijn component wordt aangeduid als P(k). De Aumann-Drèze oplossing voldoet aan de vier axioma's van efficiëntie, symmetrie, nulspelers, en lineariteit, net zoals de Shapley oplossing. Echter de strekking van deze axioma's verandert enigszins, omdat k is ingebed in zijn component P(k). Namelijk, symmetrie van actoren vereist nu bovendien, dat zij in dezelfde component zitten. En de efficiëntie wordt beperkt tot de eigen component P(k). Er moet gelden33

(3a)     Σj in P(k)  ψj(ν, P) = ν(P(k))

(3b)     ψk(ν, P) = ζkP(k))

De formule 3a definieert de componenten-efficiëntie. De formule 3b stelt, dat de Aumann-Drèze waarde gelijk is aan de Shapley waarde, waarbij de coalitie functie ν echter wordt beperkt tot P(k). Deze ingeperkte coalitie functie wordt aangeduid met νP(k). Dit drukt uit, dat de actor k enkel coalities kan aangaan met actoren binnen zijn eigen partitie P(k). De andere partities zijn onbereikbaar voor k. En de partitie in componenten is niet per se een vrije keuze van de actor zelf. Kennelijk impliceert de Aumann-Drèze waarde ψk, dat iedereen in een verdeelde maatschappij slechter af is. De onderlinge synergie is verminderd. In dit perspectief kunnen de actoren ook niet profiteren van hun monopolie positie binnen de eigen component. Zij verzwakken de andere componenten door hun isolement, maar kunnen hen niet uitbuiten. Dat is een nogal idealistische zienswijze.

Enkele voorbeelden

Het unanimiteits-spel

Een interessant voorbeeld van de gevolgen van maatschappelijke verdeeldheid is hier het unanimiteits-spel, waarin de c actoren in de deelverzameling C van N onmisbaar zijn om de uitkomst B te realiseren34. De overige n − c actoren in N zijn nulspelers. Aldus is dit spel gedefinieerd door de coalitie functie

(4)     ν(C') = B, als C in C'; ν(C') = 0, als C niet in C'

Als nu de c veto-spelers zijn verdeeld over verschillende partities, dan kan de coalitie C nooit een deelverzameling zijn van hun component P(k). Blijkens de formule 4 is dan ψk(ν, P) = 0 voor alle k in N. De maatschappelijke verdeeldheid in de verzameling N belemmert, dat de potentieel aanwezige baten in N kunnen worden gerealiseerd. De coalitie C kan enkel de baten B opleveren, wanneer de c actoren allemaal in dezelfde partitie P(k) zitten, zodat C inderdaad een deelverzameling is van P(k). Natuurlijk komt dit enkel ten goede aan de veto-spelers. De Shapley waarde en de Aumann-Drèze waarde blijven gelijk voor nulspelers, namelijk nul.

De symmetrische opbrengst Grafiek van Aumann-Drèze oplossing met partitie
Figuur 4: Aumann-Drèze ψk
   gehele verzameling N, en
    partitie in tweeën

Een ander leerzaam voorbeeld van zulke schadelijke gevolgen betreft het spel met een symmetrische coalitie functie. Die functie is gedefinieerd als35

(5)     ν(C) = f(c)

In de formule 5 is f(c) een functie van het aantal actoren in C (dus c=|C|). Die actoren zijn anoniem (symmetrisch), omdat enkel hun aantal telt. Stel bijvoorbeeld, dat geldt f(c) = c². Dit herinnert aan de nutsfunctie van een publiek goed. Immers zolang slechts een kleine groep c bijdraagt aan het goed, is hun kosten-baten verhouding ongunstig. Hun individuele nut is c. De n − c buitenstaanders profiteren wel van het goed, aangezien zij geen kosten maken, en het publieke goed geen uitsluiting of rivaliteit kent36. Naarmate de groep c groeit, gaan allen meer profiteren, omdat de actoren positieve externaliteiten veroorzaken voor elkaar. Er is een positief schaal-effect.

In de grand coalitie N is ν(N) = n², zodat wegens de symmetrie de Shapley waarde ζk(N, ν) = n is. Zie de figuur 4. Dat is een optimum, want n≥c voor alle coalities C. Neem aan, dat n een even getal is. Beschouw nu de partitie P, die de verzameling N halveert in twee gelijke componenten Π. Elke component heeft ν(Π) = ¼ × n². Dien ten gevolge is de Aumann-Drèze waarde ψk(ν, P) = ζ(νΠ) = ½ × n. Zie weer de figuur 4. Elke actor krijgt slechts de helft in vergelijking met zijn uitkomst bij een ongedeelde maatschappij. En aldus is ook de totale maatschappelijke welvaart gedaald met de helft. Aangezien de tweedeling de groepen kleiner maakt, profiteren de actoren niet meer maximaal van de aanwezige externaliteiten van publieke goederen.

Het apex spel

In sommige constellaties kunnen de gevolgen van verdeeldheid meevallen. Bijvoorbeeld, het apex spel is van nature al een verdeelde actie situatie. Dit spel beschrijft de constellatie van een sterke (apex) speler, die wordt omgeven door een netwerk van vele zwakke spelers37. Denk bijvoorbeeld aan een grote stad, zoals Groningen, die wordt omgeven door een stel randgemeenten. Stel dat deze n actoren (grote stad en randgemeenten) tezamen een beleid willen ontwikkelen in een regio-beraad. Het regio-beraad verdeelt een begroting van B. De stemprocedure van het beraad is zodanig, dat de apex speler (k, de grote stad) een meerderheid heeft, wanneer hij een coalitie aangaat met minstens één zwakke speler. Echter, de zwakke randgemeenten kunnen allen tezamen eveneens een meerderheid vormen. In formule is dat

(6)     νk(C) = B, als C \ {k} niet leeg is, of als C = N \ {k}

De kern Γ van het apex spel is leeg. Of in alledaags spraakgebruik, de twee coalities {k, j} (waarin j een randgemeente is) en N \ {k} strijden om de macht, zodat er geen evenwicht kan ontstaan38. Uiteraard bestaat de Shapley oplossing wel. Zij is ζk = (1 − 2/n) × B en ζj = 2×B / (n × (n−1)) voor j≠k 39. Een egalitarist zal vinden, dat de randgemeenten er bekaaid vanaf komen. Hij zou een recalcitrante burgemeester van een randgemeente kunnen zijn. Daarom zou die egalitarist kunnen pleiten voor een partitie P, waarbij de grote stad wordt geïsoleerd, zodat de randgemeenten zich allemaal in dezelfde component Cr bevinden. Men heeft P = {{k}, Cr}.

In de Aumann-Drèze oplossing leidt die partitie P tot ψk(ν, P) = 0 en ψj(ν, P) = B / (n−1) voor j≠k. De maatschappelijke welvaart blijft nu gelukkig op peil. Echter, stel dat nu een conflict uitbreekt onder de randgemeenten, zodat de coalitie Cr uiteen valt in twee delen. Dan is de partitie P = {{k}, C1, C2}. Nu is de totale uitkomst gelijk aan nul, en dus eveneens ψj(ν, P) = 0 voor alle j in N. De besluitvorming in het regio-beraad bevindt zich in een impasse, en vernietigt de welvaart. In de practijk zal de grote stad natuurlijk altijd een centrale positie hebben in het regio-beraad. Stel dat hij een coalitie Cm vormt met m (< n−1) randgemeenten. De constellatie blijft dan een apex spel, zij het met minder actoren. De Aumann-Drèze oplossing binnen Cm is gelijk aan ζj voor m+1 spelers. De welvaart B blijft behouden, maar het uitgesloten deel N \ Cm van de randgemeenten krijgt niets. Wegens de verdeeldheid is ψj toch minder billijk dan ζj (met j in N).


Evaluatie

Men krijgt nu en dan de indruk, dat de speltheorie trivialiteiten verkondigt op een moeilijke, wiskundige manier. Maar bij nader inzien laat zij toch vaak zien, wat de essentie van het beleids-probleem (CAP) is. Allereerst laat de speltheorie helder zien, wat de voorkeuren, belangen en conflicten zijn. Essentieel is de selectie van duurzame en stabiele interacties, via de methode van het wiskundige evenwicht. Natuurlijk kan men die ook analyseren op een verhalende manier. Bijvoorbeeld vertaalt Scharpf de figuur 1 in een keuze van interacties, zoals onderhandelen. Uw columnist meent echter, dat de figuur 1 visueel de diverse nuances herkenbaarder weergeeft40. De speltheorie veronderstelt, dat modellen van statische toestanden de grondslag leggen voor het analyseren van dynamische CAPs. Zij ontwikkelt inderdaad ook steeds meer dynamische modellen.

Vervolgens pleit de speltheorie voor een moraal, gericht op efficiëntie. Een kosten-baten analyse is inderdaad onmisbaar voor de menselijke vrijheid. Sommige diensten en voorzieningen kunnen niet op de markt worden verhandeld, zodat de staat ze moeten garanderen met behulp van instituties. Echter, dat verplicht de staat om het aanbod af te stemmen op de werkelijke individuele behoeften van zijn burgers. Het new public management (NPM) werd mede populair door efficiëntie tot een thema te maken. Hayek heeft ongetwijfeld gelijk, dat de staat beter afzijdig kan blijven in beleids-thema's, waar het algemeen belang onduidelijk is.

In de coöperatieve speltheorie krijgt de norm van gelijke behandeling terecht een hoge prioriteit. Zij wordt gekoppeld aan een meritocratische moraal. Deze normen worden verder uitgewerkt bij de kritiek op maatschappelijke verdeeldheid. Exclusie en kliek-vorming kunnen leiden tot een (aanzienlijke) verspilling en een verlies aan welvaart. Natuurlijk is dit slechts één kant van het probleem. Immers, groeps-vorming en exclusie kunnen ook een sociaal kapitaal voortbrengen. Columns in de Gazet hebben de voordelen van groepen aangetoond, met name voor haar leden. Echter, een deugdelijke moraal moet ook nadrukkelijk waarschuwen tegen afschotting en uitsluiting.

Concluderend: de speltheorie draagt een moraal aan, die vruchtbaar is ook in de beleids- en bestuurs-kunde. Scharpf heeft daadwerkelijk een decennium lang energiek geprobeerd om de bestuurskundigen enthousiast te maken over de toepassing van de speltheorie. Er moet worden geconstateerd, dat hij daarin weinig succes heeft geboekt. Dit zou te wijten kunnen zijn aan starheid binnen de bestuurskunde. Maar ook de speltheoretici zelf doen weinig moeite om hun vondsten toe te passen op bestuurlijke constellaties. Dat wekt de indruk, dat zij de zin evenmin zien als de bestuurskundigen. Dat tempert eventuele hoge verwachtingen. Ondanks dit alles gaat uw columnist er voorlopig nog flink in investeren.

  1. Zie Transnational common goods (2008, Palgrave Macmillan) van K. Holzinger. (terug)
  2. Zie p.172 in Rational-Choice-Theorie (2011, Juventa Verlag) van N. Braun en T. Gautschi, en de column over de institutionele economie. Het is jammer, dat Holzinger deze voorstelling van zake achterwege laat. (terug)
  3. Volgens p.175 in Rational-Choice-Theorie wordt zuivere coördinatie gekenmerkt door R = P > T = S. Holzinger doet dat ook op p.153 van Transnational common goods. De ordening kent slechts twee waarden (1 of 2). In dat geval ontbreekt de sub-optimale uitkomst. Er is indifferentie tussen de twee evenwichten. Maar de figuur 1 toont een versie, waarbij geldt R > P. Dan nog is kennelijk ergens een indifferentie ingebouwd, want de schaal van ordening is 1, 2, 3, zodat 4 niet afzonderlijk optreedt. Op p.173 van Rational-Choice-Theorie wordt het verzekerings-spel (assurance) voorgesteld als R > T > P > S. (terug)
  4. Volgens p.174 in Rational-Choice-Theorie wordt het chicken spel gekenmerkt door T > R > S > P. Op p.176 presenteren Braun en Gautschi de strijd van de seksen (battle of the sexes) in een vorm, die afwijkt van de tabel 1. Volgens uw columnist is echter T > S > P > R. Het merkwaardige aan dit spel is, dat een coöperatieve houding leidt tot het slechtste resultaat (R). Sommige versies veronderstellen hier indifferentie tussen P en R, dus P = R. Het beste resultaat ontstaat, wanneer de ene actor samenwerkt en de andere niet! Wellicht hebben Braun en Gautschi daarom dit geval apart behandeld. (terug)
  5. Omwille van de volledigheid wordt eraan herinnerd, dat in de Gazet het netto nut vaak wordt geschreven als het verschil van baten b en lasten c. Er geldt u(q) = b(q) − c(q). Men veronderstelt dan een cardinaal nut. Zie recent nog de column over prestatie-metingen. (terug)
  6. Zie p.145 in Game theory and political theory (1993, Cambridge University Press) van P.C. Ordeshook. Al 6 jaren terug merkte een column op, dat de ordinale en cardinale schalingen invariant zijn onder lineaire transformaties. Men kan een constante-som spel omrekenen naar een nul-som spel door de constante af te trekken van het nut van één actor. (terug)
  7. Volgens p.172 in Rational-Choice-Theorie voldoet het gevangenen-spel aan T > R > P > S. Naast het gevangenen-spel zijn er 3 andere spellen van opportunisme. Zij zijn asymmetrisch, zodat de voorkeuren van de actoren verschillen. Bijvoorbeeld: verwissel bij actor 1 in het gevangenen-spel de nutswaarden T(1) = 4 en R(1) = 3. Nu wil de actor k=1 de uitkomst (R(1), R(2)) realiseren, want dat geeft zijn hoogste nutswaarde. Echter de actor 2 behoudt zijn oude voorkeuren, zodat toch het sub-optimale evenwicht (P(1), P(2)) resulteert. Zie p. 98 in Transnational common goods. (terug)
  8. Zie p.134-136 in Game theory and political theory. Daar wordt ook de rekenwijze uitgelegd om de mengfactor p in het evenwicht te bepalen. Zie ook p.180-182 in Rational-Choice-Theorie. Op p.181 stellen Braun en Gautschi: "Es [gibt] für Nash-Gleichgewichte in gemischten Strategien gerade in Nicht-Nullsummen Situationen bisher nur wenig überzeugende empirische Evidenz". Zie voorts p.55-58 in Game theory revolving (2000, Princeton University Press) van H. Gintis. Dit laatste boek bevat nogal wat slordigheden van de auteur of redacteur. (terug)
  9. Voor wie de bron wil raadplegen, zie p.124-130 in Games real actors play (1997, Westview Press) van F.W. Scharpf. (terug)
  10. Gewoonlijk hanteert de niet-coöperatieve speltheorie het mensbeeld van de homo economicus. Die handelt louter uit rationeel eigenbelang. Echter elk mens heeft ook normatieve voorkeuren. In het alledaagse leven is de individu een homo sociologicus, die mechanisch voldoet aan normen, rollen en heuristieken. Het gaat hier om het keuze-gedrag in situaties van een ondergeschikt belang. Interessanter is de homo politicus (homo ethicus, Kantiaan, identiteits-bewaker), die bewust normatief handelt. Des al niettemin hangen mensen nogal eens normen aan, die hen een materieel voordeel opleveren. Achter de homo politicus schuilt vaak een homo economicus. Dien ten gevolge is het mensbeeld van de homo economicus toch tamelijk realistisch. Voor een gedegen beschouwing van pro-sociaal handelen, zie hoofdstuk 12 in Sozialpsychologie (2008, Springer-Verlag) van L. Werth en J. Mayer. Het standaard gedrag in het spel baseert dus op individualisme. Scharpf constateert op p.84-89 van Games real actors play, dat een actor in een bepaalde situatie kan kiezen voor een interactie oriëntatie, zoals altruïsme, wedijver, vijandschap of solidariteit. Dat verandert de uitkomsten van het spel. De analist van een bepaalde casus van beleid moet hiermee rekening houden. (terug)
  11. Deze beschouwing rekt de bruikbaarheid van de speltheorie enigszins op. Immers, de idee van zoeken in een coördinatie spel suggereert, dat nog informatie ontbreekt. En de idee van onderhandelen in een spel met een smaak-dilemma suggereert, dat de uitkomsten of voorkeuren kunnen worden veranderd. (terug)
  12. De regulering is een publiek goed voor de twee gemeenten, zonder rivaliteit of uitsluitbaarheid. Stel bijvoorbeeld, dat de regulering de grondprijs binnen de gemeente betreft. Een hoge grondprijs correspondeert dan met veel regulering. Zij levert veel inkomsten op aan de gemeente, onder andere via de verkoop van grond. De buur-gemeente met een lage grondprijs (weinig regulering) profiteert op twee manieren. Ten eerste zal zij meer bedrijvigheid kunnen aantrekken. En ten tweede kan zij haar eigen grondprijs iets verhogen, zodra de bedrijvigheid voldoende is toegenomen. Dat zijn positieve externaliteiten voor de gemeente 2. Omgekeerd heeft ook de gemeente 1 baat bij de regulering door de gemeente 2, maar minder (want e < 2×e). (terug)
  13. Dit is een verschil met p.126 en verder in Transnational common goods, waar wordt verondersteld, dat althans voor de gemeente 1 geldt Δu > 0. De gemeente 1 voelt zich meer gebaat bij enigerlei regulering dan de gemeente 2. In die actie situatie zal de gemeente 1 ook in isolement vrijwillig reguleren. Daardoor wijzigen de uitkomsten van het spel. Bijvoorbeeld kunnen zich dan coördinatie spellen voordoen. Dit illustreert de flexibiliteit van de speltheorie, die rekening kan houden met allerlei eigenaardigheden van de constellatie. (terug)
  14. Dit is het model van Scharpf, dat al is behandeld in de voorgaande column. Kennelijk kan dit geen coördinatie spel zijn. Immers, dan zou de standaardisatie op "veel" of op "weinig" regulering de beste keuze zijn voor beide gemeenten. Als dit wordt doorgerekend met behulp van de tabel 2, dan vindt men in elk van deze beide gevallen twee onverenigbare ongelijkheden voor v. (terug)
  15. Als uw columnist zich niet misrekent, dan leidt bijvoorbeeld Δu = -1, b = 3/2, h = ½ en v = 1/3 tot een gevangenen spel. Men moet dan de gevonden cardinale uitkomsten naar oplopende waarde ordenen met de ordinale uitkomsten 1, 2, 3 en 4. Het (suboptimale) ordinale evenwicht is (2, 2). Als uw columnist het goed begrijpt, dan is de combinatie Δu = -1, b = 3/2, h = 2 en v = 1/3 een rambo spel. Het ordinale evenwicht is (3, 4). Als de gemeente 1 probeert om haar beste ordinale uitkomst 4 te realiseren, dan zou zij eindigen met de slechtste ordinale uitkomst 1. (terug)
  16. Voor alle duidelijkheid: de term harmonie verwijst hier naar het type spel, en niet naar de harmonisatie van de regulering. Kies voor het zwakke harmonie spel bijvoorbeeld Δu = -1, b = 3/2, h = ½ en v = 2. Men moet dan de gevonden cardinale uitkomsten naar oplopende waarde ordenen met de ordinale uitkomsten 1, 2, 3 en 4. Elke gemeente hanteert haar voorkeurs-strategie. Maar het evenwicht is (2, 4), zodat de gemeente 1 hier toch nogal slecht af is, ondanks de harmonie. (terug)
  17. Wel vindt Ordeshook op p.463 in Game theory and political theory het lineariteits-axioma niet vanzelfsprekend. Uw columnist ziet wel iets in het axioma. Ook stelt Ordeshook, dat in sommige situaties nut niet overdraagbaar is. En de Shapley waarde wordt zonder overdraagbaar nut nogal gecompliceerd. Bijvoorbeeld kunnen er dan diverse oplossingen ontstaan. Op p.465 merkt Ordeshook op, dat de kern van het spel de verzameling werkelijk realiseerbare uitkomsten is, en daarom de billijkheid van het natuur-recht heeft. De kern is quasi-onvermijdelijk. Maar de Shapley oplossing ligt soms niet in de kern. Kennelijk wijkt de billijkheid van de Shapley waarde af van het natuur-recht. Voorts ziet Binmore op p.175 in Just playing (1998, The MIT Press) de zin van de Shapley oplossing helemaal niet (zonder verder commentaar). (terug)
  18. Het ontbreken van een nulpunt suggereert, dat plezier en pijn niet kwalitatief verschillen. Plezier vergroot slechts het nut, en pijn verkleint het nut. Zie p.20-22 in Happiness (2005, The Penguin Press) van R. Layard. Inderdaad bestaat een kosten-baten analyse uit de afweging Δu = Δb − Δc. Het netto nut Δu van een actie, de baten Δb en de kosten Δc zijn allemaal veranderingen, gemeten aan de status quo. De transformatie v = α×u + β, met constanten α en β, heeft geen wezenlijk effect op nutsverschillen Δu. De constante β valt weg, en de schaalfactor α verwijst enkel naar de definitie van de nuts-eenheid. (terug)
  19. Zie p.252 in Economic analysis, moral philosophy, and public policy (2006, Cambridge University Press) van D.N. Hausman en M.S. McPherson. De auteurs wijzen voorts op een onlogisch fenomeen van de Nash oplossing. Namelijk, als de actor k meer nutsmogelijkheden tot zijn beschikking krijgt, dan kan toch zijn deel σk afnemen. Dat is niet redelijk, en botst trouwens met de empirie. Kalai en Smorodinsky hebben hun eigen oplossing bedacht, die niet lijdt onder dit euvel (p.253). (terug)
  20. Bij het lezen over zulke vondsten (welhaast magie) kan men niet anders doen dan bewondering voelen voor de nijvere wiskundigen. (terug)
  21. Op p.321 in Game theory and political theory noemt Ordeshook de kabinets-formatie als een ander voorbeeld van overdraagbaar nut (naast geld). Namelijk, de coalitie-partijen moeten de minister-posten onderling verdelen. Men mag veronderstellen, dat een post evenveel nut oplevert aan elke partij. Ordeshook tekent daarbij aan, dat wellicht elke post toch een eigen gewicht heeft. Bijvoorbeeld wil de liberale partij vermoedelijk graag de minister van financiën leveren. Uw columnist tilt niet zwaar aan dit bezwaar. Immers, dit soort modellen wil niet de realiteit exact weergeven, maar slechts een globaal inzicht bieden. Het gaat om de grote lijn. (terug)
  22. Voor de volledigheid: verwisseling van 1 en 2 leidt tot {2, 1, 3, ..., n}. Maar men kan ook 1 en n verwisselen: {n, 2, ...., n-1, 1}. Of 1 en n, alsmede 2 en 3: {n, 3, 2, 4, ..., n-1, 1}. Enzovoort, enzovoort. Men kan elke π schrijven als een opeenvolging van paar permutaties ρ(j, k). Paar mutaties mogen zelf niet worden verwisseld. Immers ρ(2, 3) na ρ(1, 2) geeft {2, 3, 1, 4, ...}, terwijl ρ(1, 2) na ρ(2, 3) leidt tot {3, 1, 2, 4, ...}. Ordeshook merkt op p.464 in Game theory and political theory op, dat in het Shapley model elke volgorde even veel kans van optreden heeft. (terug)
  23. Zie p.204 in Rational-Choice-Theorie. De aanduiding met pivot krijgt vooral betekenis, wanneer een politieke strijd wordt beschouwd, zoals een stemming. In dat geval zorgt de pivot, dat zijn coalitie de stemming wint. Op p.206 stellen Braun en Gautschi, dat zulke stem-arena's eigenlijk de enige practische toepassing van de Shapley oplossing zijn. Namelijk, bij alle andere soorten spellen is het in de practijk bijna onmogelijk (of nogal speculatief) om de coalitie functie ν(C) te bepalen. Nochtans heeft uw columnist op internet een artikel over Nederlands kustbeheer gevonden, dat het nut van alle actoren kwantitatief maakt. Het is afkomstig van de Technische Universiteit Delft. Zie The usefulness of game theory as a method for policy evaluation. (terug)
  24. Zie p.166 in Kooperative Spieltheorie (2005, Oldenbourg Wissenschaftsverlag GmbH) van H. Wiese, of p.681 in het uitstekende en intussen klassieke naslagwerk Microeconomic theory (1995, Oxford University Press) van A. Mas-Colell, M.D. Whinston, en J.R. Green. Dit laatste boek vereist nogal wat affiniteit met wiskunde, en behandelt veel meer dan enkel speltheorie. (terug)
  25. Zie p.204 in Rational-Choice-Theorie. (terug)
  26. Zie p.215 in Kooperative Spieltheorie, p.205 in Rational-Choice-Theorie of p.681 in Microeconomic theory. Deze formule kan vrij simpel worden herschreven tot de formule in de column over social choice. Namelijk, men kan de verzameling C(π, -k) ordenen op (c−1)! manieren. En de actoren in de verzameling N\C, die dus in de ordening komen na actor k, kunnen op (n−c)! manieren worden geordend. Dus er zijn (c−1)! × (n−c)! permutaties met k op plaats c. Zie p.216 in Kooperative Spieltheorie. (terug)
  27. Zie p.204 in Rational-Choice-Theorie. (terug)
  28. Op p.466 in Game theory and political theory wordt ζk als een machts-index voor actor k gepresenteerd. Uitgangspunt zijn spellen met een spil-actor, die de coalitie winnend maakt, zoals het unanimiteits-spel. Zij C* een winnende coalitie (op p.466 staat kleinst winnende coalitie, maar volgens uw columnist is dat fout). Dan wordt de machts-index ζk(ν) = (B/n!) × Σalle C*, die k bevatten  (c − 1)! × (n − c)!. Uw columnist bedenkt het volgende voorbeeld. In het unanimiteits-spel met t veto-spelers wordt dit ζk(ν) = (B × (n − t)! / n!) × Σc=tn  (c − 1)! / (c − t)!. Immers, de winnende coalitie moet minstens t groot zijn. Er zijn (n − t)! / ((c − t)! × (n − c)!) winnende coalities met omvang c. (terug)
  29. In veertig jaren is veel veranderd. Tegenwoordig is gelukkig de dogmatiek zozeer verminderd, dat de partijen ideologisch convergeren. Bovendien is de maatschappij pluralistisch geworden. De jaren zeventig van de vorige eeuw vormen geen periode om naar terug te verlangen. Maar daardoor zijn wel de grote electorale schommelingen normaal geworden. (terug)
  30. Indertijd was in Nederland een kabinet met zowel de PvdA als de VVD ondenkbaar. Aangezien de Shapley oplossing exclusie verwerpt, en elke actor toegang geeft tot coalities, kan zij zulke vijandschap niet in rekening brengen. Hiertoe moet men partities of grafen van netwerken toevoegen. Maar in 1948-1952 regeerde de PvdA wel met de VVD. En ook de SPD had in de periode 1969-1982 een coalitie met de liberalen. De analist moet dus steeds nagaan, of is voldaan aan de aannames van de Shapley waarde. (terug)
  31. Zie p.207 in Rational-Choice-Theorie. (terug)
  32. In deze paragraaf wordt hoofdstuk H van Kooperative Spieltheorie geraadpleegd. (terug)
  33. Zie p.314 in Kooperative Spieltheorie voor (3a) en p.319 voor (3b). (terug)
  34. Zie p.320 in Kooperative Spieltheorie. (terug)
  35. Zie p.107, 321 en 353 in Kooperative Spieltheorie. (terug)
  36. Het is niet mogelijk om hun nut te berekenen, aangezien c het netto nut is, en de kosten van het publieke goed hier niet worden gespecificeerd. (terug)
  37. Zie p.94 in Kooperative Spieltheorie. (terug)
  38. Namelijk, volgens p.146 in Kooperative Spieltheorie is de kern Γ de verzameling van uitkomsten-vectoren u met Σj in N  uj = ν(N) = B, en Σj in C  uj ≥ ν(C) voor alle coalities C in N (behalve N zelf). In het apex spel kan niet worden voldaan aan de de ongelijkheid. Namelijk, zij j een randgemeente, en k de grote stad. De coalities {k, j} en N \ {k} strijden onderling om de macht. Stel dat {k, j} de macht heeft, en daardoor B opeist. Dan krijgt de coalitie N \ {k, j} niets. Zij heeft er voordeel bij om de actor j te verleiden zich bij hen te voegen. Immers, de coalitie C = N \ {k} kan ook B opeisen. De actor k kan niet voorkomen, dat de actor j hem verlaat. Dus ν({k, j}) = B kan niet de kern definiëren, omdat C = N \ {k} betere uitkomsten kan bieden aan zijn leden (j in C). Stel vervolgens, dat N \ {k} de macht heeft, en daardoor B opeist. Dan krijgt actor k niets. Hij heeft er voordeel bij om een actor j te verleiden zich bij hem te voegen. Immers, de coalitie {k, j} kan ook B opeisen. De coalitie N \ {k, j} kan niet voorkomen, dat de actor j haar verlaat. Dus ν(N \ {k}) = B kan evenmin de kern definiëren, omdat {k, j} betere uitkomsten kan bieden aan zijn leden. Noch {k, j} noch N \ {k} is de kern. Deze twee coalities hebben er voordeel bij om te voorkomen, dat ν(N) = B zelf de kern definieert. Tenslotte wordt ook ν({k} + C') = B met |C'| > 1 (diverse randgemeenten) geblokkeerd door {k, j}. Andere coalities kunnen niet de collectieve uitkomst B realiseren. Kennelijk is er geen stabiele winnende coalitie, zodat de kern leeg is. De uitleg op p.190 in Kooperative Spieltheorie hanteert dezelfde argumentatie, maar is zuiver formeel-wiskundig. In dit geval verhult het de maatschappelijke dynamiek van de constellatie. (terug)
  39. Zie p.250 in Kooperative Spieltheorie. De redenatie is als volgt. Volgens de formules 1 en 2 wordt de Shapley oplossing bepaald door de marginale bijdragen MBk. Bij twee permutaties π is MBk = 0, namelijk wanneer k=1 of k=n. Op de overige n − 2 plaatsen in de rij-volgorde is MBk = B. De sommatie in de formule 2 leidt dan tot (1 − 2/n) × B voor ζk. Er blijft 2×B/n over voor de n − 1 randgemeenten. Wegens de symmetrie verdelen zij deze opbrengst gelijk onder elkaar. (terug)
  40. Een voordeel is ook, dat studenten de speltheorie vrij eenvoudig kunnen aanleren. In tegenstelling met verhalende argumentaties kunnen zij de wetenschappelijke betogen van de speltheorie exact reproduceren. De huidige column illustreert, dat zij daarnaast hun eigen ideeën kunnen uitdrukken in speltheoretische termen. (terug)