Eerst wordt in de niet-coöperatieve speltheorie een taxonomie van matrix spellen gepresenteerd, gebaseerd op het voorstel van Holzinger. Coördinatie en verdeling zijn belangrijke kenmerken. Als toepassing wordt een beleid van standaardisatie gepresenteerd. De coöperatieve speltheorie introduceert de moraal via de oplossingen van Shapley en Nash. De Shapley waarde wordt geanalyseerd. De Aumann-Drèze waarde brengt maatschappelijke verdeeldheid in rekening. Dit wordt toegelicht met enkele voorbeelden. Aldus levert de speltheorie een moreel kompas, ook voor de bestuurskunde.
De bestuurskundige F.W. Scharpf heeft in de negentiger jaren van de vorige eeuw gepleit voor de toepassing van speltheorie in de beleids- en bestuurs-kunde. Zijn ideeën hebben een enthousiast onthaal gevonden in de Gazet, en zijn samengevat in een reeks columns. De huidige column bouwt voort op het werk van Scharpf, en presenteert nog meer toepassingen van de speltheorie op collectieve actie problemen (CAP).
Beschouw actie situaties, waarin geen overleg plaatsvindt tussen de betrokken actoren. In de niet-coöperatieve speltheorie worden zulke situaties in normaal vorm gemodelleerd door matrices. Met name is veel onderzoek gedaan naar situaties met twee actoren k, die ieder beschikken over twee strategieën s1(k) en s2(k). Dit leidt tot 2×2 matrices. Daarbij ligt de nadruk op de symmetrische spellen, waarbij dus elke actor beschikt over dezelfde twee strategieën. Het bekendste voorbeeld van zo een spel is het gevangenen-dilemma (prisoner's dilemma). Het blijkt, dat elk abstract spel kan worden toegepast op tal van menselijke interacties, ook in het openbaar bestuur. Bijvoorbeeld beschrijft het gevangenen-dilemma het probleem om publieke goederen te financieren, variërend van defensie tot straatverlichting. Algemeen worden dit collectieve actie problemen (afgekort CAP) genoemd.
De bestuurskundige Katharina Holzinger doet in haar boek Transnational common goods (afgekort TG) een voorstel om al deze spellen te categoriseren1. Elke cel in de matrix correspondeert met een bepaalde strategie combinatie s = (sn(1), sm(2)), met n, m = 1 of 2. Elk van beide actoren k kent een zekere waarde toe aan elke uitkomst uk(s). Het grootste deel van de opgebouwde kennis betreft de symmetrische spellen. Die hebben de gedaante van de tabel 1 2. Gewoonlijk is R > P. Daarom is R de beloning (reward), en P is de straf (punishment). Aangezien meestal geldt T > S, is T de verleiding (temptation), en S is de fooi (sucker's pay-off). Deze conventie sluit aan bij het gevangenen-spel, dat s1 definieert als samenwerking en s2 als opportunisme. Asymmetrische spellen impliceren, dat de twee actoren verschillen in hun voorkeuren. Dit wordt heterogeniteit genoemd (p.83-85 in TG).
actor 2 | |||
---|---|---|---|
s1 | s2 | ||
actor 1 | s1 | (R, R) | (S, T) |
s2 | (T, S) | (P, P) |
Stel dat de voorkeuren van elke actor ordinaal worden geordend, dus in oplopende voorkeur 1, 2, 3 of 4. De actor k heeft 4! = 24 manieren om zijn voorkeuren te verdelen over de 4 cellen (p.150 in TG). Met twee actoren zijn er dan 24×24 = 576 matrices denkbaar. Maar hierin zitten vele dubbel-tellingen, omdat het irrelevant is welke actor of strategie men nummert als 1 of 2. Uiteindelijk blijven er 78 verschillende matrices over. Natuurlijk is een groot gedeelte van deze spellen niet symmetrisch, te weten 66. Holzinger baseert haar taxonomie op twee kenmerken, te weten de verdeling van de uitkomst over de twee actoren, en de problemen met de coördinatie van hun acties. Zie de figuur 1.
De coördinatie bepaalt de totale hoeveelheid meerwaarde van de acties. Natuurlijk is coördinatie slechts hypothetisch in deze niet-coöperatieve spellen. Maar soms heeft coördinatie echt geen zin. Dit is het geval bij spellen, die instabiel zijn en dus geen situatie van evenwicht hebben. De grootste groep van spellen (57) brengt één evenwicht voort. Ook dan is coördinatie overbodig. Maar een groep van 12 spellen heeft meer dan één evenwicht. Nu zijn er twee mogelijkheden: (a) een evenwicht is sub-optimaal, of (b) de actoren hebben een smaakverschil inzake de evenwichten. Zie de rode kaders in de figuur 1. In de figuur 1 is het optimale evenwicht weergegeven door een streep boven de uitkomst (u(1), u(2)). Een sub-optimaal evenwicht is weergegeven door een streep onder de uitkomst. Zonder coördinatie kan de evenwichtige uitkomst dus sub-optimaal zijn3. De evenwichten bij de smaakverschillen gelden allebei als optimaal4.
De verdeling meet de mate van gelijkheid van de uitkomsten u1 en u2. Merk op, dat dit nutsfuncties u(q(k)) zijn, die afhangen van de reële opbrengst q(k) van actor k 5. Een gelijke uitkomst u1 = u2 betekent niet per se, dat geldt q(1) = q(2). Het constante-som spel voldoet aan u1 + u2 = constant. De winst van de ene actor gaat ten kosten van de andere6. Er zijn 3 spellen van dit type. Het geval in de figuur 1 is instabiel. In 22 spellen vertoont de verdeling harmonie. Dat wil zeggen, er is één evenwicht, en dat heeft een egalitaire verdeling. Het gevangenen-spel heeft ook één evenwicht, met u1 = u2. Nochtans is het niet harmonieus, omdat het evenwicht daar sub-optimaal is7. Er wordt armoede verdeeld. Ook bij de 6 coördinatie spellen voldoen de evenwichten aan u1 = u2.
De resterende spellen zijn enigszins conflictueus. Het rambo spel is niet symmetrisch. Hier hanteert één actor altijd dezelfde strategie. De andere actor moet zich aanpassen bij dit dictaat. Er zijn 26 van deze rambo spellen. Het chicken-spel en de strijd van de seksen lijden onder een smaakverschil. Er zijn twee evenwichten. Het conflict wordt enigszins getemperd, doordat er een symmetrie is, en geen keuze-dictaat. Elke actor heeft een kans op zijn hoogste nut. Dit type komt voor bij 6 spellen. Aldus vat Holzinger de figuur 1 samen in zeven categorieën van collectieve actie problemen (CAP): geen probleem (harmonie), of problemen van verdeling, opportunisme, coördinatie, smaakverschil, instabiliteit, en van conflict (p.155-159 in TG). Aangezien slechts 22 spellen harmonieus zijn, veroorzaken 56 een CAP in enigerlei vorm. Overleg is onmisbaar om bevredigende uitkomsten te bereiken.
De speltheorie besteedt veel aandacht aan de zogenaamde gemengde strategie. Hierin wisselt een actor zijn strategie af met een zekere kans p. Men kan bewijzen, dat er altijd een gemengde strategie bestaat, die een evenwicht realiseert8. Dit lijkt een uitweg te bieden voor de instabiele constellaties. Een gemengde strategie is zeker denkbaar, want mensen en organisaties zijn geen machines. Bijvoorbeeld controleert een inspectie-dienst vaak de doelgroep steekproefs-gewijze, zeg met een kans p per actor. Echter er is een nogal complexe berekening nodig om de juiste mengfactor p te vinden, die leidt tot het evenwicht. In practische constellaties zullen de actoren zelden of nooit in staat zijn om die berekening uit te voeren. Wellicht zou coördinatie helpen, maar dan wordt het spel coöperatief en zijn andere manieren beschikbaar om stabiliteit te realiseren.
Holzinger waarschuwt, dat het lastig is om te bepalen, welke categorieën van spellen het meest relevant zijn voor de beleids-analyse (p.158-159). Bijvoorbeeld wil het grote aantal spellen met één evenwicht (57) niet zeggen, dat de meeste echt bestaande actie situaties en constellaties een unieke stabiele oplossing hebben. Anderzijds bestaan er slechts 4 spellen van opportunistisch gedrag (zoals het gevangenen-spel). Maar die zijn wel essentieel om de zo vaak optredende problemen bij de productie van publieke goederen te begrijpen. Zij modelleren het probleem van zwart rijden (free riding). Kennelijk zit de waarde van de figuur 1 vooral in het snelle overzicht, dat zij verschaft inzake een aantal veel gebruikte speltypen. Ook wordt de samenhang tussen productie van meerwaarde en haar verdeling nog eens benadrukt.
Het is opmerkelijk, dat de spellen-taxonomie van Holzinger overeen komt met de taxonomie van Scharpf met betrekking tot onderhandelingen. Zie de column over interacties en instituties9. Ook in onderhandelingen moeten de actoren enerzijds de totale meerwaarde van hun interacties vergroten. Anderzijds zal die meerwaarde op een bepaalde manier worden verdeeld over de actoren. Merk evenwel op, dat in de niet-coöperatieve speltheorie de onderhandelingen achterwege blijven. De actoren handelen unilateraal. Coördinatie is hier slechts een onbereikbare wenselijkheid. Nochtans geeft de taxonomie van Scharpf inzicht in de soorten van coördinatie, die behoren bij een bepaald speltype. Daarom volgt hier een korte uitweiding. Er wordt aangenomen, dat de nutswaarden of uitkomsten uk rekening houden met de materiële èn normatieve voorkeuren van de actor10.
In de genoemde column karakteriseert Scharpf de productie van meerwaarde volgens de complexiteit van de interacties. Zolang de actie arena wordt gekenmerkt door een uniek en optimaal evenwicht, is coördinatie eigenlijk overbodig. De oplossing dwingt zichzelf af. Hoogstens kan de stabiliteit van de uitkomst in een rambo spel lijden onder een te grote ongelijkheid. Een CAP zoals het gevangenen-spel en coördinatie spellen kunnen worden opgelost door een gezamelijke zoektocht naar de optimale oplossing. Bij het gevangenen-spel moet aansluitend een afdwingbaar contract worden opgesteld. Bij spellen met een smaakverschil moet worden onderhandeld, omdat de verdeling leidt tot botsende belangen. Zuivere conflicten, zoals constante-som spellen, zijn niet vatbaar voor overleg11. En in realiteit is de actie arena altijd dynamisch, zodat de uitkomsten veranderlijk zijn.
Ter illustratie van de taxonomie van 2×2 matrix spellen wordt de standaardisatie van beleid beschreven. Dit thema is al behandeld in een eerdere column, maar wordt nu nader uitgewerkt. Het voorbeeld is gebaseerd op TG, met name p.129-131. Ter herinnering: twee gemeenten willen tezamen hun beleid harmoniseren. Echter, gemeente k=1 wil veel regulering, terwijl gemeente k=2 juist weinig regulering wil. Het netto nut van een beleid met weinig regulering is voor iedere gemeente Δu = b − c, waarin b de baten van het beleid zijn, en c de kosten. Het netto nut van een beleid met veel regulering is het dubbele (Δuv = 2×Δu), aangezien zowel de kosten als de baten verdubbelen. Bovendien veroorzaakt de regulering van de ene gemeente een positieve externaliteit e bij de andere gemeente, ter grootte van de baten van de betreffende regulering12. Met andere woorden, e=b of e=2×b. Dit is allemaal materieel nut.
Het nut van de harmonisatie tot één standaard van regulering heeft materiële en normatieve (morele en ideologische) effecten. Er zijn twee componenten. Ten eerste geeft de harmonisatie zelf een nut h, wellicht omdat de kosten afnemen, of omdat men hecht aan universaliteit. Ten tweede leidt een standaardisatie, die niet de eigen keuze is, tot een last v. Dus de gemeente k=1 verliest v aan nut bij weinig regulering, en k=2 bij veel regulering. De term v drukt uit, dat de gemeenten tezamen een heterogeen gebied vormen. Aldus wordt de totale uitkomst van gemeente k bepaald door vier bijdragen: het netto nut, het externe effect door de andere gemeente, de winst door harmonisatie, en de last van een ongewilde aanpassing. De strategieën van elke gemeente k zijn s1(k) = "weinig regulering", en s2(k) = "veel regulering". De tabel 2 geeft het spel in zijn normale vorm.
gemeente 2 | |||
---|---|---|---|
weinig | veel | ||
gemeente 1 | weinig | Δu + b + h − v, Δu + b + h | Δu + 2×b − v, 2×Δu + b − v |
veel | 2×Δu + b, Δu + 2×b | 2×(Δu + b) + h, 2×(Δu + b) + h − v |
Veronderstel nu dat geldt Δu < 0. In isolement loont de regulering niet voor de gemeente, zelfs niet in de zelf gewilde vorm (waarin v=0)13. Kennelijk wordt de regulering extern opgelegd, wellicht door de staat. De regulering is een algemeen belang, en een publiek goed tussen de gemeenten onderling. Dit blijkt ook uit de tabel 2, waarin de positieve externaliteiten e en 2×e worden meegeteld. Het is voor een goed redelijk om aan te nemen, dat geldt Δu + e = Δu + b > 0. Dan laat de tabel 2 al meteen zien, dat gemeente 2 nut heeft van weinig regulering. Het nut bij de overige uitkomsten is afhankelijk van de politieke voorkeuren h en v.
De harmonisatie bij s2 ("veel") is alleen een evenwicht, wanneer is voldaan aan twee voorwaarden. Er moet gelden: v < Δu + h. Anders zal de gemeente 2 toch kiezen voor de constellatie (s2, s1). Maar ook moet gelden v > -(Δu + h), want anders zal gemeente 1 een voorkeur hebben voor de constellatie (s1, s2). Als Δu < -h, dan is deze harmonisatie geen stabiele standaardisatie. Alleen Δu > -h laat een evenwicht toe. Kennelijk vereist de stabiele harmonisatie op s2 ("veel"), dat geldt 0 < v < Δu + h met Δu > -h. Dit is het groen-blauw gearceerde gebied in de figuur 2. Een positieve uitkomst uk is niet verplicht voor een evenwicht. Maar als v < 2×(Δu + b) + h, dan hebben beide gemeenten nut van harmonisatie bij s2 ("veel"). De eis van stabiliteit garandeert, dat v hieraan voldoet.
De harmonisatie bij s1 ("weinig") is alleen een evenwicht, wanneer is voldaan aan twee voorwaarden. Er moet gelden: v < -Δu + h. Anders zal de gemeente 1 toch kiezen voor de constellatie (s2, s1). Maar ook moet gelden v > Δu − h, want anders zal gemeente 2 een voorkeur hebben voor de constellatie (s1, s2). Aan deze voorwaarde wordt altijd voldaan. Kennelijk vereist de stabiele harmonisatie op s1 ("weinig"), dat geldt 0 < v < -Δu + h. Dit is het groene gebied in de figuur 2. De bovengrens is klaarblijkelijk minder streng dan die voor harmonisatie op s2, en Δu wordt niet ingeperkt door h. Een positief nut uk is opnieuw niet verplicht. Maar als v < Δu + b + h, dan hebben beide gemeenten nut van harmonisatie bij s1 ("weinig"). Als geldt Δu > -b/2, dan wordt de positieve uitkomst afgedwongen door de eis van stabiliteit. Maar als Δu < -b/2, dan kan in het evenwicht de uitkomst negatief zijn.
Aldus wordt het volgende beeld gevonden. Als 0 < v < Δu + h, dan zijn er twee stabiele (Nash) evenwichten van standaardisatie. Bovendien zijn de uitkomsten ongelijk. De constellatie is een asymmetrisch spel van smaakverschil14. Als Δu + h < v < -Δu + h, dan is alleen (s1, s1) ("weinig") een stabiele standaardisatie. Opnieuw zijn de uitkomsten ongelijk. Dat is zonet het rambo spel, harmonie spel of gevangenen spel genoemd15. Als v > -Δu + h, dan vindt de gemeente 1 de standaardisatie op s1 een dermate zware last, dat zij er helemaal vanaf ziet. In dat geval zal de gemeente 2 altijd kiezen voor s1 ("weinig"), en de gemeente 1 zal kiezen voor s2 ("veel"). Dit is een harmonie spel, maar zwak, wegens de ongelijkheid16. Het reken-voorbeeld illustreert de mogelijke dynamiek in beleid. Als de gemeenten polariseren, of hun enthousiasme voor harmonisatie verliezen, dan kan de actie situatie veranderen.
Samenvattend: het type spel (de constellatie of actie situatie) blijkt af te hangen van materiële en normatieve afwegingen. Naarmate de gemeenten minder homogeen zijn (zie de v waarde), wordt de standaardisatie moeilijker. Echter, een sterke wil om te standaardiseren (zie de h waarde) kan zelfs een tamelijk grote heterogeniteit nog compenseren. Een sterk negatief netto nut Δu prikkelt tot standaardisatie op s1, ook bij veel heterogeniteit. Merk op, dat Δu wordt gedicteerd door de staat, dat wil zeggen, door de configuratie, waarbinnen de gemeenten moeten functioneren. De speltypen van de constellatie variëren, al naar gelang van de diverse waarden (Δu, b, v, h). Daarmee verandert ook het type van de wenselijke coördinatie en communicatie.
Meer algemeen kan worden geconstateerd, dat de speltheorie bruikbaar is om echt bestaande constellaties van beleids-harmonisatie te onderzoeken. De analist moet een inschatting maken van de situatie. Hij moet de voorkeuren van de actoren kwantificeren in de waarden van b, c, h, en v. Daarbij moet ook worden onderzocht, of die waarden verschillen per actor. Aldus worden kenmerken van de situatie vastgelegd, zoals de bereidheid van de actoren om zelf (in isolement) te reguleren. De omvang van de externaliteiten moet worden ingeschat. Ook moeten bepaalde verbanden worden vastgelegd, zoals de verhouding α>1, die hoort bij Δuv = α × Δu. De actoren handelen binnen een configuratie van beleid. Als zij geen intrinsieke prikkel tot beleid hebben, dan kan het toch worden afgedwongen door een hoger beleids-orgaan. Zelfs wanneer het niet lukt om al deze variabelen te kwantificeren, dan nog kan zo een model tenminste een kwalitatieve analyse mogelijk maken.
Economische theorieën baseren meestal op de leer van de rationele-keuze (rational choice, RC). Zij blijkt ook nuttig te zijn in de psychologie, sociologie, politicologie en beleids-analyse. Vooral de psychologie en sociologie hebben intussen de RC leer geïntegreerd in hun eigen discipline. Rationele-keuze modellen maken relatief veel gebruik van wiskundige methoden. Wegens de wiskundige notatie is het soms lastig om de normatieve grondslagen van zulke modellen te doorzien. Feitelijk is die normatieve stellingname natuurlijk juist de drijfveer om de modellen te gebruiken (of niet). De huidige paragraaf wil de moraal van twee bekende concepten onderzoeken, te weten de Shapley en Nash oplossingen. Uw columnist heeft her en der gezocht in de literatuur, ook op internet, maar merkwaardiger wijze geen gedegen ethische evaluatie van de concepten kunnen vinden.
In een eerdere column over de Shapley oplossing is gewezen op haar normatieve betekenis. De oplossing doet een suggestie voor de billijke verdeling van de totale opbrengst ν onder de actoren in de actie arena. De Shapley oplossing ζk(ν) voor de actor k baseert op vier axioma's, die ieder een morele norm representeren.
Aldus belichaamt de Shapley oplossing egalitarisme, loon naar werken, en zuinigheid. Dat is niet slecht voor een wiskundig model. De Shapley oplossing veronderstelt, dat deze normen breed worden ondersteund in de maatschappij. Helaas heeft uw columnist geen critici kunnen vinden van de Shapley oplossing17. Wel heeft zij enkele beperkingen. De Shapley waarde houdt geen rekening met enigerlei bestaande ongelijkheid. Zij is niet gericht op her-verdeling, bijvoorbeeld om een bestaans-minimum te waarborgen. Daarom wordt zij wel opgevat als een machts-index. Voorts veronderstelt de Shapley oplossing, dat de actie arena vrij toegankelijk is voor allen. De vorming van exclusieve coalities wordt verworpen. Inderdaad zouden groepen rente kunnen zoeken voor hun leden door de arena te monopoliseren voor zichzelf.
In een eerdere column over de Nash oplossing is gewezen op haar normatieve betekenis. De oplossing doet een suggestie voor de billijke verdeling van de totale opbrengst onder de twee onderhandelaren. De Nash oplossing σk voor de actor k baseert op vijf axioma's, die ieder een morele norm representeren.
Aldus belichaamt de Nash oplossing egalitarisme, zuinigheid en consistentie. De veronderstelling is, dat deze normen breed worden ondersteund in de maatschappij. Een rationele actor zal deze normen inbrengen en verdedigen tijdens de onderhandeling. Er bestaat kritiek op de billijkheid van de Nash oplossing. Namelijk, de Nash oplossing σk wordt vooral bepaald door de verzameling van mogelijke opbrengsten. Zij weegt de baten niet inter-persoonlijk af. Bijvoorbeeld, als twee actoren een verzameling loten moeten verdelen, dan geeft de Nash oplossing aan allebei evenveel loten, ook wanneer de ene actor veel meer krijgt uitbetaald per lot dan de andere19. Experimenten tonen aan, dat in werkelijkheid de actoren willen delen in de grote winsten van hun wederpartij. Kennelijk zou het egalitarisme van σk rekening moeten houden met de (inter-persoonlijke!) afgunst. Voorts heeft de Nash oplossing het nadeel, dat zij de al bestaande ongelijkheid accepteert.
De uitwijdingen over de moraal verdienen een nader onderzoek. Een eerdere column heeft de Nash oplossing al grondig geanalyseerd. Daarom zal in deze paragraaf alle aandacht worden gericht op de Shapley oplossing (waarde) ζk(ν). Hoewel ζ zonet is gefundeerd op normatieve axioma's, is het merkwaardiger wijze ook mogelijk om haar te schrijven in de vorm van een wiskundige formule!20 Bij de afleiding wordt gewoonlijk aangenomen dat het nut van elke actor overdraagbaar (transferable) is aan andere actoren. Deze aanname is nogal een versimpeling, omdat het nut wordt bepaald door persoonlijke voorkeuren. Daarom wordt overdraagbaar nut meestal gelijk gesteld aan geld. Het geldnut is ruwweg gelijk voor allen. Dankzij geld kunnen de actoren in een coalitie elkaar via betalingen (side payments) compenseren voor eventuele nadelen21.
Beschouw nu een verzameling N van n actoren. Bij de berekening van ζ is de ordening van de actoren belangrijk. Stel men nummert de actoren in N als {1, 2, ..., n}. Nu elke actor een nummer heeft, kan men die ordening wijzigen op allerlei manieren, door actoren onderling te verwisselen. Zo een verwisseling wordt een permutatie π genoemd22. Bij n actoren zijn er n! (n faculteit) permutaties. De actoren kunnen zich door een vrije keuze verenigen in coalities C, waarin dus C een deelverzameling van N is. Er zijn c actoren in C, met c=|C| ≤ n. De coalitie-functie ν(C) geeft de waarde van de coalitie weer.
Aangezien de ordening π van N belangrijk is voor ζ, moet die ordening behouden blijven in de coalities C in N, die dan worden geschreven als C(π). Bij een coalitie C van c actoren zijn er evenveel coalities C(π) als permutaties π, namelijk c!. Stel nu dat de actor k de laatste plaats bezet in de rij van c actoren. Hij is als het ware de laatst toegetreden actor in C. Hij wordt wel de spil-speler (pivot, of spil-actor) genoemd, omdat hij de coalitie voltooit23. Duidt deze coalitie aan als C(π, k). In de leer van verzamelingen wordt de coalitie zonder k geschreven als C(π, k) \ {k}. Noem deze kortweg C(π, -k). Zij bestaat uit c − 1 actoren. Dankzij deze voorstelling van zaken kan de waarde van k worden gedefinieerd als zijn marginale bijdrage aan de coalitie C. In formule is dat24
(1) MBk(C, π, ν) = ν(C(π, k)) − ν(C(π, -k))
In zekere zin is MBk een merkwaardig begrip. Immers, de Shapley waarde negeert kennelijk de bijdragen van k aan coalities met dezelfde c actoren, maar met k niet als laatste in de ordening. Zijn waarde is expliciet gekoppeld aan de spilfunctie van k. De veronderstelling is, dat de spil-actor een bijzondere macht heeft, omdat kennelijk door zijn toetreding een verdere uitbreiding van de coalitie overbodig wordt25. De waarde van ζk(ν) wordt nu berekend door MBk(C, π, ν) te middelen over al de mogelijke permutaties π in N. Met andere woorden, de Shapley waarde is gedefinieerd als26
(2) ζk(ν) = (1/n!) × Σalle π van n actoren MBk(C, π, ν)
Aangezien de sommatie loopt over π, wordt daarmee gesommeerd over alle mogelijke coalities C, optredend in combinatie met N\C (de rest, zeg: N zonder C). Immers, k als laatst toegetredene bepaalt bij elke π de coalitie C. De Shapley waarde wordt wel geïnterpreteerd als een machts-index, met name indien de actie arena een stemming inhoudt27. Een illustratie van dit machts-perspectief is het unanimiteits-spel in N. Dat spel heeft een harde kern van t actoren, die tezamen de hele waarde voortbrengen, mits zij optreden als collectief. Dat wil zeggen, hun coalitie is winnend. De overige n−t actoren zijn eigenlijk overbodig. Daarom wordt de spil-functie vervuld door de laatste van de t actoren, die toetreedt tot de coalitie C. Elk van die t actoren heeft dezelfde macht. En inderdaad blijken zij allen dezelfde Shapley waarde te hebben. De resterende actoren hebben een macht van nul28.
Of beschouw een practisch voorbeeld, de emotionele en roemruchte coalitie-vorming na de Nederlandse verkiezingen van 1977. De PvdA heeft 10 zetels gewonnen, en komt op 53 zetels. Het CDA haalt 49 zetels, en de VVD stijgt naar 28 zetels, dankzij 6 zetels winst. Als grootste winnaar zijn de sociaal-democraten overtuigd, dat het tweede kabinet Den Uyl moet ontstaan29. Echter de Shapley oplossing geeft als machts-index een ander beeld. Dat komt door het meerderheids-stelsel, dat besluitvorming mogelijk maakt met meer dan 75 zetels. Het overschrijden van deze drempel is belanger dan het totale aantal zetels van de coalitie. Daardoor zijn PvdA-CDA, PvdA-VVD, CDA-VVD, en PvdA-CDA-VVD allemaal winnende coalities30. Ieder van deze partijen is een spil-actor. Definieer ν(winnende coalitie) = 1, dan is de Shapley waarde voor iedere partij 1/3.
Een kritiek op de formule 2 is, dat de waardering van de actor k uitsluitend baseert op zijn spil-functie31. Uw columnist tilt niet zwaar aan dit bezwaar. Immers, de formule 2 volgt dwingend uit de vier genoemde axioma's. De zin van de Shapley oplossing moet worden getoetst aan de zin van die axioma's, en niet aan de resulterende wiskundige formule.
Zonet is benadrukt, dat de Shapley oplossing een vrije toegang tot coalities vereist, en exclusie verwerpt. Echter, de diverse groepen kunnen er baat bij hebben om buitenstaanders daadwerkelijk duurzaam uit te sluiten, en in zekere zin uit te buiten. Een intussen bekend voorbeeld is het rente zoeken van belangen-groepen bij de staat, op kosten van andere maatschappelijke groepen. Maar zulk gedrag is maatschappelijk schadelijk. Het bekende boek Why nations fail van Acemoglu en Robinson laat zien, dat exclusieve staten neigen tot een maatschappelijke stagnatie. Ook M. Olson heeft gewaarschuwd tegen de effecten van pressie-groepen op de maatschappelijke welvaart. De huidige paragraaf wil de aanpak van Shapley toepassen op zo een verdeelde verzameling actoren. De aldus gevonden oplossing ψk(ν, P) is genoemd naar Aumann en Drèze32. Hierin beschrijft P de verdeeldheid in de verzameling actoren N.
De verdeeldheid P wordt de partitie van de verzameling N genoemd. De partitie P groepeert de n actoren van N in een verzameling van vaste coalities Cr, met r = 1, ..., R. De Cr definiëren dus de partitie, en worden de componenten van P genoemd. De componenten kunnen elke omvang hebben, maar zij overlappen niet. Hun wiskundige doorsnede is leeg. Hun wiskundige vereniging vormt de totale verzameling N. Elke actor k zit dus in een bepaalde component Cr, eventueel met andere actoren. Zijn component wordt aangeduid als P(k). De Aumann-Drèze oplossing voldoet aan de vier axioma's van efficiëntie, symmetrie, nulspelers, en lineariteit, net zoals de Shapley oplossing. Echter de strekking van deze axioma's verandert enigszins, omdat k is ingebed in zijn component P(k). Namelijk, symmetrie van actoren vereist nu bovendien, dat zij in dezelfde component zitten. En de efficiëntie wordt beperkt tot de eigen component P(k). Er moet gelden33
(3a) Σj in P(k) ψj(ν, P) = ν(P(k))
(3b) ψk(ν, P) = ζk(νP(k))
De formule 3a definieert de componenten-efficiëntie. De formule 3b stelt, dat de Aumann-Drèze waarde gelijk is aan de Shapley waarde, waarbij de coalitie functie ν echter wordt beperkt tot P(k). Deze ingeperkte coalitie functie wordt aangeduid met νP(k). Dit drukt uit, dat de actor k enkel coalities kan aangaan met actoren binnen zijn eigen partitie P(k). De andere partities zijn onbereikbaar voor k. En de partitie in componenten is niet per se een vrije keuze van de actor zelf. Kennelijk impliceert de Aumann-Drèze waarde ψk, dat iedereen in een verdeelde maatschappij slechter af is. De onderlinge synergie is verminderd. In dit perspectief kunnen de actoren ook niet profiteren van hun monopolie positie binnen de eigen component. Zij verzwakken de andere componenten door hun isolement, maar kunnen hen niet uitbuiten. Dat is een nogal idealistische zienswijze.
Een interessant voorbeeld van de gevolgen van maatschappelijke verdeeldheid is hier het unanimiteits-spel, waarin de c actoren in de deelverzameling C van N onmisbaar zijn om de uitkomst B te realiseren34. De overige n − c actoren in N zijn nulspelers. Aldus is dit spel gedefinieerd door de coalitie functie
(4) ν(C') = B, als C in C'; ν(C') = 0, als C niet in C'
Als nu de c veto-spelers zijn verdeeld over verschillende partities, dan kan de coalitie C nooit een deelverzameling zijn van hun component P(k). Blijkens de formule 4 is dan ψk(ν, P) = 0 voor alle k in N. De maatschappelijke verdeeldheid in de verzameling N belemmert, dat de potentieel aanwezige baten in N kunnen worden gerealiseerd. De coalitie C kan enkel de baten B opleveren, wanneer de c actoren allemaal in dezelfde partitie P(k) zitten, zodat C inderdaad een deelverzameling is van P(k). Natuurlijk komt dit enkel ten goede aan de veto-spelers. De Shapley waarde en de Aumann-Drèze waarde blijven gelijk voor nulspelers, namelijk nul.
Een ander leerzaam voorbeeld van zulke schadelijke gevolgen betreft het spel met een symmetrische coalitie functie. Die functie is gedefinieerd als35
(5) ν(C) = f(c)
In de formule 5 is f(c) een functie van het aantal actoren in C (dus c=|C|). Die actoren zijn anoniem (symmetrisch), omdat enkel hun aantal telt. Stel bijvoorbeeld, dat geldt f(c) = c². Dit herinnert aan de nutsfunctie van een publiek goed. Immers zolang slechts een kleine groep c bijdraagt aan het goed, is hun kosten-baten verhouding ongunstig. Hun individuele nut is c. De n − c buitenstaanders profiteren wel van het goed, aangezien zij geen kosten maken, en het publieke goed geen uitsluiting of rivaliteit kent36. Naarmate de groep c groeit, gaan allen meer profiteren, omdat de actoren positieve externaliteiten veroorzaken voor elkaar. Er is een positief schaal-effect.
In de grand coalitie N is ν(N) = n², zodat wegens de symmetrie de Shapley waarde ζk(N, ν) = n is. Zie de figuur 4. Dat is een optimum, want n≥c voor alle coalities C. Neem aan, dat n een even getal is. Beschouw nu de partitie P, die de verzameling N halveert in twee gelijke componenten Π. Elke component heeft ν(Π) = ¼ × n². Dien ten gevolge is de Aumann-Drèze waarde ψk(ν, P) = ζ(νΠ) = ½ × n. Zie weer de figuur 4. Elke actor krijgt slechts de helft in vergelijking met zijn uitkomst bij een ongedeelde maatschappij. En aldus is ook de totale maatschappelijke welvaart gedaald met de helft. Aangezien de tweedeling de groepen kleiner maakt, profiteren de actoren niet meer maximaal van de aanwezige externaliteiten van publieke goederen.
Het apex spelIn sommige constellaties kunnen de gevolgen van verdeeldheid meevallen. Bijvoorbeeld, het apex spel is van nature al een verdeelde actie situatie. Dit spel beschrijft de constellatie van een sterke (apex) speler, die wordt omgeven door een netwerk van vele zwakke spelers37. Denk bijvoorbeeld aan een grote stad, zoals Groningen, die wordt omgeven door een stel randgemeenten. Stel dat deze n actoren (grote stad en randgemeenten) tezamen een beleid willen ontwikkelen in een regio-beraad. Het regio-beraad verdeelt een begroting van B. De stemprocedure van het beraad is zodanig, dat de apex speler (k, de grote stad) een meerderheid heeft, wanneer hij een coalitie aangaat met minstens één zwakke speler. Echter, de zwakke randgemeenten kunnen allen tezamen eveneens een meerderheid vormen. In formule is dat
(6) νk(C) = B, als C \ {k} niet leeg is, of als C = N \ {k}
De kern Γ van het apex spel is leeg. Of in alledaags spraakgebruik, de twee coalities {k, j} (waarin j een randgemeente is) en N \ {k} strijden om de macht, zodat er geen evenwicht kan ontstaan38. Uiteraard bestaat de Shapley oplossing wel. Zij is ζk = (1 − 2/n) × B en ζj = 2×B / (n × (n−1)) voor j≠k 39. Een egalitarist zal vinden, dat de randgemeenten er bekaaid vanaf komen. Hij zou een recalcitrante burgemeester van een randgemeente kunnen zijn. Daarom zou die egalitarist kunnen pleiten voor een partitie P, waarbij de grote stad wordt geïsoleerd, zodat de randgemeenten zich allemaal in dezelfde component Cr bevinden. Men heeft P = {{k}, Cr}.
In de Aumann-Drèze oplossing leidt die partitie P tot ψk(ν, P) = 0 en ψj(ν, P) = B / (n−1) voor j≠k. De maatschappelijke welvaart blijft nu gelukkig op peil. Echter, stel dat nu een conflict uitbreekt onder de randgemeenten, zodat de coalitie Cr uiteen valt in twee delen. Dan is de partitie P = {{k}, C1, C2}. Nu is de totale uitkomst gelijk aan nul, en dus eveneens ψj(ν, P) = 0 voor alle j in N. De besluitvorming in het regio-beraad bevindt zich in een impasse, en vernietigt de welvaart. In de practijk zal de grote stad natuurlijk altijd een centrale positie hebben in het regio-beraad. Stel dat hij een coalitie Cm vormt met m (< n−1) randgemeenten. De constellatie blijft dan een apex spel, zij het met minder actoren. De Aumann-Drèze oplossing binnen Cm is gelijk aan ζj voor m+1 spelers. De welvaart B blijft behouden, maar het uitgesloten deel N \ Cm van de randgemeenten krijgt niets. Wegens de verdeeldheid is ψj toch minder billijk dan ζj (met j in N).
Men krijgt nu en dan de indruk, dat de speltheorie trivialiteiten verkondigt op een moeilijke, wiskundige manier. Maar bij nader inzien laat zij toch vaak zien, wat de essentie van het beleids-probleem (CAP) is. Allereerst laat de speltheorie helder zien, wat de voorkeuren, belangen en conflicten zijn. Essentieel is de selectie van duurzame en stabiele interacties, via de methode van het wiskundige evenwicht. Natuurlijk kan men die ook analyseren op een verhalende manier. Bijvoorbeeld vertaalt Scharpf de figuur 1 in een keuze van interacties, zoals onderhandelen. Uw columnist meent echter, dat de figuur 1 visueel de diverse nuances herkenbaarder weergeeft40. De speltheorie veronderstelt, dat modellen van statische toestanden de grondslag leggen voor het analyseren van dynamische CAPs. Zij ontwikkelt inderdaad ook steeds meer dynamische modellen.
Vervolgens pleit de speltheorie voor een moraal, gericht op efficiëntie. Een kosten-baten analyse is inderdaad onmisbaar voor de menselijke vrijheid. Sommige diensten en voorzieningen kunnen niet op de markt worden verhandeld, zodat de staat ze moeten garanderen met behulp van instituties. Echter, dat verplicht de staat om het aanbod af te stemmen op de werkelijke individuele behoeften van zijn burgers. Het new public management (NPM) werd mede populair door efficiëntie tot een thema te maken. Hayek heeft ongetwijfeld gelijk, dat de staat beter afzijdig kan blijven in beleids-thema's, waar het algemeen belang onduidelijk is.
In de coöperatieve speltheorie krijgt de norm van gelijke behandeling terecht een hoge prioriteit. Zij wordt gekoppeld aan een meritocratische moraal. Deze normen worden verder uitgewerkt bij de kritiek op maatschappelijke verdeeldheid. Exclusie en kliek-vorming kunnen leiden tot een (aanzienlijke) verspilling en een verlies aan welvaart. Natuurlijk is dit slechts één kant van het probleem. Immers, groeps-vorming en exclusie kunnen ook een sociaal kapitaal voortbrengen. Columns in de Gazet hebben de voordelen van groepen aangetoond, met name voor haar leden. Echter, een deugdelijke moraal moet ook nadrukkelijk waarschuwen tegen afschotting en uitsluiting.
Concluderend: de speltheorie draagt een moraal aan, die vruchtbaar is ook in de beleids- en bestuurs-kunde. Scharpf heeft daadwerkelijk een decennium lang energiek geprobeerd om de bestuurskundigen enthousiast te maken over de toepassing van de speltheorie. Er moet worden geconstateerd, dat hij daarin weinig succes heeft geboekt. Dit zou te wijten kunnen zijn aan starheid binnen de bestuurskunde. Maar ook de speltheoretici zelf doen weinig moeite om hun vondsten toe te passen op bestuurlijke constellaties. Dat wekt de indruk, dat zij de zin evenmin zien als de bestuurskundigen. Dat tempert eventuele hoge verwachtingen. Ondanks dit alles gaat uw columnist er voorlopig nog flink in investeren.