Speltheorie in de bestuurskunde (2)

Plaatsing in Heterodoxe Gazet Sam de Wolff: 14 jauari 2020

E.A. Bakkum is blogger voor het Sociaal Consultatiekantoor. Hij denkt graag na over de arbeiders beweging.

In het beleid en bestuur zijn allerlei lagen aanwezig, met betrekking tot macht en toezicht. Lang niet altijd schept de productie van een publiek goed een gevangenen dilemma. Mensen hechten aan standaardisatie, en profiteren daar ook van. Een model van de homo sociologicus wordt gepresenteerd. Dit actor-type stabiliseert de instituties. Minstens zo belangrijk voor de uitkomsten van beleid is de maatschappelijke structuur, vastgelegd in coalities en netwerken. Er worden voorbeelden doorgerekend met behulp van de coöperatieve speltheorie.


Gelaagd beleid

Volgens de institutionele analyse en ontwikkeling (afgekort IAO) wordt beleid gekenmerkt door drie soorten regels (ofwel instituties)1. Op het laagste niveau bevinden zich de regels, die het gedrag in interacties reguleren. Het middelste niveau wordt gekenmerkt door de regels, die methodes van collectieve keuze voorschrijven. Deze regels zijn nodig om te kunnen besluiten over de regels voor interacties2. Op het hoogste niveau bevinden zich de constitutionele regels, die de regels op het middelste niveau legitimiteit geven. De constitutie of grondwet kan worden opgevat als het maatschappelijke contract van het collectief. Elk niveau heeft zijn eigen actie arena. De interacties in het laagste, middelste en hoogste niveau zijn respectievelijk productief, wetgevend en filosofisch (ideologisch). Natuurlijk bestaat er een wisselwerking tussen deze drie niveaus. Naarmate het niveau hoger is, wordt het veranderen van de regels lastiger3.

Er is een opvallende gelijkenis met het lagen-model voor beleid van de econoom J. Tinbergen. Op het laagste niveau worden kwantitatieve instrumenten ingezet. Streefgetallen van beleid worden verhoogd of verlaagd. Op het middelste niveau hanteert men kwalitatieve instrumenten, waarbij het beleid structureel verandert. Op het hoogste niveau staan de hervormingen, die veranderingen aanbrengen in de grondrechten, dus constitutioneel4. Het drie-lagen model van Ostrom is ook nuttig voor een analyse van de macht5. Op het laagste niveau dient macht om de eigen doelen te realiseren in de actie arena. Op het middelste niveau wordt macht ingezet om de gedragsregels van de arena te veranderen. Op het hoogste niveau wordt macht aangewend om het morele bewustzijn binnen de arena te veranderen. Dit machtsmodel noemt het middelste en hoogste niveau manipulatief, omdat het leerproces eenzijdig is. De zwakkeren ondergaan een paternalistisch dictaat.

Foto van RVS kwartet kaart
Figuur 1: RVS kwartet kaart

Vervolgens moet de gelaagde ordening van beleids-problemen worden genoemd6. Collectieve actie problemen (afgekort CAP) moeten worden opgelost door middel van overleg en afspraken. Dit is een CAP van de eerste orde. Echter, aangezien afspraken niet altijd worden nagekomen, zijn toezicht en handhaving nodig. De handhaving is opnieuw een publiek goed, want ook hierover moeten collectieve afspraken worden gemaakt. Zij veroorzaakt haar eigen CAP, maar nu van de tweede orde. Helaas moet ook de handhaving zelf worden gehandhaafd. Aldus leidt deze ordening in beginsel tot een oneindig lange reeks van supervisie. Vaak neemt de staat de handhaving op zich, via wetgeving, inspecties, en de rechtsstaat. Als de CAP van de tweede orde leidt tot wetgeving, dan speelt het op het niveau van collectieve keuze bij Ostrom. Maar in beginsel vindt men CAPs van enigerlei orde in alle drie beleidslagen van Ostrom.

Als de staat zorgt voor handhaving, dan moeten de burgers het ultieme toezicht uitoefenen. Zij kunnen zich organiseren in pressie-groepen, om de publieke opinie te mobiliseren ten gunste van een bepaald beleid. Zoals bekend is, gaan zulke pressie-groepen soms rente zoeken voor zichzelf. Billijkheid is dan afhankelijk van de machts-balans tussen de diverse groepen. Zo een systeem van handhaving kan hoge kosten veroorzaken. In kleine groepen zorgen groeps-controle en -druk voor de handhaving. De Duitse bestuurskundige F.W. Scharpf modelleert de groepsdruk door de actie oriëntatie, die het nut van anderen meeweegt in de eigen nutsfunctie. Frijters verwerkt de individuele kosten van belonen en straffen binnen de groep expliciet in de nutsfunctie. Kennelijk is het oplossen van hogere orde CAPs vaak maatwerk.

Tenslotte zijn in de practijk natuurlijk de diverse bestuurslagen van belang, zoals gemeenten, provincies, de rijksoverheid, en de Europese Unie (afgekort EU). Het hiërarchische bestuur is nog vrij overzichtelijk. Maar het federalisme is al complexer, en daar is veel onderzoek naar gedaan (onder andere in de verenigde Staten van Amerika en in Duitsland). Mede vanwege de toenemende mondialisatie worden tegenwoordig veel studies uitgevoerd naar transnationale en internationale CAPs. Denk aan de financiële sector, het milieubeleid, het veiligheids-beleid enzovoort. Bijvoorbeeld meent Scharpf, dat de EU lijdt onder de noodzaak van consensus bij alle lidstaten7. Dat systeem maakt hen tot veto-spelers, en zou daarom een collectieve beslissings-val veroorzaken in het bestuur van de EU. Overigens treedt de val niet in alle beleidsvelden (meer) op. Dit type van gelaagd beleid verdient een aparte column.

In de afgelopen decennia is gebleken, dat de speltheorie zeer geschikt is om de CAPs te analyseren, binnen een laag, maar ook tussen diverse lagen. Soms hanteert men hierbij geneste spellen. In een column van vier jaren terug is dit al geïllustreerd in een spel van samenwerking met handhaving. Dat voorbeeld is afkomstig van de socioloog J.S. Coleman.


Aggregatie technologie van een publiek goed

In een voorgaande column zijn de kenmerken van het publieke goed gedefinieerd. Daar is tevens uitgelegd, dat de productie van het goed verschillend van aard kan zijn. De huidige paragraaf werkt dit fenomeen verder uit. Het publieke goed heeft de bijzondere eigenschap, dat zijn consumptie niet lijdt onder exclusie of onder rivaliteit. Immers, daardoor veroorzaakt het een positief extern effect. Naarmate meer geld wordt besteed aan het goed, profiteert elke individuele burger van het stijgende aanbod. Stel dat er n publieke actoren zijn, die ieder een financiële en productieve bijdrage leveren aan een zeker publiek goed (een groenvoorziening, verbindingsweg, camera toezicht, enzovoort). Zij bk de door actor k aangeboden hoeveelheid van het goed, dan heeft elke burger in totaal B = Σk=1n  bk van het goed tot zijn beschikking voor consumptie. Men zegt, dat het goed gebruik maakt van een sommatie technologie 8.

Echter er zijn meer mogelijkheden, want elke technologie heeft haar eigen manier van aggregatie. Dit wordt duidelijk, wanneer B niet wordt opgevat als de fysieke hoeveelheid van het goed, maar als het nut van deze hoeveelheid voor de burgers. Bijvoorbeeld, als de kleinste fysieke bijdrage het nut van het goed bepaalt, dan spreekt men van een zwakste-schakel (weakest-link) technologie. Hiervoor geldt B = minalle k  bk. Een voorbeeld is een rivierdijk, die zo sterk is als zijn zwakste plek. Als anderzijds het beste exemplaar van alle bijdragen het nut bepaald, of het nut heeft een natuurlijk plafond, dan spreekt men van een beste-poging (best-shot) technologie. Hiervoor geldt B = maxalle k  bk. Denk aan een regionale vuilstort of regio-omroep. Één deugdelijk exemplaar volstaat om te voorzien in de behoefte9.

Dien ten gevolge bepaalt de aggregatie technologie het nut, dat de burgers ontlenen aan het totale fysieke aanbod. De speltheorie moet hiermee rekening houden, wanneer zij de interactie tussen diverse actoren k analyseert. Al vele jaren terug legde de Gazet uit, dat het cardinale nut u van een goed of activiteit kan worden uitgedrukt als de optelling van baten b en lasten (of kosten) c. In formule is dat u = b − c. Als er m van de n actoren bijdragen aan het goed (m≤n), dan is het nut voor burger k (of groep k) gelijk aan uk = bk(m) − ck(m). Beschouw het geval met n=2 actoren, in een symmetrische constellatie, met 2 strategieën s' en s''. De strategie s' betekent, dat de actor k bijdraagt aan het publieke goed. De strategie s'' betekent, dat hij niet bijdraagt. De tabel 1 geeft het spel in zijn normale vorm 10. De cellen bevatten de nutten (u1, u2) van de beide actoren, bij de betreffende combinatie van strategieën s' en s''.

Tabel 1: uitkomsten matrix van het symmetrische spel
  actor 2
  s's''
actor 1  s'    b(2) − c(2), b(2) − c(2)    b(1) − c(1), b(1)  
  s''    b(1), b(1) − c(1)    b(0), b(0)  

Wegens de aard van het publieke goed heeft het een positieve externaliteit, ook voor actoren, die zelf niet bijdragen. In dit model profiteert een actor met strategie s'' geheel van de strategie s' van de andere actor. Neem gemaks halve b(0) = 0. Zij verder b(1) = b, c(1) = c(2) = c, en b(2) = α×b, met α>1. De factor α drukt de aggregatie van het nut uit in de constellatie (s', s'), te weten de eigen bijdrage en de externaliteit door de ander11. Beschouw eerst de sommatie technologie, zodat de constellatie (s', s') leidt tot baten b+b (bij ongeveer α=2). Neem aan dat geldt b<c. Dan is een afzonderlijke actor niet gemotiveerd om bij te dragen. Stel, dat het geaggregeerde nut voor elke actor voldoet aan α×b = 2×b > c. Samen bijdragen loont wèl. De constellatie wordt gekenmerkt door b < c < α×b < b + c. Dit is juist een gevangenen (prisoner's) spel, dat aldus blijkt te ontstaan uit de sommatie technologie. Zoals bekend komt hier de samenwerking niet tot stand12.

Interessant is ook de zwakste-schakel technologie. Immers, als de ene actor niet bijdraagt (s''), dan is dat feitelijk een constellatie met één zeer kleine bijdrage, te weten nul. Bij deze technologie zullen de baten b(1) = b gering zijn. Stel weer b<c. Als beide actoren bijdragen, dan wordt de zwakste plek zeer versterkt, zodat de baten b(2) = α×b aanzienlijk kunnen zijn. Met andere woorden, er geldt α>>1. Neem aan, dat zelfs geldt b+c < α×b. Dan is zwart rijden (free riding) op de bijdrage van de ander minder aantrekkelijk dan zelf ook bijdragen. De constellatie wordt nu gekenmerkt door b < c < b + c < α×b. Dit is juist een verzekerings (assurance) spel, dat aldus blijkt te ontstaan uit de zwakste-schakel technologie. Zoals bekend zijn hier twee Nash evenwichten, waarvan de ene sub-optimaal is. Voorbeelden zijn de bescherming van biodiversiteit, of de harmonisatie van regulering13.

Beschouw tenslotte de beste-poging technologie. Met enig geluk wordt al bij één bijdrage een hoog niveau van nut bereikt. De tweede bijdrage zal dat hoogstens marginaal verbeteren. De factor α is slechts iets groter dan 1. Stel dat dien tengevolge geldt b(2) < b(1) + c. Als bovendien zou gelden b(1) < c, dan ontstaat opnieuw het gevangenen spel. Echter, bij b(1) > c is een afzonderlijke actor al gemotiveerd om als enige bij te dragen. Aangezien de tweede bijdrage weinig toevoegt, is hier zwart rijden nog aantrekkelijker dan bijdragen. De constellatie wordt gekenmerkt door c < b < α×b < b + c. Dit is juist een lafaard (chicken) spel, dat aldus blijkt te ontstaan uit de beste-poging technologie. Zoals bekend zijn hier twee gelijkwaardige maar zeer verschillende Nash evenwichten, met ongelijke uitkomsten voor de beide actoren. Een voorbeeld is het not-in-my-backyard (NIMBY) probleem14.

Aldus ontstaat het volgende beeld. Gewoonlijk veronderstelt men, dat het publieke goed voldoet aan een sommatie technologie. Zie het model van Elster. Er is dan een collectief actie probleem (afgekort CAP) van coördinatie, maar ook van verdeling. Opportunistisch gedrag loont, zodat enkel het suboptimale evenwicht bereikbaar is. Als het publieke goed een beste-poging technologie heeft, dan blijven deze problemen aanwezig. Zonder enige coördinatie zijn nu de uitkomsten wel stabiel en optimaal, maar des al niettemin ongewis. Als het goed wordt gekenmerkt door een zwakste-schakel technologie, dan is in beginsel het optimale evenwicht bereikbaar zonder coördinatie. Dit is een relatief gunstige situatie. Nochtans is ook hier een misgreep mogelijk (het zogenaamde beleid met een trillende (trembling) hand)15.


Het netwerk goed

Een voorgaande column beschreef een taxonomie van goederen. Zonet is uitgelegd, dat het publieke goed zelf voorkomt in diverse varianten. Er moet echter nog worden gewezen op een aparte categorie, namelijk het netwerk goed16. Dit goed kan uitsluitbaar zijn, en onderworpen aan rivaliteit, maar toch een positief extern effect veroorzaken. Namelijk, het nut uk van dit goed voor de actor k neemt toe met het aantal gebruikers m. Veel genoemde voorbeelden zijn de telefoon en openbaar vervoer. Maar ook een gedeelde taal, moraal of overtuiging kan worden gerangschikt onder dit type. Kenmerkend is de standaardisatie. Als een lineair verband wordt aangenomen, dan is het marginale nut in formule17

(1)     uk(m) = b + m × (α × b) − c

Grafiek van nut van netwerk goed
Figuur 2: Nut van netwerk goed
    netwerk x en y

Het probleem van het netwerk goed is, dat netwerken altijd veel mensen uitsluiten. Gegeven een netwerk ter grootte van m, zijn er n−m buitenstaanders. In het meest simpele geval vormen die n−m actoren een eigen netwerk, zodat het nut van de laatst toegetreden actor eveneens voldoet aan de formule 1. Duidt die netwerken aan met x en y. De figuur 2 toont de nutslijnen van deze twee netwerken volgens de formule 1, dat wil zeggen, het nut van de nieuwste actor. In de figuur neemt m toe van links naar rechts, en n−m neemt dan af. Stel er wordt een nieuwe actor geboren. Als die rationeel handelt, dan kiest hij of zij het netwerk, dat het meeste nut oplevert aan de actor. Deze actor (n+1) is indifferent voor de netwerken, wanneer geldt un+1(m+1, x) = un+1(n−m+1, y). Dat evenwicht m* is het snijpunt van de twee nutslijnen in de figuur 2. Uitschrijven van de formules geeft als de evenwichts-waarde van m: 18

(2)     m* = (by × (1 + (n+1)×αy) − bx × (1 + αx) + cx − cy) / (αx×bx + αy×by)

Het punt m* is een kantelpunt (tipping point). Voor alle andere punten m heeft de actor n+1 een voorkeur voor één netwerk, en zal daarvan lid worden. Dat maakt het netwerk nog aantrekkelijker, zodat de volgende nieuwkomer n+2 zeker zal kiezen voor hetzelfde netwerk. De Nash evenwichten van deze situatie bevinden zich bij m=0 en m=n, dus bij de uiterste polen. Kennelijk leiden netwerk goederen tot conservatisme19. Bijvoorbeeld staat de moraal of de traditie van de minderheid onder grote druk. Stel dat de staat tot nieuwe inzichten komt, en zijn instituties wil veranderen van x naar y. Dan moet hij allerlei positieve prikkels aanbrengen, zoals voorlichting en beloningen, om zijn burgers te motiveren tot meewerking. De nutskloof van de figuur 2 moet worden overbrugd. Merk op, dat daar inderdaad geldt uk(0, y) > uk(n, x).


De homo sociologicus als redding

Zonet is gewezen op het bestaan van CAPs van de tweede orde. Regels vereisen vaak een handhaving. Het toezicht kan hoge kosten veroorzaken, zodat een homo economicus dat niet vrijwillig zal doen. De kosten kunnen worden verminderd door gebruik te maken van de maatschappelijke ruil. Al vier jaren terug introduceerde de Gazet het model van Foa en Foa. Volgens dat model kunnen materiële sancties worden vervangen door immateriële sancties, zoals afkeuring of uitsluiting. Een actor kan een boosdoener immaterieel straffen met slechts geringe eigen kosten. Echter, dan moet de boosdoener wel gevoelig zijn voor deze manier van straffen. Hij moet een homo sociologicus zijn. Met name is de homo sociologicus gevoelig voor wederkerigheid (reciprocity). Hij is een massa-mens, die net zo wil handelen als alle anderen. Maar hij is niet per se gehecht aan publieke goederen. Immers, dan zou hij een ideoloog zijn en een homo politicus.

De voorkeur van de homo sociologicus kan als volgt worden gemodelliseerd20. Beschouw een groep van n+1 actoren. Stel dat elke actor een eenheid van een publiek goed kan realiseren tegen kosten c. Stel dat het goed een sommatie-technologie heeft, zodat er collectieve baten B = m×b zijn voor m eenheden. Neem gemaks halve b < c < 2×b, zoals in het gevangenen-spel. Als de homo sociologicus zelf bijdraagt (strategie s'), dan ervaart hij m bijdragen van andere actoren als een morele beloning v × m/n. De weigering van de overigen om bij te dragen is voor hem een morele last w × (n − m) / n. Daarom wordt zijn netto nut gegeven door de formule 3a. Als anderzijds hij zelf kiest voor weigeren (strategie s''), dan is zijn netto nut als in de formule 3b. Aldus geldt21

(3a)     uk(s') = m × (b + (v + w) / n) + b − c − w
(3b)     uk(s'') = m × (b − (v + w) / n) + v

Beschouw ter verduidelijking eerst het eenvoudige geval van twee actoren (dat is in dit geval n=1, met m≤n, omdat de groep n+1 leden telt). De tabel 2 toont de uitkomsten bij de twee strategieën, te weten bijdragen (s') of weigeren (s''). De voorkeur van de homo sociologicus voor wederkerigheid maakt eenzijdig opportunisme minder aantrekkelijk. Als de verlies-term b−c minder negatief is dan de morele last -(v+w), dan zullen de beide actoren kiezen voor bijdragen, dus voor (s', s'). Hier is (s'', s'') een sub-optimaal Nash evenwicht. Men heeft nu een verzekerings-spel. Dankzij de aard van de homo sociologicus is het CAP van de eerste orde opgelost. Bij een gunstige constellatie (de neiging v tot wederkerigheid en de afkeer w van onenigheid zijn voldoende sterk) wordt het gevangenen dilemma geëlimineerd.

Tabel 2: uitkomsten matrix voor homines sociologici
  actor 2
  s's''
actor 1  s'    2×b − c + v, 2×b − c + v    b − c − w, b − w  
  s''    b − w, b − c − w    v, v  
Grafiek van nut van publiek goed
Figuur 3: Nut van publiek goed
    strategie s' (gestippeld: v=w=0)
 en strategie s'' (gestippeld: v=w=0)

Natuurlijk nodigen de formules 3a-b uit om dezelfde methode van analyse te hanteren als bij het netwerk-goed. Beschouw weer het geval met een groep van n actoren. Hun kenmerk is nu niet het netwerk, maar de strategie (s' of s'') van hun subgroep. De formules 3a en 3b beschrijven het nut van de laatst toegetreden actor van elke subgroep, als functie van het aantal bijdragen m. Daarom vormen zij nutslijnen. Beschouw eerst autonome actoren, met v = w = 0. Nu heeft men het bekende model van Elster. De figuur 3 toont deze gevallen als gestippelde lijnen, met de subgroep s' in rood, en de subgroep s'' in groen. Hun onderlinge afstand is juist c. De strategie s'' domineert over s'. De situatie is totaal anders, wanneer de actoren van het type homo sociologicus zijn, met v, w ≠ 0. De figuur 3 toont ook deze lijnen, voor het geval v = w = 2 × (c−b). De voorkeur voor wederkerigheid vergroot de kloof tussen s' en s'' voor kleine m. Als anderzijds m dicht bij n ligt, dan verliest de strategie s'' zeer aan aantrekkelijkheid22.

Stel er wordt een nieuwe homo sociologicus geboren, zodat de groep nu n+1 leden telt. Deze nieuwste actor n+1 kiest de strategie s' of s'', die het meeste nut oplevert voor hem. De twee strategieën zijn indifferent, wanneer geldt un+1(m+1, s') = un+1(n−m+1, s''). Men berekent hieruit het kantelpunt23

(4)     m* = ½×n × ((c − b) / (v + w) + 1)

Als geldt m<m*, dan kiest de nieuwste actor (n+1) voor de strategie s''. En bij m>m* verkiest hij s'. Als geldt c−b > v+w, dan is enkel de strategie s'' zinvol. Er is een gevangenen-spel met n+1 actoren. Maar als de drang tot wederkerigheid sterk is, en daardoor c−b << v+w, dan ligt m* dicht bij ½×n, en daarboven is de constellatie een verzekerings-spel. Ook al betreffen de interacties een publiek goed, toch geeft het dilemma van de gevangenen hier geen juist beeld meer.

De figuur 3 toont, dat de voorkeuren en interacties van de homo sociologicus of massa-mens sterk afhangen van de constellatie. Als weinig actoren bijdragen aan het publieke goed, dan kan het bestuur dit nauwelijks veranderen. De massa-mens is conservatief, net zoals de gebruiker van een netwerk goed. Hij reflecteert niet op de ideologie zelf. Als een bestuur de massa-mens wil prikkelen tot bijdragen aan een publiek goed, dan moet het doen, alsof de populaire en gangbare strategie bestaat uit s'. Dat lukt beter, naarmate de homo sociologicus slechter is geïnformeerd. Men zou dit het hoogste niveau van machts-gebruik kunnen noemen. Zie zonet in deze column.

Bovendien is bij het begin van deze paragraaf geconstateerd, dat de homo sociologicus gevoelig is voor groepsdwang, via de maatschappelijke ruil. Hij is bereid om wederkerige acties te belonen, en afwijkende acties te bestraffen. Hij maakt zelf wel kosten door sancties op te leggen aan andere actoren, maar die worden gecompenseerd, doordat de sancties aanzetten tot meer wederkerigheid. Daardoor neemt zijn morele plezier toe, en zijn morele last daalt24. Daarom kan het bestuur met een redelijke kans op succes de subgroep s' oproepen om de subgroep s'' te straffen voor hun acties. Daardoor schuift natuurlijk het kantelpunt m* nog meer naar links, beneden ½×n. Men bedenke wel, dat groepsdruk een rem legt op de individuele vrijheid. De subgroepen voeren onderling een maatschappelijke strijd25.


Exclusie in de maatschappij: de Myerson oplossing

Een eerdere column heeft laten zien, dat er welvaart verloren kan gaan, wanneer de maatschappij verdeeld is. Dit werd wiskundig berekend met behulp van de Aumann-Drèze oplossing ψk(ν, P), die de Shapley oplossing ζk(ν) combineert met een partitie P van de maatschappij in allerlei coalities (componenten genoemd). Partities zijn goed bruikbaar om een helder onderscheid te maken tussen de diverse groepen en netwerken. Echter, ze geven geen inzicht in de machtsverhoudingen binnen de groepen of netwerken zelf. Het ligt voor de hand, dat actoren met een centrale positie in het netwerk zich een groter deel van de geproduceerde meerwaarde ν kunnen toeëigenen dan perifere actoren. Natuurlijk moet men daartoe wel de structuur van elk netwerk Λ kennen. In dat geval blijkt de zogenaamde Myerson oplossing μk(ν, Λ) de structuur-effecten op de opbrengst van actor k in rekening te kunnen brengen26.

In dit model worden de netwerken weer abstract voorgesteld door ongerichte grafen. Zij N de verzameling van n actoren {1, 2, ...., n}. Dan is het netwerk (de graaf) Λ simpelweg de verzameling van alle paren {j, k}, die een onderling contact hebben (met actoren j en k in N). Een voorbeeld is Λ = {{a, b}, {a, c}, {b, d}, ...}, waarbij a, b, c, d enzovoort deel uitmaken van N. Als twee actoren onderling in contact staan, dan is de verbinding direct. Maar actoren kunnen ook indirect zijn verbonden, via een pad of geodeet. De twee actoren j en k bevinden zich dan op enige afstand van elkaar. De graaf legt als het ware de maatschappelijk de structuur in de verzameling N vast. Aldus kan de graaf (het netwerk) ook geïsoleerde actoren bevatten (zonder enig contact), en zelfs geïsoleerde groepen of netwerken. Het kan (ietwat verwarrend) een opeenhoping van losse netwerken zijn.

Kennelijk definieert de graaf Λ een partitie P op de verzameling N, waarbij de actoren zich in een coalitie bevinden, of in isolement. Zij C een deelverzameling van N (eventueel N zelf), dan wordt die partitie geschreven als P = C/Λ. Zij ν(C) de intussen bekende coalitie-functie. Dan wordt de Myerson coalitie-functie gedefinieerd door27

(5)     νΛ(C) = Σ C' in C/Λ  ν(C')

De sommatie verloopt hier dus over alle componenten C' in de partitie C/Λ. De Myerson oplossing van het verdelings-vraagstuk baseert op de Shapley oplossing voor de actor k en is gedefinieerd als28

(6)     μk(ν, Λ) = ζkΛ)

De Myerson oplossing μk(ν, Λ) kan worden herleid tot vier axioma's. Het zijn de axioma's van componenten-efficiëntie, nulspelers (overbodigheid), additiviteit (lineariteit), en anonimiteit29. Tezamen dragen zij de moraal. Het laatste axioma komt in plaats van het symmetrie axioma (zie de Shapley oplossing). Het stelt, dat een verbonden actor k dezelfde opbrengst μk(ν, Λ) ontvangt als actoren, die zich in vergelijkbare posities bevinden. Dit impliceert, dat de oplossing de ongelijkheid ten gevolge van het netwerk accepteert. Het onvermijdelijke wordt billijk. Merk verder op, dat geïsoleerde spelers nulspelers zijn. Aldus werken er twee factoren in op de verdeling: (a) de rollen van de actoren, vastgelegd door de coalitie-functie ν(C), en (b) de posities in het netwerk, vastgelegd door de graaf Λ. De morele afweging van die twee factoren is een complexe materie, die wellicht een aparte column verdient.

Enkele toepassingen

De Nederlandse kabinets-formatie van 1977
De kabinets-formatie na de Nederlandse verkiezingen van 1977 is gemodelleerd in een eerdere column 30. Zij is bijzonder, omdat indertijd de PvdA overtuigd was van haar macht. Zij heeft 10 zetels gewonnen in de verkiezingen, en komt op 53 zetels in het parlement. Het CDA haalt 49 zetels, en de VVD stijgt naar 28 zetels, dankzij 6 zetels winst. Als grootste winnaar zijn de sociaal-democraten overtuigd, dat het tweede kabinet Den Uyl moet ontstaan. Echter de Myerson oplossing geeft als machts-index een ander beeld. Ten eerst heeft een kabinet voldoende aan 76 geestverwante zetels. En ten tweede sloot de PvdA een kabinet met de VVD uit. Aldus ontbreekt in het politieke netwerk het contact tussen de PvdA en de VVD. De figuur 4a toont het netwerk Λ, en laat zien, dat het CDA de centrale positie inneemt.

Figuur van vier grafen
Figuur 4: Grafen met verbindingen
    (a) politiek netwerk in 1977;
    (b) geïsoleerde paren;
    (c) ketting;   (d) vlieger.

Kennelijk zijn er drie winnende coalities C, namelijk {PvdA, CDA}, {CDA, VVD} en {PvdA, CDA, VVD} (= N)31. Het netwerk in de figuur 4a sluit de coalitie {PvdA, VVD} uit. Zij een winnende coalitie C gekenmerkt door ν(C) = 1. Volgens de formule 3 is nu νΛ = 1 voor elk van de drie winnende coalities. En volgens de formule 4 is dan de verdeling volgens Myerson μ(ν, Λ)PvdA = 1/6, μ(ν, Λ)CDA = 2/3, en μ(ν, Λ)VVD = 1/6. Met andere woorden, als de winnende coalitie wordt gewaardeerd met 1, dan heeft volgens de oplossing van Myerson, gezien de bijzonderheden van de constellatie, het CDA recht op 2/3 van die waarde. De PvdA en de VVD hebben allebei slechts recht op 1/6. Nog anders gezegd, dankzij de machtige positie van het CDA kan het vier keer zoveel waarde opeisen als elk van de andere partijen. Klaarblijkelijk stond de PvdA eigenlijk zwak32.

Het unanimiteits-spel
In diverse columns is het unanimiteits-spel gebruikt om de theorie van verdeling te illustreren. Dat spel heeft bij een verzameling N van n actoren een deelverzameling C van c veto-spelers. Denk bijvoorbeeld aan n gemeenten, die tezamen een begroting B moeten verdelen om wandelroutes aan te leggen in een natuurgebied. De c gemeenten, die in het natuurgebied zijn gelegen, zijn hiervoor onmisbaar, wat hen macht geeft. In de zonet genoemde columns over het spel kunnen steeds de c veto-spelers de hele begroting B opeisen. Echter, dat verandert, wanneer rekening wordt gehouden met de netwerk structuur van de verzameling N van gemeenten. Neem gemaks halve aan dat geldt n=4 en c=2. Stel, dat de actoren 1 en 4 de veto-spelers zijn in de coalitie C (de gemeenten, die liggen in het natuurgebied).

De figuur 4b geeft een mogelijke graaf Λ van N. Hier zijn de actoren 1 en 4 niet verbonden, zelfs niet indirect. De partitie P = N/Λ is zodanig, dat deze veto-spelers zich in verschillende componenten bevinden. Daarom kan de winnende coalitie C = {1, 4} nooit een deelverzameling zijn van de component van k=1 of 4. In de eerdere column is aangetoond, dat dan de opbrengsten voor alle gemeenten gelijk zijn aan nul. Er geldt μ(ν, Λ)k = 0 voor k=1, 2, 3, 4. De wandelroutes zijn niet realiseerbaar, en daarmee vervalt de begroting B. Deze dramatische constellatie is in de voorgaande illustraties gebruikt om de nadelen van maatschappelijke verdeeldheid aan te tonen.

Beschouw vervolgens de figuur 4c, die een andere graaf Λ' van N voorstelt. De Λ' heet een ketting. In dit geval houdt de partitie P = N/Λ' de verzameling N in stand. Zij heeft daarom alleen N als component. Er geldt νΛ'(N) = 1, en νΛ'(C') = 0 voor alle andere coalities C'. Immers, de actoren 1 en 4 moeten verbonden zijn om B te krijgen. Blijkens de formule 4 is voor de constellatie van de figuur 4c de verdeling μ(ν, Λ)k = B/4 voor k=1, 2, 3, 4. Kennelijk hebben nu de gemeenten k=2 en 3 ook macht dankzij hun centrale brug-functie. Dit is een verschil met de eerdere illustraties, waar de twee veto spelers de hele meerwaarde B deelden. De deling in twee zou nog steeds opgaan, wanneer in de figuur 4c de gemeenten k=1 en 4 direct verbonden waren. Dan zou de graaf een cirkel zijn en dus een cyclus33. Daarin verliest de brugfunctie van k=2 en 3 alle waarde. Zij worden weer uitgesloten van B door de gemeenten k=1 en 4 34.

Beschouw tenslotte de figuur 4d, die nog een andere graaf Λ'' van N voorstelt. Deze graaf is nogal asymmetrisch, en heet een vlieger (met de gemeente k=4 als staart). De partitie P = N/Λ'' heeft alleen N als component. Er geldt νΛ''(N) = 1, en νΛ''(C') = 0 voor alle andere coalities C'. Nu is C = {1, 3, 4} een winnende coalitie. Blijkens de formule 4 is voor de constellatie van de figuur 4d de verdeling μ(ν, Λ)k = B/3 voor k=1, 3, 4, en μ(ν, Λ)2 = 0. Wegens het directe contact tussen k=1 en 3 is de gemeente k=2 overbodig geworden voor het project van de wandelroutes. Zij is een nulspeler geworden. Hoewel zij deel uitmaakt van het netwerk Λ'', wordt zij toch uitgesloten van B door de andere leden van Λ''. De Myerson oplossing is misschien niet altijd even vriendelijk, waar wel rechtvaardig en efficiënt. Voortaan doet de gemeente 3 alle bemiddeling tussen 1 en 4.


Sociale netwerk analyse

In eerdere columns is enige uitleg gegeven van de sociale netwerk analyse (afgekort SNA). Uw columnist zag toen het nut niet zo, althans voor de toepassingen in de Gazet. Aangezien nu de Myerson oplossing intensief gebruik maakt van grafen, verdient de SNA opnieuw een beschouwing. Men bedenke echter, dat concepten zoals de waarde van Shapley, Aumann-Drèze of Myerson uitgaan van autonome actoren, die vrij kunnen beslissen. Dit is niet per se het geval in de SNA, die ook organisaties en andere hiërarchieën tot onderwerp kan nemen. Zij is louter empirisch. Enkele belangrijke maten van samenhang uit de SNA zullen worden berekend voor de actoren in de vier netwerken van de figuur 4. Het betreft de relatieve centraliteit, de nabijheid (closeness) en de between-ness. Deze maten zijn al gedefinieerd in een voorgaande column35. De berekende waarden worden gepresenteerd in de tabel 3.

Tabel 3: maten van samenhang in enkele netwerken
figuur(4a)(4b)(4c)(4d)
actorPvdACDAVVD123412341234
centraliteit0.501.000.501.001.001.001.000.330.670.670.330.670.671.000.33
closeness0.671.000.671.001.001.001.000.500.750.750.500.750.751.000.60
between-ness0.001.000.000.000.000.000.000.000.670.670.000.000.000.670.00

Inderdaad levert deze tabel nuttige inzichten. In het politieke netwerk van de figuur 4a blijkt de CDA het meest centraal te liggen, en een brug te vormen voor de andere partijen (wegens de hoge between-ness). Daardoor bevindt het CDA zich dicht bij de PvdA en de VVD (vanwege de hoge closeness). Gewoonlijk leidt een centrale ligging en brug-functie tot extra macht. Dat bleek zonet al uit de grote waarde van Myerson voor het CDA. Zie ook verderop in de column. De tabel 3 vermeldt de maten van samenhang voor het netwerk in de figuur 4b enkel volledigheids halve. Immers, de graaf bestaat uit twee geïsoleerde paren. Dan verliezen begrippen zoals centraliteit en brug-vorming hun betekenis. Geen van de maten kan worden berekend voor de graaf als geheel. De closeness is groot, omdat zij betrekking heeft op het paar (n=2).

De maten van samenhang voor het netwerk in de figuur 4c zijn wel interessant. Merk op, dat het netwerk enige symmetrie heeft. De gemeenten k=2 en 3 excelleren door hun centraliteit en brugvorming (between-ness). Dat geeft hen veel positionele macht. De gemeenten k=1 en 4 bevinden zich in de periferie van het netwerk. Zij hebben toch redelijke Myerson-waarden, omdat zij hun slechte ligging in het netwerk kunnen compenseren door hun functionele rol als veto-speler. Tenslotte valt bij de maten van samenhang voor het netwerk in de figuur 4d op, dat de gemeente k=3 hier daadwerkelijk een positionele spilfunctie inneemt. Dankzij het directe contact met gemeente k=1 lopen alle kortste paden (geodeten) via k=3. De positie van de gemeente k=1 is eveneens versterkt, maar dit komt toch niet tot uitdrukking in zijn Myerson waarde. De gemeente k=2 is nog steeds redelijk gepositioneerd, maar lijdt nu bij zijn Myerson waarde onder zijn nulspeler status36.


Verdeling en maatschappelijke connecties

Het is hier op zijn plaats om te herinneren aan een column van ruim twee jaren terug, waarin ook de machts-verdeling in netwerken wordt bestudeerd37. Daar wordt het model gebruikt om de macht bk van de actor k in een Nash-onderhandeling te berekenen. De positie in het netwerk heeft een wezenlijke invloed op bk. Bijvoorbeeld wordt in de column een berekening uitgevoerd voor de ketting graaf met n=4, waaruit blijkt te gelden b1 = b4 = 1.21, en b2 = b3 = 2.37. Dit impliceert, dat de 4 gemeenten hun begroting verdelen volgens u1 = u4 = 0.17×B, en u2 = u3 = 0.33×B 38. De centraal gelegen actoren k=2 en 3 hebben duidelijk meer macht, in overeenstemming met de tabel 3. De koppeling met de Nash onderhandeling geeft dit model een charme, die uitstijgt boven de SNA. Uw columnist kon indertijd nog niet vermoeden, dat deze materie relevant is voor de speltheorie, en daarmee ook voor de bestuurskunde39.


Endogene vorming van coalities

De Myerson oplossing is een indrukwekkende manier om rekening te houden met netwerken, die beperkingen opleggen aan de mogelijke coalities. Maar toch oogt het model niet bijster natuurlijk. Waarom zou een actor in de rol van veto-speler instemmen met een netwerk, waar hij een perifere positie inneemt? De actoren vormen zelf hun netwerken, en zij zullen daarbij hun functionele rol inzetten als machtsmiddel40. Gelukkig heeft ook de coöperatieve speltheorie dit beseft, en gezocht naar manieren om de vorming van netwerken endogeen te maken41. Elke actor k met volledige informatie over de constellatie kan zelf de opbrengst uk berekenen, die hij ontvangt in de diverse denkbare coalities C. Aldus kan actor k zijn wens-coalitie sk bepalen, en proberen om dit netwerk inderdaad te realiseren. Op die manier wordt het coöperatieve spel vooraf gegaan door een niet-coöperatief spel, waarin elke actor k zijn wens-coalitie sk als strategie gebruikt.

Het niet-coöperatieve spel moet eindigen in een stabiele partitie van de verzameling N van actoren42. Stel dat een bepaalde actor een partitie P van N voorstelt. De coalitie-structuur ten gevolge van P is stabiel voor de Aumann-Drèze oplossing ψk(ν, P), wanneer geldt

(7)     ψk(ν, {C, N\C}) ≤ ψk(ν, P)    voor een k in C

Dien ten gevolge is volgens de formule 7 de partitie P stabiel, wanneer elke coalitie C niet beter presteert dan P, althans voor de actor k. Immers, de actor k kan de coalitie C verlaten, en daarmee de vorming van de coalitie blokkeren. Op die wijze beschermt of bestendigt hij de partitie P. Volgens deze methodiek moet de analist dus een partitie Ps bedenken, die niet wordt geblokkeerd door enigerlei wens-coalitie sk, en daarom realistisch is43. Vervolgens moet hij nagaan of er een coalitie C in N is, die Ps ondermijnt. Indien dit niet het geval is, dan is Ps stabiel.

De beschouwing tot nu toe betreft de endogenisering van coalities, en dus van partities. In beginsel kan men ook de structuur van het netwerk van de coalities endogeen maken44. In dit geval bepaalt elke actor zijn wens-verbindingen, en selecteert daarmee zijn wens-contacten. Dit is nu zijn strategie sk. Aangezien de grafen hier ongericht zijn, komt een verbinding tussen twee actoren k en j enkel tot stand, wanneer zij dat allebei willen. Het netwerk of de graaf van de strategie-combinatie s wordt Λ = {{k, j}: k in sj en j in sk}. Onder gunstige omstandigheden kan s realistisch blijken te zijn. De voorgaande analyses hebben al duidelijk gemaakt, dat de gemeenten k=1 en 4 in de casus van de wandelroutes in het natuurgebied niet de verbindingen van de grafen in de figuren 2b, c en d zullen wensen. De PvdA zou een direct contact met de VVD kunnen wensen. Zij heeft dat rond 1994 inderdaad gerealiseerd, met goede gevolgen.

Enkele toepassingen

Het handschoenen spel
In een eerdere column is het handschoenen spel beschreven. Twee actoren kunnen alleen een waarde y scheppen, wanneer zij als paar wederzijds aanvullend zijn. Beschouw bijvoorbeeld een actie arena met beslissers {b} en uitvoerders {u} van beleid. Het beleid wordt enkel gerealiseerd, wanneer de coalitie N = {b, u} wordt gevormd. Dit is een simpel spel, en daarom geschikt om de zonet gepresenteerde theorie te illustreren. De coalitie-functie van dit spel is45

(8)     v(C) = min(|doorsnede van C en {b}|, |doorsnede van C en {u}|)

Uit de formule 8 volgt dat geldt ν({leeg}) = ν({b}) = ν({u}) = 0, en ν(N) = 1. De Aumann-Drèze oplossing is ψk(ν, N}) = ½ en ψk(ν, {{b}, {u}}) = 0 voor k=b en u. De endogenisering van de coalitie- en netwerk-vorming leidt tot het niet-coöperatieve spel van de tabel 4. In de tabel 4 is de strategie s1 van de actor k de voorkeur voor de coalitie {k}, en de strategie s2 verkiest {b, u}. De atomaire partitie {{b}, {u}} en de triviale partitie {{b, u}} zijn allebei stabiel, wanneer tenminste de strategie-combinatie s realistisch is46. Daaraan is voldaan bij de cel linksboven (s(b) = {b}, s(u) = {u}) en de cel rechtsonder (s(b) = s(u) = N). In deze stabiele gevallen wordt het spel gespeeld, met als uitkomsten de in de cellen weergegeven nuts-waarden. Rationele actoren zullen in de keuze-fase natuurlijk N nemen als hun wens-coalitie en -netwerk, want dan krijgen zij in de spel-fase hun beste uitkomst. Daarmee is hun keuze endogeen geworden in dit twee-fasen spel.

Foto van RVS kwartet kaart
Figuur 5: RVS kwartet kaart
Tabel 4: uitkomsten matrix van het wenscoalitie spel
  uitvoerder
  s1s2
beslisser  s1    (0, 0)    (0, 0)  
  s2    (0, 0)    (½, ½)  

Het unanimiteits-spel
Een interessante toepassing is het unanimiteits-spel. Zonet is dit voorgesteld door n gemeenten, die de begroting B voor wandelroutes in een natuurgebied moeten verdelen. De c gemeenten in het natuurgebied zijn onmisbaar voor dit project. Het is direct duidelijk, dat de strategie sk van de wens-coalitie van actor k deze verzameling C van onmisbare actoren moet bevatten. Wat formeler uitgedrukt: partities P zijn stabiel, wanneer zij C omvatten in P(k) voor elke k in C 47. Bijvoorbeeld, zij n=4 en c=2 met C = {1, 4}. Dan zijn de stabiele partities gelijk aan {C, {2}, {3}}, {C, {2, 3}}, {{1, 2, 4}, {3}}, {{1, 3, 4}, {2}}, en N. In al deze partities is ψ1(ν, P) = ψ4(ν, P) = B/2, en ψ2(ν, P) = ψ3(ν, P) = 0. De daadwerkelijk via de gezamelijke strategie s gekozen wens-coalities bepalen, welk van deze stabiele partities wordt gerealiseerd. Als bijvoorbeeld k=1, 2, en 4 graag samen een coalitie willen vormen, dan is daartegen geen rationeel bezwaar48.

Het apex spel
Het apex spel is eveneens interessant voor bestuurskundige problemen. Een eerdere column gebruikte het om een regio-beraad te modelleren, van een grote stad met n −1 randgemeenten. Stel dat het beraad een begroting van B kan verdelen over zijn leden. De stad heeft een meerderheid in het beraad, wanneer hij een coalitie C1 vormt met minstens één randgemeenten. Maar de coalitie Cr van de randgemeenten tezamen vormt eveneens een meerderheid. Neem gemaks halve aan, dat het beraad als verzameling N bestaat uit n=4 leden. Zij k de grote stad. De zonet genoemde column toont aan, dat de coalitie van randgemeenten een opbrengst ψj(μ, P) = B/3 kan behalen, met j in Cr. Als een randgemeente j een coalitie C1 met de stad k vormt, dan ontvangt hij B/2, evenals k. De coalitie C2 van twee randgemeenten met k levert hen slechts ψj = B/6 op. Kennelijk zijn alleen de partities P(k) met |P(k)| = 2 stabiel49. De netwerken zijn weer triviaal.


Evaluatie

De niet-coöperatieve speltheorie laat zien, dat een publiek goed lang niet altijd leidt tot een gevangenen dilemma. Soms hechten de burgers aan standaardisatie. Er is wedijver tussen de verschillende groepen burgers over de invulling van de standaardisatie, bijvoorbeeld met betrekking tot instituties. Dat belemmert bestuurlijke vernieuwing, maar anderzijds kan het bestuur ook de collectieve voorkeuren manipuleren. Met name kan de massa-mens worden aangezet tot het sanctioneren van afwijkende actoren, waarmee het CAP van de tweede orde wordt opgelost.

De coöperatieve speltheorie laat zien, dat bestaande maatschappelijke structuren, zoals netwerken, de functionele machts-verhoudingen wijzigen. Het bestuur kan hierop inspelen door middel van ingrepen in netwerken. Dit kan een impasse doorbreken. Maar daardoor wordt tevens de verdeling tussen de actoren gewijzigd. Die wijziging resulteert soms niet in een vergroting van de meerwaarde van beleid. In feite vermindert dan de efficiëntie, omdat de nieuw toegevoegde actoren in het netwerk parasiteren op de productie van het oorspronkelijke netwerk. De onderzochte modellen bieden geen oplossing voor de absentie van een hiërarchie in het polycentrische netwerk. Het netwerk kent geen instituties.

  1. Zie p.46 en verder in Rules, games and common-pool resources (2006, The University of Michigan Press ECPR) van E. Ostrom, R. Gardner en J. Walker. De econoom P. Frijters hanteert op p.55 in An economic theory of greed, love, groups and networks (2013, Cambridge University Press) een brede definitie van instituties: "Institutions include formal ones, such as parliaments, legal systems, education systems, state governments, and so on, as well as informal ones such as notions of fairness and adherence to the laws of the land, conventions, and internalized rules and customs". (terug)
  2. Een eerdere column constateert, dat het begrip instituties verschillend wordt gedefinieerd door verschillende bronnen. Daar wordt opgemerkt, dat F.W. Scharpf en A.C. Zijderveld de institutie koppelen aan een instituut, organisatie of groep. Ook Ostrom benadrukt hier dus, dat instituties worden bepaald door actoren in hun actie arena. Het actor-gedrag gaat vooraf aan de institutie, en ligt eraan ten grondslag. Daarom zijn instituties een vorm van zelf-beperking en zelf-controle. Instituties zijn niet extern opgelegd, al kunnen zij door hun starheid wel een eigen leven gaan leiden. (terug)
  3. Maar de scheiding tussen de niveaus is akelig diffuus, en uw columnist heeft bij Ostrom geen precieze definitie kunnen vinden. Kennelijk definieert de grondwet de structuur van besluitvorming. Ook worden hier de fundamentele rechten vastgelegd, die de collectieve keuze inperken. Collectieve keuzes vullen de structuur nader in door bevoegdheden te geven aan de diverse organisaties en instituten. Deze organisaties en instituten stellen de gedragsregels op voor het maatschappelijk verkeer. (terug)
  4. Deze indeling wordt soms toegeschreven aan de Engelsman P. Hall, maar Tinbergen introduceerde haar veel eerder. (terug)
  5. Zie hoofdstuk 4 in Collective action and exchange (2013, Stanford University Press) van W.D. Ferguson. Kennelijk is het model afkomstig van S. Lukes. (terug)
  6. Het thema wordt onder andere behandeld in hoofdstuk 3 van Collective action and exchange, en op p.25 in Global collective action (2004, Cambridge University Press) van T. Sandler. (terug)
  7. Zie Community and autonomy (2010, Campus Verlag GmbH) van F.W. Scharpf. Er wordt nauwelijks besloten bij meerderheid. Het Europese beleid krijgt al goed vorm in de landbouw, de markt-regulering, tele-communicatie, handels-verdragen, product-standaardisatie, de financiële sector, en het milieubeleid. Het boek Transnational common goods (2008, Palgrave Macmillan) van K. Holzinger beschrijft een uitgebreid model (inclusief speltheorie) voor de interacties tussen het nationale en internationale bestuur. (terug)
  8. Zie p.69-72 in Transnational common goods, of p.38 in Global collective action. (terug)
  9. Strikt genomen is dit enigszins wonderlijk, want de economie neemt gewoonlijk aan, dat meer van een goed ook beter is. Ofwel, de nutsfunctie u(x) voldoet aan ∂u/∂x > 0. (terug)
  10. Misschien spreekt de tabel voor zich. Wie wil, kan hem ook vinden op p.29 van Collective action and exchange. De normale vorm van het spel veronderstelt, dat de actoren gelijktijdig (simultaan) handelen. Het spel wordt gecompliceerder, wanneer men uitgaat van opeenvolgende (sequentiële) acties. Immers, dan heeft elke actor extra informatie, en kan daarmee rekening houden in zijn reactie. Zulke spellen worden weergegeven in de extensieve vorm. Deze wordt diepgaand onderzocht in de paragrafen 3.2 en 3.3 van Game theory and political theory (1993, Cambridge University Press) van P.C. Ordeshook. Zie ook p.3-11 in Game theory evolving (2000, Princeton University Press) van H. Gintis, wat in feite vooral een bundel met opgaven is, incidenteel zelf uitgewerkt door de auteur. Op p.424-432 in Kooperative Spieltheorie (2005, Oldenbourg Wissenschaftsverlag GmbH) van H. Wiese wordt de extensieve vorm toegepast op coöperatieve spellen met netwerken. Hoewel de actoren reageren op elkaars acties, worden toch de strategieën al bij aanvang bepaald. Immers, de actoren kunnen elkaars acties voorzien. De strategieën krijgen een als-dan vorm. Uw columnist heeft tot nu toe de spellen met opeenvolgende acties vermeden in zijn columns, omdat zij complexer zijn. De analist moet zich extra inspannen. Waarschijnlijk zal de Gazet er toch ooit aandacht aan (moeten) besteden. (terug)
  11. De veronderstelling is, dat een actor een eenheid van het goed bijdraagt, zodat b en c worden gemeten voor die eenheid. Hier is c constant, en b varieert via b(0)=0 en via de schaalfactor α. Zulke vereenvoudigingen helpen om de actie arena transparent te maken. Maar op p.36-37 van Global collective action merkt T. Sandler terecht op, dat actie arena's kunnen verschillen in hun kosten-structuur. Dat wordt zichtbaar in de variatie ∂c(m)/∂m. Hetzelfde geldt voor de variatie van baten ∂b(m)/∂m, die wordt onderzocht in de hoofdtekst. Bovendien zijn de actoren uiteindelijk vooral geïnteresseerd in hun netto nut u(m). Echter de simpele aanpak in de hoofdtekst illustreert helder het verloop van een kosten-baten analyse. (terug)
  12. De ongelijkheid α×b < b + c volgt uit de voorgaande ongelijkheden, wanneer geldt α≤2. Dat is niet meer per se zo bij α>2. In dat geval is er strikt genomen geen sommatie technologie, maar des ondanks blijft de constellatie dan toch een gevangenen spel. In het gevangenen spel hebben beide actoren een dominante strategie, namelijk opportunisme. (terug)
  13. Zie p.77 in Transnational common goods voor het eerste voorbeeld, en p.131 voor het tweede voorbeeld. Een bijzonder geval van het tweede voorbeeld is de harmonisatie van belastingen door een groep staten (p.96). Op p.27 in Global collective action wordt geconstateerd, dat het verzekerings-spel geen dominante strategie heeft. Maar als de twee actoren per contract afspreken om het optimale evenwicht te realiseren (via samenwerken), dan is dat contract self-enforcing. (terug)
  14. Zie p.80-82 in Transnational common goods. Holzinger spreekt van locally unwanted land use (LULU). Zie ook p.28 in Global collective action. (terug)
  15. De vondst van de aggregatie technologie is boeiend, omdat die de spel-constellaties afleidt uit reëel bestaande situaties van collectieve actie. Maar Holzinger merkt al op, dat de zwakste-schakel en beste-poging technologie extreme gevallen zijn. In werkelijkheid bevinden de publieke goederen zich in een continuüm van aggregatie technologieën. De extrema treden vooral op in de spellen zelf. Het verzekerings spel ontmoedigt vooral het zwart rijden, terwijl het lafaard spel het juist beloont. De analist moet in elke casus uit de practijk nagaan, hoe het goed aggregeert. (terug)
  16. Zie p.18-19 in Transnational common goods, of p.39-40 in Collective action and exchange. (terug)
  17. Let op het verschil met het publieke goed. Dat wordt gekenmerkt door een verder ongespecifieerd positief extern effect. Bijvoorbeeld, een groenzone heeft nut voor het collectief, ook al is zij louter passief aanwezig. Het nut ontstaat, doordat een actor geld bijdraagt voor het goed, niet door diens participatie. Een giro-overschrijving volstaat. (terug)
  18. Deze formule is een vrije vertaling van de formule op p.39 in Collective action and exchange. Ferguson schrijft uk(n−m, y) als in de formule 1, maar neemt uk(m+1, x) = b + m × (α × b) − c. Uw columnist begrijpt de reden van deze notatie (met m+1 in plaats van m) niet. Overigens heeft dit geen effect op de gedaante van de formule 2, omdat Ferguson de indifferentie berekent als uk(m+1, x) = uk(n−m, y). (terug)
  19. Zie p.39-40 in Collective action and exchange voor dit betoog. (terug)
  20. De huidige paragraaf is gebaseerd op de paragrafen 5.2 en 5.3 in Collective action and exchange. Het model is verwant aan het model van standaardisatie, dat is behandeld in een eerdere column. Daar hebben de actoren eveneens kenmerken van de homo sociologicus, want zij hechten allebei aan standaardisatie. Het eerdere model verschilt, omdat daar de actoren ook kenmerken hebben van de homo politicus. Namelijk, elk wil de standaardisatie op zijn eigen manier invullen. En die twee ideologische voorkeuren zijn strijdig. (terug)
  21. Zie p.96 in Collective action and exchange. Uw columnist kiest zijn eigen notatie, omdat hij die van Ferguson wat verwarrend vindt. Het is vreemd, dat Ferguson de actor k meeweegt in deze formules, en de facto rekent met de fractie m / (n+1). Uw columnist hanteert m/n als fractie, zoals men ziet in de formules 3a-b. Voor de strategie s' geldt uk(s') = (m+1) × b − c + v×m/n − w × (n−m) / n. Voeg alle termen met m samen, dan volgt uk(s') = m × (b + (v+w) / n) + b−c − w. Dit is juist de formule 3a. Evenzo voldoet de strategie s'' aan uk(s'') = m×b + v × (n−m) / n − w×m/n. Voeg alle termen met m samen, dan volgt uk(s'') = m × (b − (v+w) / n) + v. Dit is juist de formule 3b. Merk voorts op, dat het nut van de actor k in de formule 3 afhangt van de acties of strategieën van de andere actoren. Dit is een verschil met de actie oriëntatie bij F. Scharpf, waar het nut uk afhangt van het nut van de andere actoren. Merk voorts op, dat in deze formule nog geen rekening wordt gehouden met de maatschappelijke ruil (sancties). Alleen het CAP van de eerste orde wordt gemodelleerd. (terug)
  22. Op p.10 in Global collective action wordt daarom geconstateerd, dat een CAP gemakkelijker kan worden opgelost, wanneer de groep vrij homogeen is. Op p.100 in Collective action and exchange wordt een nog extremere situatie getoond, met een zeer grote v+w (veel groter dan c−b en b). In die figuur valt voor de strategie s'' het nut m×b in het niet in vergelijking met de last van afwijkend gedrag. De helling van de nutslijn voor s'' wordt negatief. Immers, in de formule 3b is de helling b − (v+w) / n. (terug)
  23. Op p.100 in Collective action and exchange wordt ½ afgetrokken van deze formule. De oorzaak is de wat andere notatie van Ferguson. Zie een voorgaande voetnoot. (terug)
  24. Het bestraffen van een afwijkende subgroep wordt met formules gemodelleerd op p.102-103 in Collective action and exchange. Al vier jaren terug beschreef een column een soortgelijk model, afkomstig van de econoom P. Frijters. Zie daarvoor p.357 en verder in An economic theory of greed, love, groups and networks. Als een actor k wordt gestraft, dan daalt natuurlijk zijn nut. Een actor k, die een straf uitdeelt, maakt eveneens kosten. Maar tevens neemt dankzij deze straffen het aantal overtredingen of afwijkingen af. Dat vergroot het nut B = m×b, evenals het morele plezier v×m/n van wederkerigheid, terwijl de morele last w × (n−m)/n daalt. Daarom zal het netto effect van zelf straf uitdelen toch vaak positief zijn voor de homo sociologicus of massa-mens. (terug)
  25. Scharpf modelleert dit met de actie oriëntatie. Men kan het netto nut van een actor k uit de subgroep s' uitdrukken als uk(s') = vk − vj(s''), waarbij de actor j deel is van de subgroep s''. Hier is vk het autonome nut van k, en vj is het autonome nut van j. (terug)
  26. Deze paragraaf is geheel gebaseerd op hoofdstuk I in Kooperative Spieltheorie. Naar het schijnt hebben in Nederland M. Slikker en A. van den Nouweland dit onderwerp uitgediept. (terug)
  27. Zie p.366 en verder in Kooperative Spieltheorie. Wiese gaat niet diep in op de implicaties van deze formule. Uw columnist denkt, dat zij de Pareto efficiëntie van de partitie P moet garanderen. Op p.377 voegt Wiese toe, dat de Meyerson oplossing ook efficiënt is binnen een component C van de partitie P. Met andere woorden, Σk in C  μk(ν, Λ) = ν(C) voor elke component C van P. Deze eis is bekend van de Aumann-Drèze oplossing. (terug)
  28. Zie p.374 in Kooperative Spieltheorie. (terug)
  29. Zie p.382-383 van Kooperative Spieltheorie. Zie p.380 voor het anonimiteits-axioma. Sommige axioma's in hoofdstuk I betreffen de verbindingen (contacten) in het netwerk. Bijvoorbeeld kunnen verbindingen overbodig zijn ("nul-contact") (p.379). Als in het algemeen een verbinding wordt verbroken, dan lijden de beide betrokken actoren evenveel schade (p.381). Dit is een equivalent van het axioma van de gebalanceerde bijdragen in de Shapley oplossing: als enigerlei actor k de verzameling N={1, ..., n} verlaat, dan veroorzaakt die evenveel waarde-verlies bij elke andere actor j, als elke j van al die actoren zouden veroorzaken bij k door zelf de verzameling te verlaten (p.211-212). (terug)
  30. Merk op, dat het model uit de eerdere column uitkomt op Shapley waarden ζk = 1/3, omdat daar alle coalities worden toegelaten. Uw columnist bedenkt zich nu, dat daar de partij D'66 niet wordt genoemd, hoewel die betrokken was bij de formatie. Echter haar rol was ondergeschikt, omdat zij overbodig was voor de vorming van een kabinet. Haar winst in 1977, van 6 naar 8 zetels in het parlement, was beperkt. (terug)
  31. De coalitie {PvdA, CDA, VVD} zou eveneens op grote politieke weerstand stuiten. Echter de coöperatieve speltheorie is nog niet zover gevorderd, dat zij zulke subtiliteiten kan modelleren. Een coalitie is eenvoudig mogelijk of niet. In het getekende netwerk zijn de PvdA en VVD indirect verbonden, via het CDA. Het CDA neemt de brugpositie in. Het kan dus.
    Men kan het politieke spel voorstellen door een coalitie-functie ρ(C), die het aantal zetels van de coalitie C telt. Echter, feitelijk nemen politici genoegen met het verwerven van de meerderheid, die de drempel van 75 zetels passeert. Een coalitie verliest of wint deze strijd. In een spel met overdraagbaar nut kunnen die uitkomsten worden weergegeven door de coalitie-functie ν(C) = 0 of ν(C) = 1. Zo een spel wordt simpel genoemd (p.90 in Kooperative Spieltheorie). P.C. Ordeshook vindt deze aanpak op p.324 in Game theory and political theory bedenkelijk. Vrij vertaald is zijn argument als volgt. Er is eigenlijk sprake van twee spellen, te weten met ρ en met ν. De brede coalitie van PvdA, CDA en VVD, die tezamen 130 zetels heeft, wint en heeft dus ν(N) = 1. Maar ook PvdA-CDA wint (ν=1), met slechts 102 zetels. Dus kan er geen lineaire transformatie bestaan, die ρ omzet in ν. En daarom meten ρ en ν niet hetzelfde nut. Uw columnist erkent dat, maar ziet het probleem niet. Overigens pleit het voor Ordeshook, dat zijn boek aansluiting zoekt bij de practijk. (terug)
  32. Direct na de formatie schreef E. van Thijn, toen de fractie-voorzitter van de PvdA, het boek Dagboek van een onderhandelaar (1977, Uitgeverij Van Gennep BV). Daarin doet hij verslag van de voor en mede door hem mislukte formatie. Zijn verontwaardiging blijkt haast grenzeloos te zijn. Als hij de speltheorie had geraadpleegd, dan zou hij wellicht wat bescheidener hebben onderhandeld. (terug)
  33. De benaming van cirkel is overgenomen uit p.173 in De kern van de sociale psychologie (1986, Van Loghum Slaterus) van P. Veen en H.A.M. Wilke, of uit p.131 in Group dynamics (1990, Brooks/Cole publishing company) van D.R. Forsyth. Deze term komt uit de psychologie van communicatie netwerken. Helaas hanteert de speltheorie volgens Wiese op p.361 in Kooperative Spieltheorie andere conventies, want daar wordt de cirkel aangeduid als wiel. Wiese noemt een netwerk met een centrale actor, die als enige alle andere actoren verbindt, een ster. De psychologie noemt juist dat een wiel (omdat de verbindingen ogen als spaken). Verwarring alom. Volgens p.360 in Kooperative Spieltheorie is een cyclus een gesloten pad. De cyclus heeft dus de vorm van een cirkel, maar maakt deel uit van een grotere graaf, en is daarin ingebed. (terug)
  34. Het directe contact tussen de gemeenten 1 en 4 draagt kennelijk bij aan de efficiëntie. De gemeenten 2 en 3 zijn niet meer nodig om te bemiddelen bij de aanleg van de wandelroutes. Zij kunnen hun inspanningen richten op andere beleids-uitdagingen. Des al niettemin blijven zij dan in het cirkel-netwerk, als passieve waarnemers. (terug)
  35. Zie p.86 in Social network analysis (2013, Sage Publications Ltd) van J. Scott voor de definitie van de relatieve centraliteit en de closeness. De between-ness is gedefinieerd op p.87. (terug)
  36. Volgens p.112 en verder in Social network analysis vormt de verzameling {1, 2, 3} (het raamwerk van de vlieger) zelfs een kliek in het netwerk. Maar dat redt de gemeente k=2 toch niet uit zijn rol van nulspeler. (terug)
  37. Het model is te vinden in paragraaf 8.2 van Rational-Choice-Theorie (2011, Juventa Verlag) van N. Braun en T. Gautschi. Het model maakt gebruik van het ruilmodel van Coleman. De macht in elke ruil wordt bepaald door het aantal contacten of verbindingen van de betreffende actor in het netwerk. Hun boek heeft een hoog abstractie niveau, met veel formules, waardoor het lastig toegankelijk is. Maar in combinatie met andere boeken is het toch een ware goudmijn van inzichten. Op p.116 in De kern van de sociale psychologie wordt hetzelfde model verhalend uitgelegd. Uw columnist draagt dit Nederlandse boek over psychologie een warm hart toe, wegens de nauwgezette en formele stijl. (terug)
  38. Volgens eerdere columns verloopt de verdeling van X in een Nash onderhandeling als uk = X × bk / (b1 + b2), met k=1 of 2. Hier onderhandelen de actoren k=1 en 2 paars gewijze. Men kan echter de Nash functie fN(U) generaliseren naar n actoren, met n>2. Zie p.842 in Microeconomic theory (1995, Oxford University Press) van A. Mas-Colell, M.D. Whinston en J.R. Green. In het geval van de ketting is dan u1 = u4, u2 = u3, en u1 = 0.51×u2. (terug)
  39. Men kan een bepaalde verdeling uk onder actoren uitdrukken in termen van de Nash onderhandeling. De algemene Nash functie is fN(U) = Πk=1n  ukβ(k). Hierin stelt Π de rij van vermenigvuldigingen voor. Gewoonlijk neemt men Σk=1n  βk = 1. De beschreven verdeling van de Nash onderhandeling volgens de coëfficiënten βk veronderstelt, dat geldt Σk=1n  uk = B voor de geaggregeerde nutten. Deze grens van nuts-mogelijkheden is een hypervlak in de n-dimensionale nutsruimte U. Er volgt uk = βk×B. Vergelijk de Shapley oplossing, die een overdraagbaar nut veronderstelt. Men kan bijvoorbeeld (gewaagd) veronderstellen, dat geld-eenheden een gelijk nut hebben voor allen. Bij deze aannames kan voor n=4 en c=2 de Shapley oplossing van het unanimiteits-spel worden vertaald naar een Nash onderhandeling met fN(U) = u10.5 × u20 × u30 × u40.5 = u10.5 × u40.5. De gemeenten k=2 en 3 ontbreken, omdat zij nulspelers zijn. Dankzij deze Nash functie mondt kennelijk de moraal van de Nash oplossing uit in de moraal van de Shapley oplossing. Echter de netwerk-structuur van de ketting verandert de uitkomsten uk voor de gemeenten. Het model van ruil in netwerken met positie macht berekent waarden van verdeling ten gevolge van de zuivere netwerk-effecten, en wordt vertaald naar fN(U) = u10.17 × u20.33 × u30.33 × u40.17. Dit negeert nog de rolverdeling van veto- en nul-spelers. De Myerson oplossing integreert deze twee benaderingen. Zij kan worden voorgesteld als een Nash functie fN(U) = u10.25 × u20.25 × u30.25 × u40.25, waarbij kennelijk de exponenten een compromis zijn van de twee voorgaande functies. In dit geval compenseren de macht van de rollen en van de posities elkaar. De Myerson oplossing heeft duidelijk haar eigen moraal. Voorlopig ziet uw columnist niet, of, en zo ja hoe, die moraal kan worden afgeleid uit de moraal van de Nash oplossing en de aannames van het ruilmodel met positie-macht. Dit is wellicht stof voor een toekomstige column. (terug)
  40. Terecht merkt p.93 in Political networks (2003, Cambridge University Press) van D. Knoke op, dat een formele organisatie altijd wordt aangevuld door parallelle informele netwerken. Met andere woorden, de actoren slagen er slechts beperkt in om hun formele macht om te zetten in informele macht, via hun functie. Des al niettemin, formele functies geven wel toegang tot middelen om te belonen en bestraffen. Dat helpt. (terug)
  41. Deze paragraaf baseert grotendeels op hoofdstuk J van Kooperative Spieltheorie. Volgens Wiese hebben de Nederlandse wetenschappers Slikker en Van den Nouweland een belangrijke bijdrage geleverd aan de theorie van endogenisering. (terug)
  42. De nu volgende beschouwing is te vinden op p.415 in Kooperative Spieltheorie. (terug)
  43. Zie p.411 in Kooperative Spieltheorie. De gezamelijke strategie s heet realistisch voor Ps, wanneer Ps alleen componenten C bevat, die voldoen aan sk = Ps(k) voor alle k in C. Met andere woorden, iedere actor k zit in zijn wens-coalitie C, die hij uitdrukt via sk. (terug)
  44. Zie p.422-424 in Kooperative Spieltheorie. Wiese werkt helaas dit thema niet verder uit. Wel analyseert hij de netwerk effecten op spellen in de extensieve vorm. (terug)
  45. Zie p.57 in Kooperative Spieltheorie of p.681-682 in Microeconomic theory. (terug)
  46. De eis, dat de wens-coalities realistisch zijn, is tamelijk streng. Stel bijvoorbeeld, dat de beslisser de voorkeur heeft voor s2 = {b, u}, en de uitvoerder wenst {u}. De wensen botsen. In dat geval neemt Wiese op p.411 van Kooperative Spieltheorie aan, dat de partitie dan {{b}, {u}} wordt. In formule: Ps(k) = sk, wanneer sk = sj voor alle j in sk. Als dit niet geldt, dan is Ps(k) = {k}. En s is pas realistisch, wanneer aan de zonet genoemde voorwaarde is voldaan voor alle sk in N. (terug)
  47. Ter herinnering: P(k) is de component in de partitie P, die de actor k omvat. (terug)
  48. Een dergelijke wens-coalitie is realistisch, wanneer geldt s1 = s2 = s4 = {1, 2, 4} en s3 = {3}. Natuurlijk moeten de actoren k=1 en 4 dan niet al hun communicatie laten verlopen via de actor 2. Immers, dan zou die een centrale positie hebben, die hem positie-macht geeft. De gemeente k=1 of 4 moet zelf de centrale positie in het netwerk innemen. Waarschuwing: de partities P voor n=4 en c=2 zijn uitgewerkt door uw columnist zelf, zoals hij zelf de theorie begrijpt, zonder hulp van Wiese. (terug)
  49. Noem de randgemeenten p, q en r. Dan zijn de zes stabiele partities {{k, p}, {q}, {r}}, {{k, p}, {q, r}}, {{k, q}, {p}, {r}}, {{k, q}, {p, r}}, {{k, r}, {p}, {q}}, en {{k, r}, {p, q}}. Rationele randgemeenten zullen {k, p}, {k, q} en {k, r} als wens-coalitie en -verbinding hebben. De grote stad kan hieruit kiezen in de eerste fase van het spel. Dan plaatst de stabiele partitie P de twee andere randgemeenten in geïsoleerde componenten. De gesommeerde uitkomst voor de randgemeenten is hier sub-optimaal. Zie p.417-418 in Kooperative Spieltheorie voor het algemene geval van een beraad van n leden. (terug)