Het actor-gerichte institutionalisme

Plaatsing in Heterodoxe Gazet Sam de Wolff: 27 juli 2019

E.A. Bakkum is blogger voor het Sociaal Consultatiekantoor. Hij denkt graag na over de arbeiders beweging.

Sinds ongeveer een jaar verdiept de Gazet zich in bestuurskundige modellen. Zij kunnen een brug slaan tussen theorieën uit de economie en de politiek. Recent heeft de bestuurskunde het actor-gerichte institutionalisme ontwikkeld, dat inderdaad het beste uit deze twee werelden verenigt. Het rationele gedrag wordt ingeperkt door de instituties. Bovendien wordt rekening gehouden met de interactie-vorm. Het beleid blijkt goed te kunnen worden beschreven met methoden uit de social choice theorie. Met name de speltheorie en het Hicks-Kaldor compensatie beginsel geven veel inzicht in beleid.

De Gazet heeft diverse columns gewijd aan bestuurskundige methodieken. De inductieve methode in de bestuurskunde (organisatie theorie) heeft het probleem, dat het alle invloeds-factoren wil analyseren. Echter, dat zijn er simpelweg te veel. Het lukt dan zelden om het inzicht te vergroten. De deductieve methode in de bestuurskunde (rationele keuze leer) hanteert hypothesen van wetmatigheden. Dit is een abstractie, maar maakt ten minste een empirische verificatie mogelijk. Het actor-gerichte institutionalisme is niet een deductieve theorie, maar het reikt wel universeel toepasbare theoretische kaders aan. De beleids-analist heeft dan tenminste enig houvast. Dat is een verbetering ten opzichte van de verhalende aanpak in de bestuurskunde. Alvorens echter de kenmerken van het actor-gerichte institutionalisme te beschrijven, moet eerst het compensatie beginsel van Hicks en Kaldor worden uitgelegd.


Het Hicks-Kaldor compensatie beginsel

In een voorgaande column is opgemerkt, dat het populaire Pareto criterium niet volstaat bij het maken van beleidskeuzes. Een economische toestand is Pareto optimaal of efficiënt, indien geen enkel alternatief leidt tot een hoger individueel nut voor sommigen zonder het individuele nut van anderen te verminderen. Dit criterium heeft het voordeel, dat geen gebruik wordt gemaakt van inter-persoonlijke nuts-vergelijkingen. Met andere woorden, de nuts-belevingen van twee individuen onderling worden niet vergeleken. Maar helaas is het Pareto criterium niet bijster geschikt om de billijkheid (fairness, justice) van besluiten te toetsen. De Gazet heeft al diverse malen aandacht besteed aan het falen van het Pareto criterium in beleids-afwegingen. De huidige paragraaf herhaalt de argumentatie, en vervolgt met een diepgaande analyse. Bij het schrijven is veel gebruik gemaakt van het boek Microeconomic policy analysis (afgekort PA)1.

Ten eerste heeft al vijf jaren terug een column er op gewezen, dat de nuts-verbetering van een individu leidt tot een nieuw referentie-kader voor zijn omgeving. De individuen, die dit referentie-kader gebruiken, zullen minder tevreden worden door de wijziging. Men kan leven met die onvrede, zolang de nuts-verbetering van de begunstigde individu ontstaat uit een beloning voor een excellente prestatie. Maar toch ligt het in de menselijke natuur om te verlangen naar enige gelijkheid (symmetrie, anonimiteit) (p.161-162 in PA). Ten tweede accepteert het Pareto beginsel de bestaande toestand (de status quo). Met name wordt dus geen aandacht besteed aan al aanwezige onbillijkheden (p.161 in PA). Het derde bezwaar tegen het Pareto criterium is eigenlijk de vertaling van het tweede bezwaar naar de practijk. Namelijk, het criterium is practisch onbruikbaar. Immers, politiek bestaat juist wèl uit het afwegen van interpersoonlijke belangen (p.160)2.

Daarom verbaast het niet, dat de wetenschap (evenals de Gazet) sinds jaar en dag zoekt naar betere criteria. Sinds meer dan twee eeuwen (dus nog vóór het Pareto criterium) wordt het utilitarisme (utilisme, utilitarianism) gebruikt bij welvaarts-studies. Het utilitarisme meet de welvaart af aan een collectieve nutsfunctie, de maatschappelijke of sociale welvaartsfunctie (afgekort SWF). De SWF aggregeert (accumuleert, sommeert) het nut van alle individuen. Volgens het utilitarisme is het in het algemeen belang om de waarde van de SWF maximaal te maken. Deze methode hanteert weliswaar het Pareto criterium, maar probeert vervolgens het meest billijke Pareto efficiënte punt te vinden. Een alternatieve aanpak, de Nash onderhandeling, kan eveneens worden opgevat als een vorm van utilitarisme. De billijkheid wordt steeds afgewogen aan de collectieve nutsverdeling. Soms wordt nut gelijk gesteld aan geld (een overdraagbaar of transferabel nut).

Merk op, dat het utilitarisme aansluit bij de practische maten voor politieke besluitvorming. Bijvoorbeeld hecht de politiek waarde aan de groei van het nationale inkomen of het bruto binnenlands product (BBP)3. De huidige paragraaf wil het Hicks-Kaldor compensatie beginsel beschrijven, dat eveneens streeft naar de vergroting van de te verdelen welvaart. Beschouw een maatschappij, die bestaat uit K individuen. Tezamen produceren zij N goederen, met totale hoeveelheden qn (n=1, ..., N). Op het tijdstip t bevindt de maatschappij zich in een toestand S(t). S(t) definieert de wetgeving, de beschikbare productie-technieken, het assortiment aan goederen, de hoeveelheden qn van die goederen, en dus ook hun prijzen pn. Bovendien kunnen in S(t) de beschikbare goederen op een bepaalde manier worden verdeeld over de individuen. Natuurlijk is deze verdeling mede bepalend voor de maatschappelijke productiviteit.

Merk op, dat in elke denkbare toestand S(t) een maximale productie haalbaar is. Natuurlijk kan men ook minder produceren, door middel van verspilling. De maximale productie vormt een hyper-oppervlak in de N-dimensionale ruimte van q. In geval van twee dimensies heet dit de productie-mogelijkheden kromme. Echter het Hicks-Kaldor compensatie beginsel beschouwt de nuts-mogelijkheden, en niet de productie-mogelijkheden. Immers, de productie-mogelijkheden geven niet direct informatie over de maatschappelijke verdeling. Zij uk(qk) het nut, dat individu k ontleent aan zijn pakket qk van goederen. Men zoekt nu dus het hyper-oppervlak in de K-dimensionale nuts-ruimte van individuen, dat overeen komt met maximale (efficiënte) productie. De figuur 1a toont ter illustratie de kromme van nuts-mogelijkheden (rood) voor K=2. De kromme correspondeert met S(t).

Afbeelding van nuts-mogelijkheden
Figuur 1: Nuts-mogelijkheden bij (a) toestand S(t)
     en (b) toestand S(t+1) (μ voor compensatie, σ erna)

Elk punt op de kromme S(t) correspondeert met een bepaalde verdeling van q over de K individuen. In de figuur 1a is het punt ν ingetekend als een voorbeeld van een vaste verdeling. Helaas doet het compensatie beginsel geen uitspraak over de billijkheid van ν. Namelijk, het Hicks-Kaldor beginsel luidt als volgt: een beleids-verandering van ν (op S(t)) naar μ (op een kromme S(t+1)) is een verbetering, wanneer het mogelijk is om de geproduceerde goederen q in μ zodanig te herverdelen, dat in het daaruit resulterende punt σ (op S(t+1)) zou gelden uk(t+1) ≥ uk(t), waarbij minstens één individu heeft uk(t+1) > uk(t) (p.164 in PA). Met andere woorden, het compensatie beginsel vergelijkt verschillende toestanden, en dus verschillende krommen. Men noemt dit wel een potentiële Pareto verbetering (p.164). In de figuur 1b wordt een kromme S(t+1) weergegeven (in groen), alsmede nogmaals de kromme S(t).

De figuur 1b toont, dat S(t+1) een verbetering is ten opzichte van S(t), in de zin van het compensatie beginsel. Weliswaar is de individu k=1 slechter af in μ, maar de situatie S(t+1) laat toe om k=1 te compenseren voor zijn verlies, en daarbij toch de verbetering van k=2 te behouden (punt σ)4. Men heeft inderdaad σ1 > ν1 en σ2 > ν2. De figuur 1b laat zien, dat in het punt σ de individu k=2 nut heeft overgedragen aan k=1. De lezer bedenke echter, dat feitelijk de individu k=2 goederen of geld overdraagt, die nutswaarde hebben voor k=1. Dit zijn daadwerkelijke materiële compensaties (side payments). Deze realiteit wordt weergegeven in een aangepaste versie van het compensatie beginsel: een beleids-verandering van ν naar μ is een verbetering, wanneer er compensaties mogelijk zijn om elke individu onverschillig (neutraal, indifferent) te maken met betrekking tot de overgang. Bovendien moet de som van al die compensaties positief zijn.

In deze formulering verwijst de indifferentie nog steeds naar het individuele nut uk, maar de compensaties zijn materieel (p.167 in PA). De toepassing van deze aangepaste versie wordt een kosten-baten analyse genoemd (p.166)5. Zij is handiger dan het oorspronkelijke compensatie beginsel, zodat in de rest van de column steeds de nieuwe versie zal worden gehanteerd. De kosten-baten analyse vereist de berekening van alle compensaties. Daartoe wordt gebruik gemaakt van de gecompenseerde vraagkromme, die is behandeld in een eerdere column. De gecompenseerde vraagkromme q = φ(p, u) beschrijft de vraag zodanig, dat de individu altijd indifferent blijft. Met andere woorden, hij houdt zijn nut u op een vaste waarde, bijvoorbeeld ν. De indifferentie wordt bereikt door eventuele veranderingen (in de prijzen p) te compenseren via het inkomen y. Men noemt deze compensatie Δy de compenserende variatie CV.

Afbeelding van gecompenseerde vraag
Figuur 2: Gecompenseerde vraag
     en compenserende variatie CV

Concreet luidt de definitie van CV: in een toestand met nut μ (op tijdstip t+1) is de compenserende variatie CV de omvang van de inkomens-verandering, die de individu terugbrengt van zijn nieuwe nut μ naar zijn oorspronkelijke nut ν (op tijdstip t) (p.144 in PA)6. De figuur 2 toont de manier om CV te berekenen op een deelmarkt met één prijs-verandering, van p(t) naar p(t+1). Het uitgangspunt is de gecompenseerde vraagkromme q = φ(p, ν), in rood. Nu is per definitie CV de integraal van φ tussen p(t+1) en p(t) (p.146, 158-159). Met andere woorden, CV = ∫p(t+1)p(t)  φ dp. Diens waarde is het rose oppervlak in de figuur 2, voorzien van een min-teken. Aangezien de prijs stijgt, moet het inkomen mee-stijgen, met |CV|. Na deze uitwijding over de CV kan nu het Hicks-Kaldor compensatie beginsel worden geformuleerd in een wiskundige ongelijkheid (p.167):

(1)     Σk=1K  CVk > 0

Kortom, de som van compensatie-betalingen en -ontvangsten moet positief zijn. Dit is enkel mogelijk, wanneer de beleidsverandering van S(t) naar S(t+1) gepaard gaat met productieve groei. Enerzijds is deze uitkomst triviaal. Maar in deze vorm leidt zij toch tot fascinerende inzichten. Bijvoorbeeld, definieer het verloren nut bij een prijs-stijging als Δuk = uk(p(t), y) − uk(p(t+1), y). In de figuur 1b is dat νk − μk. Bij een voldoende kleine CV kan Δuk eenvoudig worden uitgerekend, namelijk

(2)     CVk = Δuk / λk(t+1)

In deze formule is λk(t+1) de nutswaarde van een geld-eenheid voor de individu k in de toestand t+1
7. Combineren van de formules 1 en 2 leidt tot (p.171 in PA)

(3)     ΔW = Σk=1K  CVk = Σk=1K  Δuk / λk(t+1)

De formule 3 definieert de grootheid ΔW. Deze kan worden opgevat als de verandering van de maatschappelijke welvaartsfunctie W. Het compensatie beginsel in de versie van de formule 1 garandeert, dat de waarde van de SWF toeneemt. De grensnutten λk(t+1) zijn de weeg-factoren in de SWF. Merk op, dat het grensnut van geld afneemt, naarmate de individu k een hoger inkomen heeft. Kennelijk heeft het compensatie beginsel (bij een kleine CV) de verrassende consequentie, dat de belangen van de rijkere individuen een groter gewicht krijgen (p.171-172)! Daardoor heeft de SWF volgens het compensatie beginsel een concave vorm. Deze weging botst met bijvoorbeeld het model van de econoom K. Binmore, dat de weegfactoren koppelt aan egaliteit. Met andere woorden, dankzij het compensatie beginsel garandeert men wel productieve groei, maar nog geen billijke verdeling.

Nu is dat geen onoverkomelijk bezwaar. Immers, men kan een billijke herverdeling doorvoeren, nadat met het compensatie beginsel een groeipad is gekozen (p.170, 173 in PA). Aldus wordt de maatschappelijke keuze een proces met drie stappen8. Eerst wordt met het compensatie beginsel gegarandeerd, dat het beleid groei geeft. In de tweede stap wordt het effect onderzocht, dat de efficiëntie van productie heeft op de maatschappelijke gelijkheid. Hierbij wordt onderscheid gemaakt tussen diverse maatschappelijke groepen. In de derde stap geeft de politiek een weeg-factor aan de belangen van al die groepen. De beleidskeuze volgt uit de optelling van alle gewogen belangen, waardoor de groei en verdeling billijk zijn.


De theorie van het actor-gerichte institutionalisme

Het boek Games real actors play (afgekort AP) van F.W. Scharpf is het eerste werk, dat de theorie van het actor-gerichte institutionalisme systematisch presenteert9. Actoren zijn individuen of groepen. In dit laatste geval noemt men de actor corporatief (corporate)10. Het actor gerichte institutionalisme (afgekort AGI) veronderstelt, dat actoren zich gedragen als een homo economicus. Diens gedrag is (begrensd) rationeel, en behartigt het (verlichte) eigenbelang. Dit model veronderstelt dus, dat beleid tot stand komt in een machtsstrijd tussen actoren (p.43 in AP). Zij ontlenen hun macht aan de middelen, waarover zij beschikken (p.11 in AP). Er is geen centrale actor, die het beleid plant en uitvoert (p.11).

Echter, de actoren zijn niet geheel vrij in hun handelen. De maatschappij heeft instituties, die normen, procedures en rollen dicteren (p.16, 22, 39, 72, 180). Zij garanderen een zekere voorspelbaarheid van handelen (p.21, 40). Instituties baseren vaak op een moraal. Inderdaad kiezen de beleids-makers hun probleem-definitie, agenda en oplossingen op een normatieve wijze (p.13). Dit is een obstakel voor de bestuurskunde, die juist streeft naar positieve onderzoeken (met uitzondering van specialismen zoals het post-modernisme en de kritische theorie, die daarom pseudo-wetenschappelijk zijn). Maar dankzij de modellering van instituties kan toch dit aspect in rekening worden gebracht, zonder de rigoreuze aanname van de homo sociologicus te maken (p.21, 180). De instituties kunnen modelmatig worden gekoppeld aan de speltheorie, die analytisch zuiver positief is (p.5, 12).

Het AGI onderscheidt vier categorieën van instituties: de anarchie, het netwerk, de vereniging, en de hiërarchie (p.47). Trouwe lezers herkennen hierin direct de taxonomie van groeps-archetypen bij de econoom P. Frijters. De netwerken van Frijters hebben als enige kenmerk, dat er een onderling contact is. In het AGI hebben netwerken al enige samenhang en duurzaamheid, wellicht meer dan bij Frijters (p.136). Voorbeelden zijn coalities of bewegingen11. Verenigingen zijn groepen op basis van vrijwilligheid, zoals clubs. Verenigingen en hiërarchische organisaties zijn dermate hecht, dat zij beschikken over een eigen moraal. Aldus beperken de instituties de interactie van de actor op twee manieren: via de communicatieve structuur en via de actor-moraal.

Het AGI onderscheidt vier categorieën van interacties: unilateralisme (eenzijdige actie), de onderhandeling, de stemming en het bevel (p.17, 46 en verder). Aangezien de anarchie normloos is, laat het enkel de wederzijdse observatie en beïnvloeding toe12. Alleen de unilaterale actie is mogelijk. De actoren verwachten, dat de rest (begrensd) rationeel zal reageren (p.20). Actoren in een netwerk zullen gewoonlijk onderhandelen. Hier kan vaak al worden gebouwd op rechten, zoals het private eigendom en het bindende contract. Natuurlijk blijft ook unilateralisme mogelijk. De vereniging heeft een collectief doel en eigendom, zodat besluitvorming via de hoofdelijke stemming mogelijk wordt (naast de lagere vormen van interactie) (p.57). In de hiërarchie tenslotte zijn alle vormen van interactie mogelijk. Uniek voor die institutie is natuurlijk het bevel.

Vaak is de hiërarchie de meest geschikte institutie. De besluiten worden dan als dictaat opgelegd aan de actoren, zodat wel een voldoende draagvlak voor het beleid aanwezig moet zijn (p.153 en verder). Dat beperkt de transactie kosten. Wel moet men in het pluralisme het optreden van stem-cycli vermijden (p.156 en verder). Een handig beheer van de politieke agenda zorgt voor meer stabiliteit, maar maakt ook de billijkheid van de besluiten onzeker (p.159-160). Immers, het compensatie beginsel biedt zelf geen garanties. Juist daarom pleit het communicatie perspectief in de bestuurskunde voor reflectie, debat en overleg (p.161)13. Scharpf wijst op de beperkingen van het communicatie perspectief: in de practijk blijven alle betrokken actoren rente zoekend. Er is een conflict over verdeling, dat de overleg-democratie ondermijnt (p.164). Zelfs denkt Scharpf, dat het parlement niet primair het algemeen belang nastreeft, maar de beteugeling van de uitvoerende macht (p.166)!

Afbeelding van actor-gericht institutionalisme
Figuur 3: Beleidscyclus in actor-gericht
      institutionalisme

Naast de institutie en de interactie gebruikt het AGI een derde concept van beleid, namelijk de constellatie (zeg, samenstel) van de actoren (p.44-46). De constellatie definieert de kenmerken van het spel, te weten de betrokken actoren k (k=1, ..., K), en de beschikbare nuts-uitkomsten uk en strategieën sk (p.89)14. De nutten wegen de moraal van elke actor k mee. Immers, solidariteit, altruïsme enzovoort leiden tot koppeling van de diverse nutten uk (p.85-86). Men zou wellicht denken, dat de constellatie het spel vastlegt, en daarmee ook de interactie. Echter het AGI meent dat in de bestuurskunde de interactie apart aandacht verdient (p.44, 72). Het besluit in een spel kan verlopen via elk van de vier interacties. De moraal ligt dan vast in de interactie oriëntatie (p.84). Door de speltheorie te splitsen in de constellatie en de interactie maakt het AGI de moraal expliciet15. De figuur 3 toont schematisch de beleids-cyclus in de AGI-gedaante (p.44).

Men ziet, dat de diverse elementen van het AGI elkaar beïnvloeden. Instituties werken door in de interactie oriëntatie (zeg, de morele houding), die weer doorwerkt in de constellatie. Maar de interactie als vorm van communicatie (unilateralisme enzovoort) wordt pas gekozen, nadat zich een constellatie heeft gevormd. Het beleids-model in de figuur 3 heeft tenminste het voordeel, dat het gehanteerde actor-model tamelijk realistisch en geloofwaardig is. De actor is in staat tot sympathie met anderen. Hij maakt zijn keuzes door zijn nut optimaal te maken. Hij gehoorzaamt dus niet onvoorwaardelijk aan de christelijke Gouden Regel of het Kantiaanse categorische imperatief (p.21)16.

Nochtans is het schema in de figuur 3 natuurlijk een abstractie. Saillant is de moeilijkheid om het (neo-)corporatisme onder te brengen in de institutionele categorieën. In het corporatisme brengt de staat bestuurlijke structuren aan, zodat het overleg geen netwerk meer is (p.141). Scharpf prefereert de aanduiding regime voor het corporatisme. Men moet de categorieën van instituties dus eigenlijk verder verfijnen dan de vier genoemde categorieën (p.46). In het regime zorgen de structuren, dat unilateralisme wordt ontmoedigd (p.142). Regimes zijn relatief duurzaam (p.142)17. Verrassend is dat de hiërarchie van de staat zorgt voor een beter functioneren van regimes en netwerken (p.200 en verder). Namelijk, het toezicht van de staat prikkelt de private actoren om hun onderhandelingen af te sluiten met overeenkomsten! Dit punt zal nader worden geanalyseerd in de sub-paragraaf over het compensatie beginsel.

Aldus valt het oordeel over het AGI positief uit. De deductieve theorie brengt nooit alle invloeden in rekening, en verwaarloost soms de context (p.33). In de bestuurskunde gaan algemene wetten niet op (p.37). De reële invloed van subjectieve actoren wordt genegeerd (p.37). Soms ontkent de theorie zelfs, dat een stabiele toestand kan ontstaan (p.31, 102). Maar inductieve beschrijvingen van de toestand zijn wetenschappelijk gezien evenmin bevredigend (p.38). Het AGI draagt tenminste een analytisch kader aan, al zijn het geen universele wetten (p.30, 37). Wel kan men hopen, dat het analytische kader uitbreidt, naarmate het AGI zich ontwikkelt (p.30). Empirische gegevens blijven onmisbaar voor die aspecten, waar de theoretische analyse van het AGI lacunes vertoont (p.37).

Scharpf doet een fascinerende poging om de welvaarts-economie en de speltheorie te integreren in het AGI. Daarmee krijgen bestuurskundigen wiskundige instrumenten tot hun beschikking om beleid te analyseren. De welvaarts-economie, met name het compensatie beginsel, geeft inzicht in het rendement van de beleids-opties, en in het verdelings-conflict. En dankzij de speltheorie, zelfs in eenvoudige gedaante, kan men de mogelijke strategieën van de actoren inventariseren, en de politieke stabiliteit van de diverse opties. Bovendien geeft de welvaarts-economie een dieper inzicht in de instituties en de interacties, terwijl de speltheorie zeer geschikt is om constellaties te modelleren. De volgende sub-paragrafen lichten deze methoden nader toe.

Toepassing van het compensatie beginsel op beleid

Zonet is het compensatie beginsel van Hicks en Kaldor uitgelegd, vooral omdat het een belangrijk instrument is in het AGI. De compensatie wordt voorgesteld door de formule 2, en krijgt dan de gedaante van indifferentie lijnen Σk=1K  CVk = ΔW, waarbij ΔW een positieve constante is (p.91-92 in AP). De figuur 4a toont zo een veld van indifferentie lijnen (in rood en groen), voor K=2. Het beleid O geeft de status quo weer, waarin wordt afgezien van nieuw beleid. Het compensatie criterium verbiedt alle beleid met ΔW <0, zoals het beleid A. Maar het accepteert het beleid B en zelfs C. Weliswaar heeft in C de actor k=1 een negatieve CV1, maar dankzij de positieve ΔW is de actor k=2 in staat dat te compenseren. Blijkens het compensatie beginsel is dit beleid maatschappelijk wenselijk.

Grafieken van indifferentie veld
Figuur 4: Beleidstoestanden in een indifferentie veld:
     (a) toestanden A, B en C;
     (b) bereik van beleid bij onderhandeling over compensatie

Nu wordt duidelijk, waarom het AGI aandacht besteedt aan instituties. Immers, bij het beleid C moet een centrale actor hiërarchisch de compensatie afdwingen. In de anarchie of het netwerk kan dat niet. Hoogstens is er een minimale ordening, die het aanrichten van schade (zoals in de toestanden A en C) verbiedt. Men handelt zodanig, dat CVk ≥ 0. Dit heet negatieve coördinatie (p.112-114). Alleen de toestanden in het positieve kwadrant worden toegelaten. De toestand C is onbereikbaar, hoewel het maatschappelijk een verbetering is ten opzichte van O. De reden is, dat negatieve coördinatie al grenzen oplegt aan de verdeling, omdat het unilateralisme in essentie egocentrisch is. Het Hicks-Kaldor compensatie beginsel wil juist het verdelings-beleid uitstellen tot een latere fase. Maar Scharpf plaatst de verdeling weer centraal met de grafische versie van het compensatie beginsel in de figuur 4.

Dit kan helder worden geïllustreerd door de onderhandeling te onderzoeken, zeg binnen een netwerk of vereniging (p.119-120). Normaler wijze beschrijft O de toestand, die ontstaat zonder een overeenkomst (BAZO of BATNA genoemd). De onderhandeling toetst de alternatieven voor beleid aan het compensatie beginsel, net zoals de centrale actor in de hiërarchie. De centrale actor toetst enkel omwille van zijn kosten-baten analyse. Hij is niet per se verplicht om de compensatie ook uit te voeren. Wellicht wil hij juist het beleid gebruiken om de inkomens-verdeling te corrigeren18. Echter de onderhandeling is een interactie, die rekening houdt met de verdeling. De actoren onderhandelen over hun eigen belang, en niet over de collectieve groei. Actoren, die dreigen te verliezen door het voorgestelde alternatief (zeg, k=1 in toestand C), zullen enkel instemmen, wanneer hun verlies wordt gecompenseerd.

In de onderhandeling wordt in feit besloten over de verdeling van ΔW over alle betrokken actoren. Het uiteindelijke beleid zal dan toch beperkt blijven tot het positieve kwadrant. Dit wordt geïllustreerd in de figuur 4b. Hier wil de actor k=2 graag de toestand C realiseren. Aangezien de actor k=1 dit kan blokkeren (anders is onderhandelen onnodig), moet hij worden gecompenseerd. Die compensatie is minimaal gelijk aan de CV1 van de toestand C. In de toestand na compensatie zou gelden CV1=0. Echter, als de actor 1 rationeel is, dan zal hij proberen om zich zoveel mogelijk van de groei ΔW toe te eigenen! Immers de actor 2 zal pas bij CV2=0 afzien van de toestand C. Dien ten gevolge is het hele blauwe lijnstuk in de figuur 4b toegankelijk als finale toestand na de compensatie (p.126-127)19. Onderhandelingen leiden tot een efficiënt resultaat, mits de transactie kosten laag blijven (p.116 en verder).

Merk op, dat de politieke uitruil (logrolling, package deal) een alternatief is voor de compensatie, wanneer een betaling in geld moreel niet acceptabel is (p.128). Voor de volledigheid zij nog vermeld, dat de interacties tot gevolg kunnen hebben, dat de toestand O zal afwijken van status quo. Zowel de onderhandeling, de stemming als het bevel kunnen de status quo ter discussie stellen (p.122-124, 172, 199). Bij de onderhandeling is dat vanzelf sprekend20. Bij de stemming of het bevel kan de centrale actor het beleid afdwingen. Zijn hiërarchische macht stelt hem in staat om de toekomstige status quo te veranderen. Namelijk, hij dreigt de tegenstanders met een sanctie, wanneer zij het beleid blokkeren (p.172 en verder). Een bijzonder geval doet zich voor, wanneer de staat hiërarchisch toeziet op onderhandelingen in netwerken of in het corporatisme (p.197 en verder). In de hiërarchie kan de optie van het bevel steeds als dreigement worden ingezet!

Grafiek van indifferentie veld
Figuur 5: Indifferentie veld:
     oude en nieuwe grens van
     mogelijke compensaties

Namelijk, beschouw de figuur 5, waar twee private actoren onderhandelen over een beleids-toestand (p.199). De toestanden A en B zijn allebei maatschappelijk wenselijk, maar benadelen telkens een actor. Stel voorts, dat de staat via subsidies en wet- en regel-geving de status quo zodanig kan veranderen, dat beide actoren hierdoor schade oplopen (p.200 en verder). De staat kan hiermee dreigen om een overeenkomst af te dwingen. De BAZO van de private actoren verschuift dan van de status quo O naar, bijvoorbeeld, de toestand D. Gezien vanuit dit punt D is zowel het beleid A als B voordelig voor de twee private actoren! Een overeenkomst is nu waarschijnlijk. De twee private actoren komen tot zelf-regulering (p.202). Er is een synergie tussen onderhandelen en de hiërarchie, die ontstaat, omdat onderhandelen en het bevel allebei een mogelijke interactie van de hiërarchie zijn (p.205)21.

Toepassingen van de speltheorie op beleid

Scharpf heeft een voorkeur om de constellaties van actoren te modelleren met behulp van speltheorie22. De speltheorie is in staat om besluitvorming te modelleren en presenteren op een heldere wijze (p.45). De geïnteresseerde lezer kan her en der in de Gazet uitleg vinden van de speltheorie. Die zal niet worden herhaald in deze column. Spellen laten de beschikbare strategieën sk (doelstellingen) van de actoren zien, alsmede hun opbrengsten uk (p.99). Dat maakt het mogelijk om stabiele uitkomsten te vinden (p.7, 100). In de speltheorie wordt dit een Nash evenwicht genoemd. Het identificeren van evenwichten is belangrijk in de bestuurskunde, omdat besluitvorming instabiel kan zijn, met name bij stemmingen op basis van een meerderheid. Zie ook p.155 en verder in AP. Vaak kunnen de actoren een evenwicht bereiken door een gemengde strategie te hanteren. Scharpf meent evenwel dat in de practijk zo een strategie niet uitvoerbaar is (p.102)23.

Tabel 1: uitkomsten matrix van het gevangenen spel
oriëntatieindividualismesolidariteit
 A2 werkt samenA2 buit uitA2 werkt samenA2 buit uit
A1 werkt samen1, 1-1, 22, 21, 1
A1 buit uit2, -10, 01, 10, 0

Enkele opvallende toepassingen van speltheorie in Games real actors play verdienen de aandacht. Veruit het bekendste spel, ook in de bestuurskunde, is het gevangenen spel (prisoner's dilemma) (p.75). Dit spel wordt hier nogmaals weergegeven, in de tabel 1. Het is goed geschikt om het voordeel van de collectieve moraal te illustreren. Stel de nutsfunctie van actor k wordt gegeven door uk = vk + β×vj (p.84 en verder in AP)24. In deze formule zijn vk en vj de nauwe eigenbelangen van de actoren k en j. Dankzij de kruisterm in uk weegt de actor k toch het nut van actor j mee in zijn keuzes. Dit wordt de interactie oriëntatie van k genoemd (p.84). Links in de tabel 1 zijn de beide actoren individualistisch (β=0). Het evenwicht is (0, 0) rechts onder. Helemaal rechts in de tabel 1 zijn zij solidair (β>0, hier β=1). Nu is het evenwicht (2, 2) links boven, en dat is een verbetering ten opzichte van (0, 0), zodat hier kennelijk een solidaire oriëntatie loont25.

In de bestuurskunde is het belang van de interactie oriëntatie omstreden. Sommige bestuurskundigen menen, dat in de publieke sector de morele oriëntatie doorslag gevend moet zijn voor het handelen. Zij hangen het communicatie (culturele, normatieve, constructivistische) perspectief aan. Scharpf meent echter, dat professionele (individuele en corporatieve) actoren zich rationeel gedragen, en hun emoties zullen beteugelen (p.87). Hij geeft wel toe, dat zelfs in een pluralistische maatschappij de collectieve normen gericht kunnen worden geconstrueerd (p.161 en verder). Maar zulke acties hebben gewoonlijk toch het heimelijke doel om een nauw groepsbelang te bevorderen (rente zoeken). Zonet is al opgemerkt, dat men niet kan ontsnappen aan de verdelings-conflicten (p.164).

Tabel 2: uitkomsten matrix van het afhankelijkheids-spel
afhankelijkheidwederzijdseenzijdig
 A2 kiest p1A2 kiest p2A2 kiest p1A2 kiest p2
A1 kiest p21, 12, 31, 22, 3
A1 kiest p13, 21, 13, 21, 2

Voorts kan de speltheorie afhankelijkheden modelleren. Dit wordt geïllustreerd in de tabel 2 (p.140-141 in AP). Stel er zijn twee actoren k (k=1, 2), die ieder hun eigen beleids-programma pk willen uitvoeren. Echter zij zijn afhankelijk van de hulp van de ander. De tabel 2 geeft links de uitkomsten bij wederzijdse afhankelijkheid26. Er zijn twee Nash evenwichten, te weten links onder en rechts boven, zodat ongewis is welk programma uiteindelijk wordt gekozen. Evenwel, stel nu dat de actor k=2 extra middelen krijgt, zodat hij ook op eigen kracht een redelijke uitkomst kan bereiken. Hij verbetert als het ware zijn BAZO of reserverings-nut27. Zie rechts in de tabel 2. Dit maakt actor k=2 onafhankelijk van k=1, omdat de keuze voor zijn eigen programma p2 de beste uitkomst geeft, ongeacht de strategie van actor 1. Er is een uniek evenwicht rechts boven.

Maar de speltheorie heeft ook zijn beperkingen. Bijvoorbeeld modelleert men soms het spel van een corporatieve actor. Maar die is in de practijk toch een collectief van groepen en individuen. Daarom moet men strikt genomen ook het spel binnen de organisatie van de corporatieve actor modelleren met een spel. Dit wordt een genest spel genoemd (p.32, 83 in AP). Voorts zijn er nogal wat spellen met vele actoren. Het verdient dan de voorkeur om de analyse te beperken tot de kleine groep van werkelijk doorslag gevende (machtige) actoren (p.79). Of men combineert diverse actoren tot één corporatieve actor, zoals een coalitie (p.80). De voorbeelden in Games real actors play zijn bijna allemaal dyades (met K=2).


Evaluatie

Het actor-gerichte institutionalisme sluit goed aan bij de methode, waarmee de Gazet beleid probeert te analyseren. Daarom las uw columnist Games real actors play met voldoening. Er is echter geen reden voor euforie. Scharpf schrijft in zijn introductie (p.2): "Empiricists have not responded with great enthusiasm". En (p.6): "The reluctance of empirically oriented political scientists to use game-theoretic concepts seems to have two reasons. First, (...) much of the literature (...) is in fact practically inaccessible to the uninitiated. Moreover, empiricists (...) are generally repelled by the extreme unrealism of the assumptions". Echter, het actor-gerichte institutionalisme is nog jong, en uw columnist heeft vertrouwen, dat het allemaal wel goed komt.

 1. Zie met name hoofdstuk 5 in Microeconomic policy analysis (1984, McGraw-Hill, Inc.) van L.S. Friedman. Uw columnist vermeldt als een saillante bijzonderheid, dat in dit hoofdstuk Friedman de individuele nutsfunctie soms modelleert als een Cobb-Douglas functie, net zoals de socioloog J.S. Coleman doet in zijn lineaire systeem van handelen. (terug)
 2. Zie p.35 in Économie et finances publiques (2017, Economica) van L. Weber, M. Zarin-Nejadan, en A. Schönenberger. (terug)
 3. In de eerste jaren van de Gazet handelden de meeste columns over economische groei. Daarbij werd de doelfunctie voorgesteld door de prijssom van alle voortgebrachte producten. Tegenwoordig nuanceren sommige politici en economen het belang van economische groei, omdat immateriële waarden ook moeten worden meegewogen. Zelfs worden er alternatieve maten voorgesteld, zoals de Human development index (afgekort HDI). Uw columnist is daarvan geen voorstander, omdat die maten erg subjectief zijn. Zij zetten de deur open naar een onterechte scepsis jegens groei. (terug)
 4. Merk op, dat de kromme S(t) helemaal wordt omsloten door S(t+1). Op p.164-170 in Microeconomic policy analysis wordt de situatie onderzocht, waarin S(t) en S(t+1) elkaar kruisen. Er doet zich dan het merkwaardige fenomeen voor, dat het Hicks-Kaldor compensatie beginsel dubbelzinnig (ambiguous) is. Men kan voortdurend wisselen tussen S(t) als S(t+1), omdat beide toestanden voldoen aan het compensatie beginsel. Trouwe lezers herkennen dit fenomeen uit een eerdere column over prestatie-sturing. Overigens is daar het compensatie beginsel niet expliciet genoemd. Een dergelijke kruising van de twee krommen S(t) en S(t+1) zal vooral optreden bij ingrijpende hervormingen. Zie p.174-175 in Microeconomic policy analysis. Kennelijk is het compensatie beginsel alleen bruikbaar bij veranderingen, die de toestand-kromme enkel een beetje uitwaarts schuiven in de tijd. Op p.142 en 146-147 in Welfare economics and social choice theory (1980, Martinus Nijhoff Publishing) van A. Feldman wordt opgemerkt, dat vaak de overgang terug van S(t+1) naar S(t) niet mogelijk is. Denk bijvoorbeeld aan het aanleggen van een autoweg. Wanneer die eenmaal is gebouwd, dan zou vervolgens het weer slopen ervan hoge kosten veroorzaken. Dit boek duidt op p.145-146 de toestand van de figuur 1b aan als het Samuelson criterium. Als de toestand S(t) geheel is omvat door S(t+1), dan is de overgang terug niet mogelijk. Nauwkeuriger gezegd, die overgang is enkel mogelijk, wanneer S(t) en S(t+1) samenvallen. Maar dan is het geen echte overgang meer! (terug)
 5. Zie p.36 in Économie et finances publiques. De kosten-baten analyse wordt in detail uitgelegd in paragraaf 8.2.5. Op p.36 wordt opgemerkt, dat de kosten-baten analyse inderdaad de mogelijkheid onderzoekt om benadeelden te compenseren. Het is echter niet zeker, dat bij de uitvoering van het beleid die compensatie ook wordt uitbetaald aan hen! Bijvoorbeeld zal de aanleg van een autoweg leiden tot overlast bij de omwonenden. Toch krijgen zij gewoonlijk geen financiële vergoeding. Anderzijds kan het achterwege blijven van een compensatie tot gevolg hebben, dat het draagvlak voor het beleid wegvalt. Trouwe lezers herinneren zich de idee om de geluids-overlast van vliegtuigen te compenseren. (terug)
 6. De column over de gecompenseerde vraagkromme definieert de bestedings-functie (expenditure function) e(p, u). De compenserende variatie is nu simpel CV = e(p(t+1), μ) − e(p(t+1), ν). Zie p.82 in het klassieke naslagwerk Microeconomic theory (1995, Oxford University Press) van A. Mas-Colell, M.D. Whinston, en J.R. Green., of p.159 in Microeconomic policy analysis. Overigens wekt dit laatst genoemde boek wat verwarring. Namelijk, op p.159 zet het een min-teken voor deze formule van CV. Vervolgens stapt Microeconomic policy analysis op p.166-167 over naar een andere definitie van CV, die het min-teken achterwege laat. Deze laatste definitie betekent, dat iemand, die moet worden gecompenseerd, een negatieve CV heeft. Anders gezegd, CV is dan negatief, omdat degene die compenseert, dat bedrag kwijt raakt. Uw columnist hanteert in de hele column deze laatste definitie, die algemeen gebruikelijk is. (terug)
 7. Zie p.168-169 in Microeconomic policy analysis. Immers, compensatie betekent dat er geldt uk(p(t+1), yk + CVk) = uk(p(t), yk), wat in de figuur 1 gelijk is aan νk. Bij een voldoende kleine CVk is een expansie in een Taylor reeks mogelijk, te weten uk(p(t+1), yk + CVk) = uk(p(t+1), yk) + CVk × ∂uk/∂y. Nu is ∂uk/∂y in de toestand S(t+1) juist de nutswaarde λk(t+1) van een geld-eenheid, of zo men wil het grensnut van de besteding. Combineer deze formules met Δuk = uk(p(t), y) − uk(p(t+1), y), dan volgt uk(p(t), yk) = uk(p(t), yk) − Δuk + CVk × λk(t+1). Omschrijven geeft CVk = Δuk / λk(t+1), hetgeen was te bewijzen. (terug)
 8. Dit betoog is ontleend aan p.114-116 in Economics of the public sector (2000, W.W. Norton & Company, Inc.) van J.E. Stiglitz. (terug)
 9. Zie Games real actors play (1997, Westview Press) van F.W. Scharpf. Scharpf werkt onder andere samen met R. Mayntz, een toon aangevende Duitse bestuurskundige. De titel van het boek lijkt een zinspeling te zijn op een bekend psychologie boek, Games people play (1968, Penguin Books) van E. Berne. Uw columnist las dit boek een kwart eeuw geleden, en was niet onder indruk. Volgens Berne bestaat elke individu uit drie wezens: het kind, de volwassene, en de ouder. Bij interacties tussen twee personen zijn er dan negen combinaties van gesprekspartners mogelijk. (terug)
 10. Men kan een theorie van corporatieve actoren vinden in Foundations of social theory (1994, Harvard University Press) van J.S. Coleman. De corporatieve actor is een abstractie, die de interne processen van de corporatieve actor negeert. Het gedrag van de individuele actoren wordt intern gecoördineerd. Naarmate hun opvattingen homogener zijn, is de abstractie realistischer (p.58 in Games real actors play). Scharpf gebruikt de aanduiding corporatief alleen voor de hiërarchie. De andere groepen noemt hij collectief. (terug)
 11. Op p.57 duidt Games real actors play de coalitie, club, beweging en vereniging allemaal aan als collectieve actoren. Hij koppelt die niet aan een institutie. Echter, aangezien de actoren in de coalitie en in de beweging allebei de zeggenschap over hun eigen middelen behouden, ligt het voor de hand om ze netwerken te noemen. (terug)
 12. Zulke interacties worden uitvoerig beschreven in de hoofdstukken 8 en 9 van Handeln und Strukturen (2016, Beltz Juventa). Schimank en Scharpf zijn kennen elkaar goed van gedeelde wetenschappelijke projecten, en zijn geestverwanten. (terug)
 13. Bij het pleidooi voor communicatie wordt vaak verwezen naar de filosoof Habermas, die in zijn ideeën aanleunt tegen de humanistische psychologie. Het communicatie perspectief wordt radicaal bepleit door E. Tonkens in haar boek Mondige burgers, getemde professionals (2008, Uitgeverij Van Gennep). Ze argumenteert: "Nodig is dus een kritische bezinning op de ethiek. (...) De levensethiek richt zich op de vraag (...) wat een nastrevens-waardige (collectieve) identiteit is. (...) Hoewel het in een pluriforme [pluralistische EB] samenleving vaak onmogelijk is om overeenstemming te bereiken over dergelijke vragen, bepleiten wij toch een politisering van de levensethiek" (p.122-123). En: "Een vitale democratie organiseert en koestert kritiek, dissensus en controverse" (p.234). Uw columnist denkt dat zo de tegenstellingen zullen toenemen, en voelt zich in deze opvatting gesterkt door Scharpf, die voortdurend waarschuwt tegen nulsom spellen (p.165, 192 in Games real actors play). (terug)
 14. In werkelijkheid is het natuurlijk vrijwel onmogelijk om de constellatie en de interactie oriëntatie van een bepaalde maatschappelijke toestand enigszins nauwkeurig te bepalen. In een eerdere column is dit juist een zwakte van de social choice theorie genoemd. Scharpf heeft ook niet die ambitie. Op p.72 in Games real actors play schrijft hij: "Actor constellations are meant to represent what we know of the set of actors that are actually involved in particular interactions - their capabilities, their perceptions and evaluations of the outcomes obtainable, and the degree to which their payoff aspirations are compatible or incompatible with one another". De speltheorie in het actor-gerichte institutionalisme is al tevreden, wanneer de actor in staat is om de diverse beleids-alternatieven te ordenen volgens zijn eigen voorkeur: "It is only after we have identified these expected outcomes, that we can begin to rank them according to the specific interests, normative preferences, and identities of the different actors involved" (p.73). De outcome is hier materieel (qk), terwijl de ordening een afweging van nut (uk) is. In feite is Scharpf optimistischer over het meten van nut dan uw columnist in de column over social choice. (terug)
 15. Op p.85 in Games real actors play leest men: "For the actors involved, a relationship may assume a character of its own that affects the real gains and losses". (terug)
 16. Hoofdstuk 12 in Sozialpsychologie (2008, Springer Verlag) van L. Werth en J. Mayer toont aan, dat actoren pro-sociaal (moreel juist) gedrag inderdaad steeds afwegen tegen het eigenbelang. De socioloog A. Etzioni verwerkt deze spanning tussen het eigen en maatschappelijk belang in zijn Ik & Wij model. De theorie van de econoom K. Binmore veronderstelt een actor met een verlicht egoïsme, en een vermogen tot empathie. Uw columnist begrijpt niet, waarom sommige bestuurskundigen haast onvoorwaardelijk vertrouwen in de moraal van publieke actoren. Merk voorts op, dat het actor-gerichte institutionalisme de gebruikelijke bestuurlijke perspectieven omvat, te weten de beleids-cyclus, de (begrensde) rationaliteit, de communicatie, en de instituties. Het AGI integreert die verschillende perspectieven op een elegante manier. (terug)
 17. Een eerdere column heeft uitgelegd, dat vanaf de jaren 80 in Nederland hervormingen zijn doorgevoerd, die delen van het corporatisme hebben afgeschaft. Soms zijn de private actoren in het corporatisme eenvoudig te star. Aldus is de sociale zekerheid weer uitsluitend een staats-taak geworden. Er ontstaat pluralisme. (terug)
 18. In een eerdere column is aangetoond, dat de herverdeling via beleid kan leiden tot een verlies aan welvaart, genaamd dood-gewicht verlies (dead-weight loss). Algemener zal herverdeling via beleid vaak leiden tot een onwenselijke verandering van de product-vraag. Er ontstaat een perverse prikkel. Zie het beleid voor pensioenen en zorg. (terug)
 19. Theorieën over billijke verdelingen hanteren soms het beginsel van symmetrie of anonimiteit. Dat impliceert, dat een eventuele groei gelijk wordt verdeeld over de betrokken actoren. Zie de column over het beslisser-uitvoerder probleem, de column over het model van Binmore (in geval α12), en vooral de column over Nash onderhandelen. Dat impliceert in de figuur 3 dat CV1 = CV2 = ½ × ΔW. Als de actoren inderdaad anoniem zijn, dan leidt een gelijke compensatie ook tot een gelijk nut. Binmore schrijft op p.217 in Just playing (1998, The MIT Press): "The appeal of symmetric resolutions seems to be universal". Maar op p.204 in Playing fair (1994, The MIT Press) wijst hij op het Gevecht van de geslachten spel (zie in de column de kolommen "wederzijds" van de tabel 2), waarin de beide actoren juist een asymmetrisch resultaat prefereren. (terug)
 20. In onderhandelingen wordt de toestand O bepaald door het beste alternatief zonder overeenkomst (afgekort BAZO). Dat kan afwijken van de status quo (p.122 in Games real people play). Men zegt ook wel, dat het BAZO het reserverings-nut is. Of, zo men wil, het BAZO heeft lagere opportunity costs dan andere alternatieven. Een literatuur studie over onderhandelen heeft aangetoond, dat een onderhandelaar voortdurend moet proberen om zijn alternatieven te verbeteren. Daardoor zal hij meer macht verwerven in de onderhandeling. Blijkens p.123 in Games real actors play geldt dat dus net zo voor beleidskeuzes. (terug)
 21. Soms helpt de dreiging niet, omdat kennelijk de actoren de toestand D verkiezen boven A of B. Dit gebeurde bijvoorbeeld in Nederland, nadat de regering had gedreigd om de sociale zekerheid te onttrekken aan het corporatisme. Zie de betreffende column of het boek A Dutch miracle (1997, Amsterdam University Press) van J. Visser en A. Hemerijck. Dit boek noemt die begin-toestand een immobiel corporatisme. Men ziet, dat zelfs de institutie van het corporatisme (regime) weer kan worden gesplitst in categorieën! (terug)
 22. Scharpf staat niet alleen in deze voorkeur. Veel bestuurskundigen noemen de beleidsvorming letterlijk een spel. En H. Gintis pleit in The bounds of reason (2014, Princeton University Press) vol overtuiging voor het gebruik van de speltheorie in de bestuurskunde en politicologie (en in andere menswetenschappen). (terug)
 23. Uw columnist is niet helemaal overtuigd. Hij vindt het denkbaar, dat de actoren in een beleids-programma elkaar af en toe (quasi-toevallig) "een voordeeltje gunnen" omwille van de goede relatie. Dat komt neer op een gemengde strategie. (terug)
 24. De Gazet verdiept zich vrijwel vanaf zijn oprichting in gekoppelde nutsfuncties. Zie de column over de homo economicus voor een eerste wiskundige beschouwing. Een uitgebreidere studie is de column over rationele modellen van normen. (terug)
 25. Men kan dezelfde rekenmethode vinden in de eerdere column over de rationele keuzeleer. Dat voorbeeld is ontleend aan de maatschappelijke psychologie, te weten het boek De kern van de sociale psychologie (1986, Van Loghum Slaterus) van P. Veen en H.A.M. Wilke. Natuurlijk bewijst de tabel 1 niet, dat een solidaire maatschappij beter is dan een individualistische (competitieve). Allereerst behalen competitieve actoren in een solidaire maatschappij minstens dezelfde uitkomsten als solidaire actoren. En ten tweede komt de samenwerking niet tot stand, wanneer β relatief klein blijft, bijvoorbeeld β=¼. Volgens p.87 in Games real actors play leidt felle concurrentie tot β<0, bijvoorbeeld β=-1. In die toestand is groei minder belangrijk dan de verdeling. Als β zeer negatief is, dan telt het eigen belang nauwelijks mee. Dit representeert vijandschap. Op p.124 wordt nog opgemerkt, dat het uitwisselen van informatie eveneens een gevangenen spel is. In beginsel profiteren alle actoren van een breed gespreide kennis. Maar kennis is ook macht, zodat een actor zichzelf schaadt door eenzijdig zijn kennis over te dragen. Dit heet het dilemma van de onderhandelaar (p.124). In onderhandelingen wordt kennis daadwerkelijk meestal strategisch ingezet. (terug)
 26. Het spel met wederzijdse afhankelijkheden is bekend onder de aanduiding "strijd der geslachten" (battle of the sexes). Een echtpaar wil naar een evenement gaan, en elk heeft zijn voorkeurs-evenement. Echter ook willen ze allebei graag samen gaan. (terug)
 27. De verschuiving van de machts-balans kan op een onverwachte manier tot stand komen. Stel dat de twee actoren eerst solidair zijn (tabel 1), waarbij de actor 2 bijvoorbeeld essentiële informatie ontvangt van actor 1. Deze informatie kan hem minder afhankelijk maken van actor 1, waardoor de afhankelijkheid eenzijdig wordt. Zie p.124 in Games real actors play of p.198 in in Handboek beleidswetenschap (2001, Uitgeverij Boom). Daar wordt het probleem aangeduid als de participatie-paradox. Op p.140 in Games real actors play wordt ook de situatie genoemd van een kleine politieke partij, die in coalitie-onderhandelingen kan kiezen uit twee grote partijen als regerings-partner. (terug)