Sinds ongeveer een jaar verdiept de Gazet zich in bestuurskundige modellen. Zij kunnen een brug slaan tussen theorieën uit de economie en de politiek. Recent heeft de bestuurskunde het actor-gerichte institutionalisme ontwikkeld, dat inderdaad het beste uit deze twee werelden verenigt. Het rationele gedrag wordt ingeperkt door de instituties. Bovendien wordt rekening gehouden met de interactie-vorm. Het beleid blijkt goed te kunnen worden beschreven met methoden uit de social choice theorie. Met name de speltheorie en het Hicks-Kaldor compensatie beginsel geven veel inzicht in beleid.
De Gazet heeft diverse columns gewijd aan bestuurskundige methodieken. De inductieve methode in de bestuurskunde (organisatie theorie) heeft het probleem, dat het alle invloeds-factoren wil analyseren. Echter, dat zijn er simpelweg te veel. Het lukt dan zelden om het inzicht te vergroten. De deductieve methode in de bestuurskunde (rationele keuze leer) hanteert hypothesen van wetmatigheden. Dit is een abstractie, maar maakt ten minste een empirische verificatie mogelijk. Het actor-gerichte institutionalisme is niet een deductieve theorie, maar het reikt wel universeel toepasbare theoretische kaders aan. De beleids-analist heeft dan tenminste enig houvast. Dat is een verbetering ten opzichte van de verhalende aanpak in de bestuurskunde. Alvorens echter de kenmerken van het actor-gerichte institutionalisme te beschrijven, moet eerst het compensatie beginsel van Hicks en Kaldor worden uitgelegd.
In een voorgaande column is opgemerkt, dat het populaire Pareto criterium niet volstaat bij het maken van beleidskeuzes. Een economische toestand is Pareto optimaal of efficiënt, indien geen enkel alternatief leidt tot een hoger individueel nut voor sommigen zonder het individuele nut van anderen te verminderen. Dit criterium heeft het voordeel, dat geen gebruik wordt gemaakt van inter-persoonlijke nuts-vergelijkingen. Met andere woorden, de nuts-belevingen van twee individuen onderling worden niet vergeleken. Maar helaas is het Pareto criterium niet bijster geschikt om de billijkheid (fairness, justice) van besluiten te toetsen. De Gazet heeft al diverse malen aandacht besteed aan het falen van het Pareto criterium in beleids-afwegingen. De huidige paragraaf herhaalt de argumentatie, en vervolgt met een diepgaande analyse. Bij het schrijven is veel gebruik gemaakt van het boek Microeconomic policy analysis (afgekort PA)1.
Ten eerste heeft al vijf jaren terug een column er op gewezen, dat de nuts-verbetering van een individu leidt tot een nieuw referentie-kader voor zijn omgeving. De individuen, die dit referentie-kader gebruiken, zullen minder tevreden worden door de wijziging. Men kan leven met die onvrede, zolang de nuts-verbetering van de begunstigde individu ontstaat uit een beloning voor een excellente prestatie. Maar toch ligt het in de menselijke natuur om te verlangen naar enige gelijkheid (symmetrie, anonimiteit) (p.161-162 in PA). Ten tweede accepteert het Pareto beginsel de bestaande toestand (de status quo). Met name wordt dus geen aandacht besteed aan al aanwezige onbillijkheden (p.161 in PA). Het derde bezwaar tegen het Pareto criterium is eigenlijk de vertaling van het tweede bezwaar naar de practijk. Namelijk, het criterium is practisch onbruikbaar. Immers, politiek bestaat juist wèl uit het afwegen van interpersoonlijke belangen (p.160)2.
Daarom verbaast het niet, dat de wetenschap (evenals de Gazet) sinds jaar en dag zoekt naar betere criteria. Sinds meer dan twee eeuwen (dus nog vóór het Pareto criterium) wordt het utilitarisme (utilisme, utilitarianism) gebruikt bij welvaarts-studies. Het utilitarisme meet de welvaart af aan een collectieve nutsfunctie, de maatschappelijke of sociale welvaartsfunctie (afgekort SWF). De SWF aggregeert (accumuleert, sommeert) het nut van alle individuen. Volgens het utilitarisme is het in het algemeen belang om de waarde van de SWF maximaal te maken. Deze methode hanteert weliswaar het Pareto criterium, maar probeert vervolgens het meest billijke Pareto efficiënte punt te vinden. Een alternatieve aanpak, de Nash onderhandeling, kan eveneens worden opgevat als een vorm van utilitarisme. De billijkheid wordt steeds afgewogen aan de collectieve nutsverdeling. Soms wordt nut gelijk gesteld aan geld (een overdraagbaar of transferabel nut).
Merk op, dat het utilitarisme aansluit bij de practische maten voor politieke besluitvorming. Bijvoorbeeld hecht de politiek waarde aan de groei van het nationale inkomen of het bruto binnenlands product (BBP)3. De huidige paragraaf wil het Hicks-Kaldor compensatie beginsel beschrijven, dat eveneens streeft naar de vergroting van de te verdelen welvaart. Beschouw een maatschappij, die bestaat uit K individuen. Tezamen produceren zij N goederen, met totale hoeveelheden qn (n=1, ..., N). Op het tijdstip t bevindt de maatschappij zich in een toestand S(t). S(t) definieert de wetgeving, de beschikbare productie-technieken, het assortiment aan goederen, de hoeveelheden qn van die goederen, en dus ook hun prijzen pn. Bovendien kunnen in S(t) de beschikbare goederen op een bepaalde manier worden verdeeld over de individuen. Natuurlijk is deze verdeling mede bepalend voor de maatschappelijke productiviteit.
Merk op, dat in elke denkbare toestand S(t) een maximale productie haalbaar is. Natuurlijk kan men ook minder produceren, door middel van verspilling. De maximale productie vormt een hyper-oppervlak in de N-dimensionale ruimte van q. In geval van twee dimensies heet dit de productie-mogelijkheden kromme. Echter het Hicks-Kaldor compensatie beginsel beschouwt de nuts-mogelijkheden, en niet de productie-mogelijkheden. Immers, de productie-mogelijkheden geven niet direct informatie over de maatschappelijke verdeling. Zij uk(qk) het nut, dat individu k ontleent aan zijn pakket qk van goederen. Men zoekt nu dus het hyper-oppervlak in de K-dimensionale nuts-ruimte van individuen, dat overeen komt met maximale (efficiënte) productie. De figuur 1a toont ter illustratie de kromme van nuts-mogelijkheden (rood) voor K=2. De kromme correspondeert met S(t).
Elk punt op de kromme S(t) correspondeert met een bepaalde verdeling van q over de K individuen. In de figuur 1a is het punt ν ingetekend als een voorbeeld van een vaste verdeling. Helaas doet het compensatie beginsel geen uitspraak over de billijkheid van ν. Namelijk, het Hicks-Kaldor beginsel luidt als volgt: een beleids-verandering van ν (op S(t)) naar μ (op een kromme S(t+1)) is een verbetering, wanneer het mogelijk is om de geproduceerde goederen q in μ zodanig te herverdelen, dat in het daaruit resulterende punt σ (op S(t+1)) zou gelden uk(t+1) ≥ uk(t), waarbij minstens één individu heeft uk(t+1) > uk(t) (p.164 in PA). Met andere woorden, het compensatie beginsel vergelijkt verschillende toestanden, en dus verschillende krommen. Men noemt dit wel een potentiële Pareto verbetering (p.164). In de figuur 1b wordt een kromme S(t+1) weergegeven (in groen), alsmede nogmaals de kromme S(t).
De figuur 1b toont, dat S(t+1) een verbetering is ten opzichte van S(t), in de zin van het compensatie beginsel. Weliswaar is de individu k=1 slechter af in μ, maar de situatie S(t+1) laat toe om k=1 te compenseren voor zijn verlies, en daarbij toch de verbetering van k=2 te behouden (punt σ)4. Men heeft inderdaad σ1 > ν1 en σ2 > ν2. De figuur 1b laat zien, dat in het punt σ de individu k=2 nut heeft overgedragen aan k=1. De lezer bedenke echter, dat feitelijk de individu k=2 goederen of geld overdraagt, die nutswaarde hebben voor k=1. Dit zijn daadwerkelijke materiële compensaties (side payments). Deze realiteit wordt weergegeven in een aangepaste versie van het compensatie beginsel: een beleids-verandering van ν naar μ is een verbetering, wanneer er compensaties mogelijk zijn om elke individu onverschillig (neutraal, indifferent) te maken met betrekking tot de overgang. Bovendien moet de som van al die compensaties positief zijn.
In deze formulering verwijst de indifferentie nog steeds naar het individuele nut uk, maar de compensaties zijn materieel (p.167 in PA). De toepassing van deze aangepaste versie wordt een kosten-baten analyse genoemd (p.166)5. Zij is handiger dan het oorspronkelijke compensatie beginsel, zodat in de rest van de column steeds de nieuwe versie zal worden gehanteerd. De kosten-baten analyse vereist de berekening van alle compensaties. Daartoe wordt gebruik gemaakt van de gecompenseerde vraagkromme, die is behandeld in een eerdere column. De gecompenseerde vraagkromme q = φ(p, u) beschrijft de vraag zodanig, dat de individu altijd indifferent blijft. Met andere woorden, hij houdt zijn nut u op een vaste waarde, bijvoorbeeld ν. De indifferentie wordt bereikt door eventuele veranderingen (in de prijzen p) te compenseren via het inkomen y. Men noemt deze compensatie Δy de compenserende variatie CV.
Concreet luidt de definitie van CV: in een toestand met nut μ (op tijdstip t+1) is de compenserende variatie CV de omvang van de inkomens-verandering, die de individu terugbrengt van zijn nieuwe nut μ naar zijn oorspronkelijke nut ν (op tijdstip t) (p.144 in PA)6. De figuur 2 toont de manier om CV te berekenen op een deelmarkt met één prijs-verandering, van p(t) naar p(t+1). Het uitgangspunt is de gecompenseerde vraagkromme q = φ(p, ν), in rood. Nu is per definitie CV de integraal van φ tussen p(t+1) en p(t) (p.146, 158-159). Met andere woorden, CV = ∫p(t+1)p(t) φ dp. Diens waarde is het rose oppervlak in de figuur 2, voorzien van een min-teken. Aangezien de prijs stijgt, moet het inkomen mee-stijgen, met |CV|. Na deze uitwijding over de CV kan nu het Hicks-Kaldor compensatie beginsel worden geformuleerd in een wiskundige ongelijkheid (p.167):
(1) Σk=1K  CVk > 0
Kortom, de som van compensatie-betalingen en -ontvangsten moet positief zijn. Dit is enkel mogelijk, wanneer de beleidsverandering van S(t) naar S(t+1) gepaard gaat met productieve groei. Enerzijds is deze uitkomst triviaal. Maar in deze vorm leidt zij toch tot fascinerende inzichten. Bijvoorbeeld, definieer het verloren nut bij een prijs-stijging als Δuk = uk(p(t), y) − uk(p(t+1), y). In de figuur 1b is dat νk − μk. Bij een voldoende kleine CV kan Δuk eenvoudig worden uitgerekend, namelijk
(2) CVk = Δuk / λk(t+1)
In deze formule is λk(t+1) de nutswaarde van een geld-eenheid voor de individu k in de toestand t+1 7. Combineren van de formules 1 en 2 leidt tot (p.171 in PA)
(3) ΔW = Σk=1K  CVk = Σk=1K  Δuk / λk(t+1)
De formule 3 definieert de grootheid ΔW. Deze kan worden opgevat als de verandering van de maatschappelijke welvaartsfunctie W. Het compensatie beginsel in de versie van de formule 1 garandeert, dat de waarde van de SWF toeneemt. De grensnutten λk(t+1) zijn de weeg-factoren in de SWF. Merk op, dat het grensnut van geld afneemt, naarmate de individu k een hoger inkomen heeft. Kennelijk heeft het compensatie beginsel (bij een kleine CV) de verrassende consequentie, dat de belangen van de rijkere individuen een groter gewicht krijgen (p.171-172)! Daardoor heeft de SWF volgens het compensatie beginsel een concave vorm. Deze weging botst met bijvoorbeeld het model van de econoom K. Binmore, dat de weegfactoren koppelt aan egaliteit. Met andere woorden, dankzij het compensatie beginsel garandeert men wel productieve groei, maar nog geen billijke verdeling.
Nu is dat geen onoverkomelijk bezwaar. Immers, men kan een billijke herverdeling doorvoeren, nadat met het compensatie beginsel een groeipad is gekozen (p.170, 173 in PA). Aldus wordt de maatschappelijke keuze een proces met drie stappen8. Eerst wordt met het compensatie beginsel gegarandeerd, dat het beleid groei geeft. In de tweede stap wordt het effect onderzocht, dat de efficiëntie van productie heeft op de maatschappelijke gelijkheid. Hierbij wordt onderscheid gemaakt tussen diverse maatschappelijke groepen. In de derde stap geeft de politiek een weeg-factor aan de belangen van al die groepen. De beleidskeuze volgt uit de optelling van alle gewogen belangen, waardoor de groei en verdeling billijk zijn.
Het boek Games real actors play (afgekort AP) van F.W. Scharpf is het eerste werk, dat de theorie van het actor-gerichte institutionalisme systematisch presenteert9. Actoren zijn individuen of groepen. In dit laatste geval noemt men de actor corporatief (corporate)10. Het actor gerichte institutionalisme (afgekort AGI) veronderstelt, dat actoren zich gedragen als een homo economicus. Diens gedrag is (begrensd) rationeel, en behartigt het (verlichte) eigenbelang. Dit model veronderstelt dus, dat beleid tot stand komt in een machtsstrijd tussen actoren (p.43 in AP). Zij ontlenen hun macht aan de middelen, waarover zij beschikken (p.11 in AP). Er is geen centrale actor, die het beleid plant en uitvoert (p.11).
Echter, de actoren zijn niet geheel vrij in hun handelen. De maatschappij heeft instituties, die normen, procedures en rollen dicteren (p.16, 22, 39, 72, 180). Zij garanderen een zekere voorspelbaarheid van handelen (p.21, 40). Instituties baseren vaak op een moraal. Inderdaad kiezen de beleids-makers hun probleem-definitie, agenda en oplossingen op een normatieve wijze (p.13). Dit is een obstakel voor de bestuurskunde, die juist streeft naar positieve onderzoeken (met uitzondering van specialismen zoals het post-modernisme en de kritische theorie, die daarom pseudo-wetenschappelijk zijn). Maar dankzij de modellering van instituties kan toch dit aspect in rekening worden gebracht, zonder de rigoreuze aanname van de homo sociologicus te maken (p.21, 180). De instituties kunnen modelmatig worden gekoppeld aan de speltheorie, die analytisch zuiver positief is (p.5, 12).
Het AGI onderscheidt vier categorieën van instituties: de anarchie, het netwerk, de vereniging, en de hiërarchie (p.47). Trouwe lezers herkennen hierin direct de taxonomie van groeps-archetypen bij de econoom P. Frijters. De netwerken van Frijters hebben als enige kenmerk, dat er een onderling contact is. In het AGI hebben netwerken al enige samenhang en duurzaamheid, wellicht meer dan bij Frijters (p.136). Voorbeelden zijn coalities of bewegingen11. Verenigingen zijn groepen op basis van vrijwilligheid, zoals clubs. Verenigingen en hiërarchische organisaties zijn dermate hecht, dat zij beschikken over een eigen moraal. Aldus beperken de instituties de interactie van de actor op twee manieren: via de communicatieve structuur en via de actor-moraal.
Het AGI onderscheidt vier categorieën van interacties: unilateralisme (eenzijdige actie), de onderhandeling, de stemming en het bevel (p.17, 46 en verder). Aangezien de anarchie normloos is, laat het enkel de wederzijdse observatie en beïnvloeding toe12. Alleen de unilaterale actie is mogelijk. De actoren verwachten, dat de rest (begrensd) rationeel zal reageren (p.20). Actoren in een netwerk zullen gewoonlijk onderhandelen. Hier kan vaak al worden gebouwd op rechten, zoals het private eigendom en het bindende contract. Natuurlijk blijft ook unilateralisme mogelijk. De vereniging heeft een collectief doel en eigendom, zodat besluitvorming via de hoofdelijke stemming mogelijk wordt (naast de lagere vormen van interactie) (p.57). In de hiërarchie tenslotte zijn alle vormen van interactie mogelijk. Uniek voor die institutie is natuurlijk het bevel.
Vaak is de hiërarchie de meest geschikte institutie. De besluiten worden dan als dictaat opgelegd aan de actoren, zodat wel een voldoende draagvlak voor het beleid aanwezig moet zijn (p.153 en verder). Dat beperkt de transactie kosten. Wel moet men in het pluralisme het optreden van stem-cycli vermijden (p.156 en verder). Een handig beheer van de politieke agenda zorgt voor meer stabiliteit, maar maakt ook de billijkheid van de besluiten onzeker (p.159-160). Immers, het compensatie beginsel biedt zelf geen garanties. Juist daarom pleit het communicatie perspectief in de bestuurskunde voor reflectie, debat en overleg (p.161)13. Scharpf wijst op de beperkingen van het communicatie perspectief: in de practijk blijven alle betrokken actoren rente zoekend. Er is een conflict over verdeling, dat de overleg-democratie ondermijnt (p.164). Zelfs denkt Scharpf, dat het parlement niet primair het algemeen belang nastreeft, maar de beteugeling van de uitvoerende macht (p.166)!
Naast de institutie en de interactie gebruikt het AGI een derde concept van beleid, namelijk de constellatie (zeg, samenstel) van de actoren (p.44-46). De constellatie definieert de kenmerken van het spel, te weten de betrokken actoren k (k=1, ..., K), en de beschikbare nuts-uitkomsten uk en strategieën sk (p.89)14. De nutten wegen de moraal van elke actor k mee. Immers, solidariteit, altruïsme enzovoort leiden tot koppeling van de diverse nutten uk (p.85-86). Men zou wellicht denken, dat de constellatie het spel vastlegt, en daarmee ook de interactie. Echter het AGI meent dat in de bestuurskunde de interactie apart aandacht verdient (p.44, 72). Het besluit in een spel kan verlopen via elk van de vier interacties. De moraal ligt dan vast in de interactie oriëntatie (p.84). Door de speltheorie te splitsen in de constellatie en de interactie maakt het AGI de moraal expliciet15. De figuur 3 toont schematisch de beleids-cyclus in de AGI-gedaante (p.44).
Men ziet, dat de diverse elementen van het AGI elkaar beïnvloeden. Instituties werken door in de interactie oriëntatie (zeg, de morele houding), die weer doorwerkt in de constellatie. Maar de interactie als vorm van communicatie (unilateralisme enzovoort) wordt pas gekozen, nadat zich een constellatie heeft gevormd. Het beleids-model in de figuur 3 heeft tenminste het voordeel, dat het gehanteerde actor-model tamelijk realistisch en geloofwaardig is. De actor is in staat tot sympathie met anderen. Hij maakt zijn keuzes door zijn nut optimaal te maken. Hij gehoorzaamt dus niet onvoorwaardelijk aan de christelijke Gouden Regel of het Kantiaanse categorische imperatief (p.21)16.
Nochtans is het schema in de figuur 3 natuurlijk een abstractie. Saillant is de moeilijkheid om het (neo-)corporatisme onder te brengen in de institutionele categorieën. In het corporatisme brengt de staat bestuurlijke structuren aan, zodat het overleg geen netwerk meer is (p.141). Scharpf prefereert de aanduiding regime voor het corporatisme. Men moet de categorieën van instituties dus eigenlijk verder verfijnen dan de vier genoemde categorieën (p.46). In het regime zorgen de structuren, dat unilateralisme wordt ontmoedigd (p.142). Regimes zijn relatief duurzaam (p.142)17. Verrassend is dat de hiërarchie van de staat zorgt voor een beter functioneren van regimes en netwerken (p.200 en verder). Namelijk, het toezicht van de staat prikkelt de private actoren om hun onderhandelingen af te sluiten met overeenkomsten! Dit punt zal nader worden geanalyseerd in de sub-paragraaf over het compensatie beginsel.
Aldus valt het oordeel over het AGI positief uit. De deductieve theorie brengt nooit alle invloeden in rekening, en verwaarloost soms de context (p.33). In de bestuurskunde gaan algemene wetten niet op (p.37). De reële invloed van subjectieve actoren wordt genegeerd (p.37). Soms ontkent de theorie zelfs, dat een stabiele toestand kan ontstaan (p.31, 102). Maar inductieve beschrijvingen van de toestand zijn wetenschappelijk gezien evenmin bevredigend (p.38). Het AGI draagt tenminste een analytisch kader aan, al zijn het geen universele wetten (p.30, 37). Wel kan men hopen, dat het analytische kader uitbreidt, naarmate het AGI zich ontwikkelt (p.30). Empirische gegevens blijven onmisbaar voor die aspecten, waar de theoretische analyse van het AGI lacunes vertoont (p.37).
Scharpf doet een fascinerende poging om de welvaarts-economie en de speltheorie te integreren in het AGI. Daarmee krijgen bestuurskundigen wiskundige instrumenten tot hun beschikking om beleid te analyseren. De welvaarts-economie, met name het compensatie beginsel, geeft inzicht in het rendement van de beleids-opties, en in het verdelings-conflict. En dankzij de speltheorie, zelfs in eenvoudige gedaante, kan men de mogelijke strategieën van de actoren inventariseren, en de politieke stabiliteit van de diverse opties. Bovendien geeft de welvaarts-economie een dieper inzicht in de instituties en de interacties, terwijl de speltheorie zeer geschikt is om constellaties te modelleren. De volgende sub-paragrafen lichten deze methoden nader toe.
Zonet is het compensatie beginsel van Hicks en Kaldor uitgelegd, vooral omdat het een belangrijk instrument is in het AGI. De compensatie wordt voorgesteld door de formule 2, en krijgt dan de gedaante van indifferentie lijnen Σk=1K  CVk = ΔW, waarbij ΔW een positieve constante is (p.91-92 in AP). De figuur 4a toont zo een veld van indifferentie lijnen (in rood en groen), voor K=2. Het beleid O geeft de status quo weer, waarin wordt afgezien van nieuw beleid. Het compensatie criterium verbiedt alle beleid met ΔW <0, zoals het beleid A. Maar het accepteert het beleid B en zelfs C. Weliswaar heeft in C de actor k=1 een negatieve CV1, maar dankzij de positieve ΔW is de actor k=2 in staat dat te compenseren. Blijkens het compensatie beginsel is dit beleid maatschappelijk wenselijk.
Nu wordt duidelijk, waarom het AGI aandacht besteedt aan instituties. Immers, bij het beleid C moet een centrale actor hiërarchisch de compensatie afdwingen. In de anarchie of het netwerk kan dat niet. Hoogstens is er een minimale ordening, die het aanrichten van schade (zoals in de toestanden A en C) verbiedt. Men handelt zodanig, dat CVk ≥ 0. Dit heet negatieve coördinatie (p.112-114). Alleen de toestanden in het positieve kwadrant worden toegelaten. De toestand C is onbereikbaar, hoewel het maatschappelijk een verbetering is ten opzichte van O. De reden is, dat negatieve coördinatie al grenzen oplegt aan de verdeling, omdat het unilateralisme in essentie egocentrisch is. Het Hicks-Kaldor compensatie beginsel wil juist het verdelings-beleid uitstellen tot een latere fase. Maar Scharpf plaatst de verdeling weer centraal met de grafische versie van het compensatie beginsel in de figuur 4.
Dit kan helder worden geïllustreerd door de onderhandeling te onderzoeken, zeg binnen een netwerk of vereniging (p.119-120). Normaler wijze beschrijft O de toestand, die ontstaat zonder een overeenkomst (BAZO of BATNA genoemd). De onderhandeling toetst de alternatieven voor beleid aan het compensatie beginsel, net zoals de centrale actor in de hiërarchie. De centrale actor toetst enkel omwille van zijn kosten-baten analyse. Hij is niet per se verplicht om de compensatie ook uit te voeren. Wellicht wil hij juist het beleid gebruiken om de inkomens-verdeling te corrigeren18. Echter de onderhandeling is een interactie, die rekening houdt met de verdeling. De actoren onderhandelen over hun eigen belang, en niet over de collectieve groei. Actoren, die dreigen te verliezen door het voorgestelde alternatief (zeg, k=1 in toestand C), zullen enkel instemmen, wanneer hun verlies wordt gecompenseerd.
In de onderhandeling wordt in feit besloten over de verdeling van ΔW over alle betrokken actoren. Het uiteindelijke beleid zal dan toch beperkt blijven tot het positieve kwadrant. Dit wordt geïllustreerd in de figuur 4b. Hier wil de actor k=2 graag de toestand C realiseren. Aangezien de actor k=1 dit kan blokkeren (anders is onderhandelen onnodig), moet hij worden gecompenseerd. Die compensatie is minimaal gelijk aan de CV1 van de toestand C. In de toestand na compensatie zou gelden CV1=0. Echter, als de actor 1 rationeel is, dan zal hij proberen om zich zoveel mogelijk van de groei ΔW toe te eigenen! Immers de actor 2 zal pas bij CV2=0 afzien van de toestand C. Dien ten gevolge is het hele blauwe lijnstuk in de figuur 4b toegankelijk als finale toestand na de compensatie (p.126-127)19. Onderhandelingen leiden tot een efficiënt resultaat, mits de transactie kosten laag blijven (p.116 en verder).
Merk op, dat de politieke uitruil (logrolling, package deal) een alternatief is voor de compensatie, wanneer een betaling in geld moreel niet acceptabel is (p.128). Voor de volledigheid zij nog vermeld, dat de interacties tot gevolg kunnen hebben, dat de toestand O zal afwijken van status quo. Zowel de onderhandeling, de stemming als het bevel kunnen de status quo ter discussie stellen (p.122-124, 172, 199). Bij de onderhandeling is dat vanzelf sprekend20. Bij de stemming of het bevel kan de centrale actor het beleid afdwingen. Zijn hiërarchische macht stelt hem in staat om de toekomstige status quo te veranderen. Namelijk, hij dreigt de tegenstanders met een sanctie, wanneer zij het beleid blokkeren (p.172 en verder). Een bijzonder geval doet zich voor, wanneer de staat hiërarchisch toeziet op onderhandelingen in netwerken of in het corporatisme (p.197 en verder). In de hiërarchie kan de optie van het bevel steeds als dreigement worden ingezet!
Namelijk, beschouw de figuur 5, waar twee private actoren onderhandelen over een beleids-toestand (p.199). De toestanden A en B zijn allebei maatschappelijk wenselijk, maar benadelen telkens een actor. Stel voorts, dat de staat via subsidies en wet- en regel-geving de status quo zodanig kan veranderen, dat beide actoren hierdoor schade oplopen (p.200 en verder). De staat kan hiermee dreigen om een overeenkomst af te dwingen. De BAZO van de private actoren verschuift dan van de status quo O naar, bijvoorbeeld, de toestand D. Gezien vanuit dit punt D is zowel het beleid A als B voordelig voor de twee private actoren! Een overeenkomst is nu waarschijnlijk. De twee private actoren komen tot zelf-regulering (p.202). Er is een synergie tussen onderhandelen en de hiërarchie, die ontstaat, omdat onderhandelen en het bevel allebei een mogelijke interactie van de hiërarchie zijn (p.205)21.
Scharpf heeft een voorkeur om de constellaties van actoren te modelleren met behulp van speltheorie22. De speltheorie is in staat om besluitvorming te modelleren en presenteren op een heldere wijze (p.45). De geïnteresseerde lezer kan her en der in de Gazet uitleg vinden van de speltheorie. Die zal niet worden herhaald in deze column. Spellen laten de beschikbare strategieën sk (doelstellingen) van de actoren zien, alsmede hun opbrengsten uk (p.99). Dat maakt het mogelijk om stabiele uitkomsten te vinden (p.7, 100). In de speltheorie wordt dit een Nash evenwicht genoemd. Het identificeren van evenwichten is belangrijk in de bestuurskunde, omdat besluitvorming instabiel kan zijn, met name bij stemmingen op basis van een meerderheid. Zie ook p.155 en verder in AP. Vaak kunnen de actoren een evenwicht bereiken door een gemengde strategie te hanteren. Scharpf meent evenwel dat in de practijk zo een strategie niet uitvoerbaar is (p.102)23.
oriëntatie | individualisme | solidariteit | ||
---|---|---|---|---|
A2 werkt samen | A2 buit uit | A2 werkt samen | A2 buit uit | |
A1 werkt samen | 1, 1 | -1, 2 | 2, 2 | 1, 1 |
A1 buit uit | 2, -1 | 0, 0 | 1, 1 | 0, 0 |
Enkele opvallende toepassingen van speltheorie in Games real actors play verdienen de aandacht. Veruit het bekendste spel, ook in de bestuurskunde, is het gevangenen spel (prisoner's dilemma) (p.75). Dit spel wordt hier nogmaals weergegeven, in de tabel 1. Het is goed geschikt om het voordeel van de collectieve moraal te illustreren. Stel de nutsfunctie van actor k wordt gegeven door uk = vk + β×vj (p.84 en verder in AP)24. In deze formule zijn vk en vj de nauwe eigenbelangen van de actoren k en j. Dankzij de kruisterm in uk weegt de actor k toch het nut van actor j mee in zijn keuzes. Dit wordt de interactie oriëntatie van k genoemd (p.84). Links in de tabel 1 zijn de beide actoren individualistisch (β=0). Het evenwicht is (0, 0) rechts onder. Helemaal rechts in de tabel 1 zijn zij solidair (β>0, hier β=1). Nu is het evenwicht (2, 2) links boven, en dat is een verbetering ten opzichte van (0, 0), zodat hier kennelijk een solidaire oriëntatie loont25.
In de bestuurskunde is het belang van de interactie oriëntatie omstreden. Sommige bestuurskundigen menen, dat in de publieke sector de morele oriëntatie doorslag gevend moet zijn voor het handelen. Zij hangen het communicatie (culturele, normatieve, constructivistische) perspectief aan. Scharpf meent echter, dat professionele (individuele en corporatieve) actoren zich rationeel gedragen, en hun emoties zullen beteugelen (p.87). Hij geeft wel toe, dat zelfs in een pluralistische maatschappij de collectieve normen gericht kunnen worden geconstrueerd (p.161 en verder). Maar zulke acties hebben gewoonlijk toch het heimelijke doel om een nauw groepsbelang te bevorderen (rente zoeken). Zonet is al opgemerkt, dat men niet kan ontsnappen aan de verdelings-conflicten (p.164).
afhankelijkheid | wederzijds | eenzijdig | ||
---|---|---|---|---|
A2 kiest p1 | A2 kiest p2 | A2 kiest p1 | A2 kiest p2 | |
A1 kiest p2 | 1, 1 | 2, 3 | 1, 2 | 2, 3 |
A1 kiest p1 | 3, 2 | 1, 1 | 3, 2 | 1, 2 |
Voorts kan de speltheorie afhankelijkheden modelleren. Dit wordt geïllustreerd in de tabel 2 (p.140-141 in AP). Stel er zijn twee actoren k (k=1, 2), die ieder hun eigen beleids-programma pk willen uitvoeren. Echter zij zijn afhankelijk van de hulp van de ander. De tabel 2 geeft links de uitkomsten bij wederzijdse afhankelijkheid26. Er zijn twee Nash evenwichten, te weten links onder en rechts boven, zodat ongewis is welk programma uiteindelijk wordt gekozen. Evenwel, stel nu dat de actor k=2 extra middelen krijgt, zodat hij ook op eigen kracht een redelijke uitkomst kan bereiken. Hij verbetert als het ware zijn BAZO of reserverings-nut27. Zie rechts in de tabel 2. Dit maakt actor k=2 onafhankelijk van k=1, omdat de keuze voor zijn eigen programma p2 de beste uitkomst geeft, ongeacht de strategie van actor 1. Er is een uniek evenwicht rechts boven.
Maar de speltheorie heeft ook zijn beperkingen. Bijvoorbeeld modelleert men soms het spel van een corporatieve actor. Maar die is in de practijk toch een collectief van groepen en individuen. Daarom moet men strikt genomen ook het spel binnen de organisatie van de corporatieve actor modelleren met een spel. Dit wordt een genest spel genoemd (p.32, 83 in AP). Voorts zijn er nogal wat spellen met vele actoren. Het verdient dan de voorkeur om de analyse te beperken tot de kleine groep van werkelijk doorslag gevende (machtige) actoren (p.79). Of men combineert diverse actoren tot één corporatieve actor, zoals een coalitie (p.80). De voorbeelden in Games real actors play zijn bijna allemaal dyades (met K=2).
Het actor-gerichte institutionalisme sluit goed aan bij de methode, waarmee de Gazet beleid probeert te analyseren. Daarom las uw columnist Games real actors play met voldoening. Er is echter geen reden voor euforie. Scharpf schrijft in zijn introductie (p.2): "Empiricists have not responded with great enthusiasm". En (p.6): "The reluctance of empirically oriented political scientists to use game-theoretic concepts seems to have two reasons. First, (...) much of the literature (...) is in fact practically inaccessible to the uninitiated. Moreover, empiricists (...) are generally repelled by the extreme unrealism of the assumptions". Echter, het actor-gerichte institutionalisme is nog jong, en uw columnist heeft vertrouwen, dat het allemaal wel goed komt.