De social choice theorie reikt modellen van besluitvorming aan, die relevant zijn voor de bestuurskunde. Immers het besluit is een onderdeel van de beleids-cyclus. Met name verdiept de social choice theorie zich in coalitie-vorming. Het coalitie-spel kan stabiele uitkomsten hebben, die behoren tot de kern. Het is denkbaar, dat de actoren in de coalitie nut kunnen overdragen. Vaak zullen de actoren stemmen ruilen (logrolling). De Shapley waarde is een manier om de moraal te integreren in de social choice theorie. Afsluitend zal de toepasbaarheid van de social choice theorie worden onderzocht.
Een voorgaande column beschreef vier beleidsmodellen in de bestuurskunde, die respectievelijk de rationaliteit, de politieke machtsstrijd, de maatschappelijke cultuur, en de instituties als uitgangspunt nemen1. Deze indeling is verhelderend, maar de benamingen wijken wat af van de conventies, die worden gebruikt in de Gazet. In het economische perspectief verwijzen de beleidsmodellen naar respectievelijk het plan, de macht, de communicatie, en de institutie. In dit rijtje valt de communicatie enigszins uit de toon, omdat zij eigenlijk meer een vaardigheid is dan een maatschappelijk fenomeen. Toch is zij essentieel voor het succes van beleid. Managers moeten kunnen overtuigen, motiveren, en bedreven zijn in propaganda. Een besluit wordt alleen uitgevoerd, wanneer het voldoende wordt gedragen door alle betrokkenen. De Gazet heeft tot nu toe meestal het effect van communicatie genegeerd2.
In de traditionele benadering van beleid (zeg, het plan-model en het macht-model) ontstaat een bepaald beleidsprogramma in reactie op een maatschappelijk probleem. Gewoonlijk neemt men aan, dat het beleid kan worden opgevat als een lineaire opeenvolging van fasen. Het besluit is slechts een deel van het geheel. Bovendien wordt beleid nooit afgesloten, want de omgeving is dynamisch. Er is een terugkoppeling vanuit de maatschappij, en men leert steeds bij. De lineaire keten verandert dan in een leercyclus, zoals het model van Kolb. Daarom krijgt de beleidscyclus de vorm van de figuur 1. Een bijzonder kenmerk van de beleids-cyclus is evenwel, dat het leerproces wordt doorkruist door conflicten tussen belangengroepen. Het denken in de cyclus van Kolb heeft dan twee componenten, te weten de politieke strijd over de beleids-agenda, en het ontwerp van het beleidsprogramma3.
Bijna alle modellen in de Gazet veronderstellen, dat de actor een homo economicus is. Deze neemt zijn besluiten zodanig, dat zijn nut of welzijn maximaal wordt gemaakt. Echter de bekende bestuurskundige Herbert Simon stelt, dat besluiten worden genomen met een begrensde rationaliteit. In de practijk is de maximalisatie van het nut simpelweg niet haalbaar. De homo economicus wordt bescheiden, en neemt genoegen met besluiten, die de risico's van verlies minimaliseren4. Zulke besluiten kunnen baseren op een logica van doelrealisatie, of op een logica van gepastheid (appropriateness)5. Gepastheid betekent, dat wordt voldaan aan de heersende normen en rolverwachtingen binnen de organisaties. Het bijbehorende mensbeeld is dat van de homo sociologicus. Men kan deze twee types van logica koppelen aan respectievelijk de Weberiaanse doel-rationaliteit en waarde-rationaliteit.
In de logica van de gepastheid wordt genoegen genomen met een bevredigende (satisficing) oplossing van het probleem. De context van het besluit wordt meegewogen. Vaak is een dergelijke oplossing incrementeel, omdat dan de groepsbelangen niet ernstig worden aangetast, en de risico's van een rampzalige mislukking gering zijn. Er wordt voortdurend geëvalueerd, en het beleid evolueert. Zie het institutie-model van beleid6. In dit kader is de aanpak van new public management (afgekort NPM) tweesnijdend. Enerzijds maakt publiek ondernemerschap een snel reageren op externe bedreigingen mogelijk. Anderzijds gaat innovatief ondernemerschap zelf natuurlijk gepaard met risico's. Decentralisatie van de besluitvorming is een manier om het maatschappelijke pluralisme beheersbaar te houden7. Deze visie krijgt bijvoorbeeld vorm in het vergaarbak (garbage can) model.
Decentralisatie impliceert, dat de ambitie van het centrale plan (plan-model) wordt opgegeven, of althans minder prioriteit krijgt. Er wordt meer ruimte gegeven aan de wedijver tussen belangengroepen. De agenda wordt bepaald door beleids-netwerken. Hier worden het macht-model en het communicatie-model van beleid toegepast. Economen en sociologen hebben de rationele keuzeleer aangedragen, met toepassingen gericht op maatschappelijke besluiten (social choice) en publiek beleid (public choice)8. De actoren (individuen en organisaties) streven primair hun eigen belang na. Alle betrokken groepen zijn rente zoekend. Modellen vertalen dat belang gewoonlijk in termen van inkomen. In beginsel kan men ook morele of psychische belangen meewegen, maar dat maakt de interpretatie van het model minder tastbaar. Aldus kan men de macht van burgers onderzoeken, of van politici, of zelfs van een coalitie van politici en uitvoerders (Leviathan model)9.
Als de staat kiest voor besluitvorming via het management van netwerken, dan spreekt men van public governance10. Er wordt gebruik gemaakt van partnerschappen, en van contractering11. De staat onderhandelt met de betrokken groepen, en sluit compromissen. De middelen van de betrokkenen worden gebundeld. Aldus wordt het besluit genomen door een coalitie van groepen. Binnen die coalitie wordt dus samengewerkt. Nochtans krijgt in een dergelijk netwerk ondernemerschap een meerwaarde12. De sturing van het beleid wordt polycentrisch13.
Beleidsvorming via netwerken is een poging om de effectiviteit en de efficiëntie van het beleid te vergroten. Echter zij kan ook worden bepleit op een morele grond, te weten dat zij de participatie van burgers bevordert, en daarmee de democratie versterkt. Wel dreigt het gevaar, dat daardoor de actieve burgers buitensporig veel macht krijgen. Dat zou de rechtszekerheid van de burgers aantasten. En de maatschappelijke baten zijn ongrijpbaar14. Het participatie-argument is vooral belangrijk in het communicatie-model, en ook wel in het institutie-model. Netwerken in het institutie-model kunnen de gedaante hebben van corporatisme. In het (neo-)corporatisme draagt de staat macht over aan sommige belangengroepen15.
De bestuurskunde besteedt aandacht aan de omstandigheden, waaronder beleid wordt geformuleerd. Dat omvat de procedures, de factoren die worden meegewogen, de randvoorwaarden, het moment van besluitvorming, en de gekozen instrumenten. Maar natuurlijk moet zich ook een coalitie van actoren vormen, die bereid zijn om eigenaar van het beleidsprobleem te worden, en te besluiten over de beste oplossing. De bestuurskunde doet relatief weinig onderzoek naar de factoren, die de samenstelling van deze coalitie bepalen. Dit vraagstuk is opgepakt door de social choice theorie.
De decision (besluitvormings-)theorie in de bestuurskunde besteedt weinig aandacht aan de opvattingen van de social choice theorie, die methodologisch verwant is met de economie. Uw columnist wil hier een poging doen om de lacune te vullen. Een column van drie jaren geleden hanteerde een ruiltheorie om besluiten te modelleren. Maar meestal maakt de social choice theorie bij beleids-problemen gebruik van speltheorie. Maar ook de bestuurskunde beschrijft soms de besluitvorming over beleid als een spel16. Iedere actor k in dit spel (met k = 1, ..., K) maakt een keuze uit zijn verzameling sj(k) van gedrags-strategieën (j = 1, ..., J(k)), toegesneden op de gegeven situatie. In beginsel kan het aantal strategieën J(k) van elke actor k oneindig groot zijn. Bovendien zou j een continue variabele kunnen zijn binnen het interval [1, J(k)]. De combinatie van strategieën leidt tot een beleids-besluit.
De actor k ontvangt dankzij het besluit baten met hoeveelheden xn(k) (n = 1, ..., N). Er zijn dus N soorten baten. Elke soort n kan materieel van aard zijn, maar ook immaterieel, bijvoorbeeld informatie of een goede reputatie. De actor k moet inschatten, wat de waarde van die baten is voor hemzelf. Aldus worden bijvoorbeeld geld en informatie tegen elkaar afgewogen. Dit lijkt vreemd, maar is mogelijk volgens het model van Fao en Fao17. Het besluit bepaalt de totaal beschikbare hoeveelheden xn van elke soort n, evenals hun verdeling Σk=1K xn(k) onder de actoren.
De afweging, die een actor maakt, baseert natuurlijk op diens voorkeuren. In de rationele keuzeleer worden de voorkeuren van de actor k weergegeven door de nutsfunctie uk(x(k)), waarbij de vector x(k) bestaat uit de elementen xn(k). Kennelijk is uiteindelijk de nutsvector u het criterium om een besluit te selecteren. Daarom bestudeert de social choice theorie primair de verdeling van nutten, en niet van baten18. Zonet is al opgemerkt, dat het besluit ontstaat ten gevolge van de strategieën sj(k), die de K actoren hanteren. Daarom bepaalt de verzameling van alle strategie-combinaties {sj1(1), ...., sjK(K)} (met jk=1, ..., J(k)), wat de verzameling U van nutsmogelijkheden u is. Ter illustratie toont de figuur 2 de buitengrens van zo een verzameling U voor K=3 19.
De figuur 2 veronderstelt, dat alle drie actoren deelnemen aan de besluitvorming over het beleid. Ieder draagt zijn hulpmiddelen aan voor de beleidsformulering. Maar behalve dat is er nog geen samenwerking en coördinatie tussen actoren. Elke actor maakt in isolement zijn nut maximaal, door middel van zijn strategie. Merk op, dat een groot aantal punten u binnen U in de practijk onwaarschijnlijk is. Bijvoorbeeld zullen in de figuur 2 de actoren 2 en 3 gewoonlijk geen strategie kiezen, die de actor 1 veel meer nut geeft dan zijzelf. Daarom zal het uiteindelijke besluit u* waarschijnlijk ergens in het midden op de buitenschil liggen. Alleen wanneer de actor 1 een groot machtsoverwicht heeft, kan hij zich alle baten toeëigenen. Hij heeft dan de actoren 2 en 3 nauwelijks nodig voor de beleidsformulering.
De huidige column behandelt echter de samenwerking tussen actoren. In haar simpelste vorm is dat een coalitie C door twee actoren. Zij kunnen baat hebben bij C, omdat zij daardoor hun strategieën kunnen coördineren, zodat een ander besluit mogelijk wordt dan zonder samenwerking. Bijvoorbeeld kan de coalitie C, bestaand uit C = {1, 2}, een besluit afdwingen, dat u*1 en u*2 vergroot. Dat gaat ten koste van actor 3, zodat diens u3 minder wordt. Actor 3, de verliezer, zal toch proberen om in de gegeven situatie zijn nut u3 maximaal te maken20. Ter illustratie van dit fenomeen toont de tabel 1 (afkomstig van de bestuurskundige P.C. Ordeshook) een spel met drie actoren, waarbij elke actor k beschikt over twee strategieën s1(k) en s2(k) 21. De beschikbare strategieën zijn dus niet continu, zoals in de figuur 2, maar discreet. De cellen tonen de nutten (u1, u2, u3) van elke strategie-combinatie. De tabel 1 vormt de grondslag voor een netwerk-analyse22.
s1(3) | s2(3) | |||
---|---|---|---|---|
s1(2) | s2(2) | s1(2) | s2(2) | |
s1(1) | 57, 50, 15 | 0, 60, 35 | 55, 20, 0 | 30, 30, 40 |
s2(1) | 70, 55, 30 | 0, 90, 60 | 50, 0, 80 | 20, 60, 70 |
De speltheorie duidt de tabel 1 aan als de normaal vorm van het spel. De uitkomst (30, 30, 40) ontstaat door de strategie-combinatie (s1(1), s2(2), s2(3)), en is het zogenaamde Nash evenwicht. Geen enkele actor {k} kan afzonderlijk een besluit nemen, dat hem een hogere uitkomst oplevert. Zijn eerste voorkeur (respectievelijk 70, 90, en 80 voor k = 1, 2 en 3) wordt geblokkeerd door de andere actoren. Evenmin is het voordelig voor een actor k om een coalitie {h, k} (met h, k in {1, 2, 3}) te vormen. Beschouw bijvoorbeeld de coalitie C = {1, 2}. Dankzij C kunnen de actoren 1 en 2 uitkomsten blokkeren, die gunstig zijn voor actor 3. De actor 3 behoudt natuurlijk wel zijn vrijheid van handelen sj(3). Hij moet nu in de onderhandelingen de coalitie ondermijnen door de twee actoren te dreigen met een afstraffing.
C kan kiezen uit vier strategieën sj(C) = (s1(1), s1(2)), (s2(1), s1(2)), (s1(1), s2(2)) en (s2(1), s2(2)), die met zekerheid respectievelijk μj = (u1, u2) = (55, 20), (50, 0), (0, 30) en (0, 60) opleveren. Merk op, dat dit de minimum uitkomsten zijn voor de coalitie, ongeacht de strategie sj(3) 23. Er bestaat evenwel een kans, dat de actor 3 een strategie kiest, die de uitkomst voor C doet uitstijgen boven het minimum. Het gedrag van de actor 3 onttrekt zich aan een exacte analyse. Nochtans zullen hierover in het vervolg toch enkele opmerkingen worden gemaakt.
Kennelijk hebben de actoren 1 en 2 nergens allebei baat bij μj. Het Nash evenwicht E = (30, 30) blijft aantrekkelijker. Des al niettemin kan de coalitie C toch de moeite waard zijn. Namelijk, zij kan met een vaste regelmaat wisselen van strategie sj(C). Aldus ontstaat er een gemengde strategie σ(C). Een voorbeeld van een gemengde strategie is
(1) σ(C) = p × s1(C) + (1 − p) × s4(C) = p × (s1(1), s1(2)) + (1 − p) × (s2(1), s2(2))
In de formule 1 is p een reëel getal in het interval [0, 1]. Merk op, dat in deze aanpak moet worden gekozen uit oneindig veel strategieën, net zoals in de figuur 2. De zekere uitkomsten bij de formule 1 zijn nu μ1,4 = (u1, u2) = p × μ1 + (1 − p) × μ4 = p × (55, 20) + (1 − p) × (0, 60). Men berekent eenvoudig, dat voor 6/11 < p < 3/4 de coalitie meer nut behaalt dan in het Nash evenwicht (30, 30). Natuurlijk zijn andere gemengde strategieën dan σ(C) ook mogelijk, maar die leveren minder op. Dit is zichtbaar in de figuur 3, waar de vier "zuivere" uitkomsten μj zijn ingetekend, alsmede de gemengde uitkomst μ1,4 (rode lijn).
Het voorgaande betoog geeft nieuwe inzichten in de besluitvorming over beleid. Het loont om deze aanpak te formuleren in algemene termen. De toepassing van wiskunde is daarvoor handig. Men spreekt van een spel in zijn karakteristieke vorm (K, V), wanneer er een verzameling van K actoren is, en een (wiskundige) regel V, die elke coalitie (deelverzameling) C uit K koppelt aan een verzameling V(C) van nutsmogelijkheden. De regel V(C) wordt de karakteristieke functie van C genoemd24. De figuur 3 toont ter illustratie een dergelijke verzameling V({1, 2}). Zij is in de figuur 3 geel gekleurd. De verzameling V({1, 2}) omvat niet enkel de rode buitengrens μ1,4 van de nutsmogelijkheden, maar ook alle punten met lagere waarden u1 en u2. Men kan de regel V ook toepassen op alle andere denkbare coalities ({1, 2, 3}, {2, 3}, {1} enzovoort), en vindt dan telkens een bijpassend geel gebied van nutsmogelijkheden.
Het is leerzaam om de figuren 2 en 3 nog eens te vergelijken. De rode contour in de figuur 2 toont alle mogelijkheden U = {u} bij afwezigheid van samenwerking. De figuur 2 suggereert, dat de actoren 1 en 2 baat kunnen hebben bij een besluit, dat het nut van actor 3 neerdrukt. Echter zonder samenwerking zal actor 3 zulke besluiten blokkeren via zijn strategie. De actoren 1 en 2 moeten onderling een coalitie C vormen om de keuzes van de actor 3 in te kunnen perken. Dan nog is onzeker, of de actoren 1 en 2 allebei zullen profiteren van de coalitie. In de figuur 3 lukt het wel, dankzij de gemengde strategie. De analyse onderzoekt dan niet U, maar de verzameling V(C) van zekere uitkomsten. Echter coalities in een spel zijn niet per definitie lonend. De actor 3 kan soms sj(3) zodanig kiezen, dat de verzameling V({1, 2}) ongunstig wordt. De 3 actoren moeten dan nagaan, of een andere coalitie wèl voordelig is25.
Net zoals men het Nash evenwicht van een spel wil kennen, heeft het ook zin om te zoeken naar stabiele nutsvectoren u binnen de verzameling U van nutsmogelijkheden. Immers, bij een stabiele uitkomst is het niet meer nodig om te onderhandelen, coalities te vormen, of de beleids-agenda te beïnvloeden. Geen enkele actor voelt nog de behoefte om te wisselen van strategie. De verzameling Γ van al deze stabiele nutsvectoren wordt de kern (in het Engels: core) van het spel genoemd26. Dit kan ook abstract worden geformuleerd. Namelijk, stel er is een spel met karakteristieke vorm (K, V), dan bestaat de kern Γ uit de vectoren u in V(K), die door geen enkele coalitie C worden geblokkeerd. Een coalitie zal een vector u blokkeren, zodra er een vector w in V(C) bestaat, die voldoet aan uk < wk, met k in C 27. In dat geval zegt men, dat w domineert over u 28.
Beschouw ter illustratie van deze definities weer het spel in de tabel 1. Zonder samenwerking kiezen de actoren voor (30, 30, 40). De veronderstelling is, dat de menging van strategieën niet is toegelaten voor de coalitie met K=3. Met andere woorden, stel dat de functie V, toegepast op de grand coalitie {1, 2, 3}, simpelweg deze tabel reproduceert29. Dan zal de coalitie {1, 2, 3} eveneens kiezen voor (30, 30, 40). Maar zonet is aangetoond, dat V({1, 2}) vectoren wk > 30 bevat voor k=1, 2. Daarom zal deze coalitie de uitkomst (30, 30, 40) blokkeren. De coalitie vermindert evenwel de uitkomst voor actor 3 naar w3 < 40. Daarom zal actor 3 niet meewerken, en is zijn strategie onbepaald. De vector w ligt zeker niet in V(K). Kennelijk is in dit geval de kern leeg. Vermeldens waard is, dat (30, 30, 40) wèl de kern vormt, wanneer de uitkomst bij de strategie-combinatie (s2(1), s2(2), s2(3)) in de tabel 1 wordt vervangen door u = (20, 10, 70) 30.
Deze illustratie toont aan, dat een spel zonder kern instabiel is. De component 3 van de vector w is onbepaald. Het spel van de tabel 1 geeft hiervan een interessante illustratie31. Stel de nutswaarde u3 blijft geldig, ook wanneer de coalitie C = {1, 2} wordt gevormd en de gemengde strategie van de formule 1 hanteert. Dan is het rationeel voor de actor 3 om te kiezen voor s1(3). Echter, daardoor krijgt de actor 1 een voorkeur voor de zuivere strategie s2(C) = (s2(1), s1(2)). En de actor 2 wil daardoor juist de zuivere strategie s3(C) = (s2(1), s2(2)). Vervolgens zal de actor 3 wegens de nieuwe keuze s2(1) van mening veranderen, en de voorkeur krijgen voor de strategie s2(3). Enzovoort. In de practijk betekent dit, dat de 3 actoren voortdurend aan het onderhandelen zijn32.
Helaas zijn ook spellen mèt een kern soms niet volledig bepaald. In sommige spellen is de kern bereikbaar door middel van diverse, onderling verschillende, coalities. Daarom is, ondanks het bestaan van de kern, niet voorspelbaar welke coalitie zal worden gevormd. Slechts de uitkomsten u zijn vooraf berekenbaar. Bestuurskundigen vinden dit een ernstig gebrek van dit soort speltheorieën, omdat in de practijk gewoonlijk enkel de coalities zichtbaar zijn33. De uitkomsten zijn juist slecht meetbaar. Bijvoorbeeld hebben concessies en aangegane verplichtingen soms pas gevolgen op de lange termijn.
β1= −,−,− | β2= +,−,− | β3= −,+,− | β4= −,−,+ | β5= +,+,− | β6= +,−,+ | β7= −,+,+ | β8= +,+,+ | |
---|---|---|---|---|---|---|---|---|
actor 1 | 0 | 5 | 1 | -2 | 6 | 3 | -1 | 4 |
actor 2 | 0 | 6 | -2 | -1 | 4 | 5 | -4 | 3 |
actor 3 | 0 | -2 | 4 | 1 | 2 | -1 | 5 | 3 |
Ter illustratie toont de tabel 2 de nutswaarden u van K=3 actoren, die moeten stemmen over 3 beleids-voorstellen34. Dit is het spel in zijn normaal vorm. Een bestuurskundige wil weten welke coalitie wordt gevormd, en welk beleid wordt gekozen. Zowel de coalitie als het beleid worden bepaald in onderhandelingen35. Er zijn 8 mogelijke uitslagen βn (n = 1, ..., 8) van de stemming. Elke βn geeft aan welke voorstellen zijn aangenomen (+) of afgewezen (−). Uiteraard wint een coalitie van 2 actoren altijd de stemming36. De coalitie {1, 2} heeft als Pareto optimale uitslagen β2 en β5. Bij {1, 3} zijn dat β3, β5 en β8, en bij {2, 3} zijn het β2, β5, β6 en β8. Kennelijk is alleen β5 Pareto optimaal voor alle coalities. De bijbehorende uitkomst u = (6, 4, 2) wordt niet gedomineerd door enigerlei vector. Kennelijk vormt deze u de kern Γ. In deze situatie wordt de vraag van de bestuurskundige niet geheel beantwoord, omdat de kern kan worden bereikt via verschillende coalities.
Voorts moet worden opgemerkt, dat het fenomeen van de kern slechts beperkt experimenteel wordt bevestigd. Ordeshook noemt een laboratorium onderzoek met proefpersonen, waarin slechts 47% van de experimenten leidde tot de kern als resultaat van de onderhandelingen37. In het betreffende onderzoek was de oorzaak, dat elke actor k vooral probeerde om de uitslag met zijn hoogste uk aangenomen te krijgen (in tabel 2: β5 voor actor 1, β2 voor actor 2, en β7 voor actor 3). Aldus slaagt men er niet in om de kern te bereiken. Ordeshook noemt deze strategie een heuristiek. Het doel van de heuristiek is om de transactie-kosten begrensd te houden. Natuurlijk mag men hopen, dat bij werkelijk belangrijke voorstellen de actoren rationeler zullen handelen. Des al niettemin concludeert Ordeshook, dat instituties zoals stem-procedures, agenda's en commissies veel invloed kunnen hebben op de uitslag en dus op het beleid38.
Zonet is al opgemerkt, dat elke actor een inschatting moet maken van het nut van bepaalde beleids-besluiten. In beginsel kan de individuele nutsfunctie uk(x) van actor k elke vorm aannemen. Hierin verwijst de vector x naar de hoeveelheden xn(k) van het goed n, waarover k beschikt. Echter, omwille van het inzicht is het handig om uit te gaan van een simpele vorm. In de speltheorie is de vorm met overdraagbaar nut populair:
(2) uk(x1(k), x2(k), ..., xN(k)) = x1(k) + ωk(x2(k), ..., xN(k))
In de formule 2 is ωk een nutsfunctie, waarin x1(k) niet meer voorkomt. Kennelijk verandert het nut uk lineair met x1(k). De functie is quasi-lineair. Dit heeft het voordeel, dat de verzameling van nutsmogelijkheden een eenvoudige gedaante aanneemt39. Namelijk, sommeer de formule 2 over alle K:
(3) Σk=1K uk(x(k)) = x1 + ΣK=1K ωk(x2(k), ..., xN(k))
Aangezien men enkel gelijksoortige grootheden kan optellen, veronderstelt de formule 2 een cardinaal nut. De formules 2 en 3 impliceren, dat de actoren onderling nutseenheden kunnen uitwisselen, simpelweg door een eenheid van het goed n=1 over te dragen. Daarom spreekt men van een overdraagbaar (transferable) nut. Het goed n=1 wordt wel de numéraire genoemd, als drager van het nut.
In het rechterlid van de formule 3 komt x1(k) niet meer expliciet voor. Het kan worden opgevat als een constante X, wanneer men uitsluitend is geïnteresseerd in de variatie van u ten gevolge van de verdeling van x1. Nu is de vergelijking ΣK=1K uk = X een hypervlak in de K-dimensionale u ruimte, met als normaal de vector η = (1, 1, ..., 1) 40. Dit geldt met name ook voor de buitengrens van de verzameling U van nutsmogelijkheden. Dan kan de karakteristieke functie V van C (met c deelnemers) worden voorgesteld door de wiskundige uitdrukking:
(4) V(C) = {u in Rc: Σk in C  uk ≤ ν(C)}
In de formule 4 wordt ν(C) de waarde van de coalitie genoemd41. Dit toont het voordeel van de aanname van overdraagbaar nut: de functie V, die een nutsruimte genereert, wordt vervangen door de functie ν(C), die een waarde genereert. Het spel in zijn karakteristieke vorm is dan (K, ν). En de kern Γ is nu simpelweg de verzameling van vectoren u met Σk in C uk ≥ ν(C) voor alle C 42. Het ruilgoed n=1 onderscheidt zich natuurlijk duidelijk van de andere baten n = 2, ..., N, die complexer inwerken op het nut. Gewoonlijk wordt n=1 opgevat als geld. Dat wil zeggen, de K actoren kunnen elkaar met betalingen compenseren voor de eventuele immateriële concessies, die worden gedaan tijdens de onderhandelingen over het beleids-besluit43.
De situatie in het spel verandert, wanneer het nut overdraagbaar is. Immers, dan kunnen de actoren elkaar schadeloos stellen voor ongunstige stemuitslagen, door middel van een betaling met het numéraire goed (n=1)44. Bijvoorbeeld, beschouw de tabel 2, nu met de veronderstelling van overdraagbaar nut. De coalitie {1, 2} zou dan de voorkeur krijgen voor de uitslag β2, waarbij de actor 2 een hoeveelheid x1 met waarde in het interval [1, 2] uitkeert aan de actor 1. Men kan zich afvragen, of zulke transacties realistisch zijn. Ordeshook vindt het vreemd, wanneer het beleid mede wordt bepaald door wederzijdse betalingen tussen de actoren45. Als de actoren politici zijn, dan vindt Ordeshook dit een graft (gekonkel), en dus bedenkelijk. Dat moge kloppen voor politici. Maar als het gaat over actoren in een beleidsnetwerk, dan kunnen wederzijdse betalingen acceptabel zijn.
Natuurlijk zou compensatie immaterieel kunnen zijn. Men zou bijvoorbeeld kunnen veronderstellen, dat de actoren bestaan uit politici, die elkaar electorale gunsten beloven. Maar dan is de quasi-lineaire aanname dubieus. In sommige gevallen is de toepassing denkbaar, bijvoorbeeld wanneer een coalitie de minister-posten in een kabinet verdeelt46. Dan is x1 het aantal posten. De verdienste van modellen met overdraagbaar nut zit dus meer in de theoretisch begrijpelijkheid dan in het realiteitsgehalte47.
Als een spel een kern heeft, dan zullen de actoren gewoonlijk daarin hun besluit kiezen. Immers, geen enkele actor kan zijn uitkomst verbeteren door dat besluit te blokkeren. Deze keuze heeft dus de billijkheid van het onvermijdelijke. Echter er zijn ook andere criteria voorgesteld om een besluit billijk te noemen. Zulke claims van billijkheid zijn natuurlijk normatief. Zij illustreren de institutionele aanpak van beleidsvorming, die de rationaliteit en de macht relativeert. Misschien wel het bekendste voorstel voor een billijk besluit is gedaan door L. Shapley. De uitkomst zou de Shapley waarde ζ moeten zijn (dus feitelijk een vector). De Shapley waarde is vooral interessant onder de aanname van een overdraagbaar nut, en daarom is dat het startpunt van deze paragraaf48. Shapley doet een voorstel voor de verdeling binnen de coalitie C, maar wil niet ingrijpen in de status quo (nutsmogelijkheden, beschikbare strategieën en dergelijke)49.
Shapley leidt zijn billijke waarde af uit vier eigenschappen. Dit wordt de axiomatische aanpak genoemd. Zij zijn efficiëntie (Σk in C ζk = ν(C)), symmetrie (de uitkomst voor actor k wijzigt niet door permutaties van actoren), lineariteit in ν(C), en het dummy axioma (ζk=0 voor een actor k, die zelf geen waarde toevoegt)50. Deze axioma's zijn minder vanzelfsprekend dan bijvoorbeeld die in het onderhandelingsmodel van Nash51. Uit deze vier axioma's leidt Shapley af, dat de Shapley waarde wordt gegeven door:52
(5) ζk(K, ν) = ΣC in K ((K − c)! × (c − 1)! / K!) × (ν(C) − ν(C\{k}))
In de formule 5 is k een element in de verzameling C, die in totaal c actoren omvat. De schrijfwijze C\{k} representeert de verzameling, die men krijgt door k uit C te verwijderen. Het k! teken representeert de wiskundige faculteit k × (k-1) × ... × 1. Men definieert 0!=1. De term ν(C) − ν(C\{k}) drukt de waarde uit, die de actor k toevoegt door toe te treden tot de coalitie. Dit is als het ware de marginale bijdrage van k aan C. De faculteiten zijn een weegfactor overeenkomstig het aantal manieren (via permutaties) om die C te vormen. Aldus is ζk in de formule 5 een gemiddelde van alle marginale bijdragen van k.
De Shapley waarde kan worden verhelderd met het volgende spel, voor K=3 53. De actoren 1 en 2 zijn uitvoerders (U) van beleid, en de actor 3 is een ontwerper (O) van beleid. Blijkens de figuur 1 moet een ontwerp worden gevolgd door uitvoering, zodat alleen de combinatie {O, U} enige waarde heeft, zeg 1. Stel dat het beleid slechts één uitvoerder vereist. Aldus vindt men de waarden ν({k}) = ν({1, 2}) = 0, en ν({1, 3}) = ν({2, 3}) = ν({1, 2, 3}) = 1. Dankzij de formule 5 kan men de Shapley waarde berekenen, te weten ζ = (1/6, 1/6, 2/3). Merk op, dat de actor 3 een monopolist is, die de actoren 1 en 2 tegen elkaar kan uitspelen54. Daarom bestaat de kern van het spel uit Γ = {(0, 0, 1)}. Kennelijk zit ζ hier niet in de kern. Hij is in zoverre billijk, dat hij de krasse ongelijkheid van Γ enigszins nivelleert.
In het parlementaire systeem vormen partijen een coalitie, die de regering steunt. Het regeringsprogramma bestaat uit compromissen tussen de partijen over de belangrijkste thema's. Dit kan worden opgevat als een stemmenruil, waarbij men elkaar wat gunt. In dat geval stemmen de partijen in de kamerzittingen over de thema's niet volgens hun werkelijke voorkeur. De stemmenruil is ook nuttig, wanneer er geen collectief programma is, en de parlementariërs in isolement hun stemgedrag bepalen. Elke politicus wil dan namelijk besluiten bevorderen, die gunstig zijn voor diens achterban. Ook in deze situatie maken de politici onderling afspraken om hun stemgedrag te coördineren. Ze gaan tijdelijke coalities aan. Dit heet in de Engelse taal log-rolling, of vote trading. Een andere denkbare toepassing van stemmenruil is de beleidsvorming in een beleidsnetwerk, dat besluit via een stemming.
β1= −,− | β2= +,− | β3= −,+ | β4= +,+ | |
---|---|---|---|---|
actor 1 | 0 | -2 | -2 | -4 |
actor 2 | 0 | 5 | -2 | 3 |
actor 3 | 0 | -2 | 5 | 3 |
Ter illustratie toont de tabel 3 de nutswaarden u van K=3 actoren, die moeten stemmen over 2 beleids-voorstellen55. De interpretatie van de tabel is, dat een voorstel een nut van 7 oplevert aan telkens één actor, terwijl de kosten van 6 gelijk worden omgeslagen over de 3 actoren (dus u=-2). Elke actor verdedigt een minderheidsbelang (anders zou de coalitie onnodig zijn). De actor is rente zoekend, waarbij hij de kosten van zijn voorkeur afwentelt op de meerderheid56. Wanneer de actoren stemmen volgens hun voorkeur, dan worden de beide voorstellen verworpen, zodat de uitslag β1 is. Echter, de uitslag β4 is beter voor de actoren 2 en 3. Daarom loont het voor deze actoren om een stem-coalitie aan te gaan, waarin zij niet meer hun eigen voorkeur volgen. Dit is een ruil van stemmen, die zinvol is dankzij de intense voorkeur van de actoren 2 en 3 voor, respectievelijk, het eerste en tweede beleids-voorstel.
De ruil is zelfs maatschappelijk wenselijk. Stel bijvoorbeeld, dat de maatschappelijke welvaartsfunctie wordt gegeven door W(u) = Σk=13 uk. Dan vergroot de uitslag β4 de welvaart, meer dan β1, β2 of β3 57. Helaas kan logrolling ook leiden tot onwenselijk beleid58. Immers, stel dat in de tabel 3 elk voorstel een nut van 5 geeft aan de begunstigde actor (en niet 7). Dat wil zeggen, u2=3 bij uitslag β2 enzovoort. Dan is W = -1, -1 en -2 voor respectievelijk β2, β3 en β4. Per saldo zijn de maatschappelijke kosten groter dan de baten. Het voorstel maakt de staatsquote nodeloos groot, omdat het eigenlijk zou moeten worden verworpen. Kennelijk laat de andere actor in de coalitie zich misleiden door het hoge nut (5), in verhouding tot de lage kosten (-2) per actor59. Men kan slechts hopen, dat de wedijver in de onderhandeling tussen de actoren hen scherp houdt, en dit gevaar tempert.
Merk voorts op, dat althans theoretisch situaties met stemmenruil nooit stabiel zijn60. Dit blijkt uit de tabel 3, en wordt geïllustreerd in de figuur 4. Eerst besluiten de actoren 2 en 3 tot een coalitie om β4 te realiseren. Maar de actor 1 zal dit tegengaan door een aantrekkelijkere coalitie aan te bieden, zeg {1, 2} met uitslag β2. Maar vervolgens zal de actor 3 het aanbod {1, 3} doen aan de actor 1, met uitslag β1. En in die situatie wordt uiteraard weer de coalitie {2, 3} aantrekkelijk. Een dergelijke volgorde noemt men een stem-cyclus61. Dit kan worden getemperd, wanneer de actoren vooruit zien. Bijvoorbeeld kan de actor 2 het aanbod van actor 1 verwerpen, en vasthouden aan de uitslag β4.
Een instabiliteit ontstaat ook, wanneer niet de bundel van voorstellen ineens in stemming wordt gebracht, maar elk voorstel afzonderlijk. Dan is er de verleiding om de stem-afspraak niet na te komen. De actor stemt voor zijn eigen voorstel, maar tegen het andere. Toch blijkt in de parlementaire practijk de besluitvorming redelijk stabiel te zijn. Dankzij de langdurige relatie hebben de parlements-leden vertrouwen opgebouwd. Zij beseffen, dat zij de ander ook in de toekomst nodig hebben62.
Allereerst moet worden benadrukt, dat het nutsbegrip essentieel is voor de gepresenteerde social choice theorie. Men kan alleen besluiten, wanneer er voorkeuren zijn. Maar nut is een ongrijpbare en dynamische variabele. Naarmate een actor beschikt over meer middelen, valt er meer te ruilen, en daarmee neemt de verzameling van nutsmogelijkheden van de andere actoren toe. Een actor kan nut ontlenen aan immateriële variabelen, zoals status, vertrouwen, kennis, of zelfs een ideologie. En de inspanning, die nodig is om het goed te verwerven, doet diens nut weer afnemen. Als men rekening zou houden met al deze factoren, dan zou de social choice theorie universeel toepasbaar worden. Maar een dergelijke berekening is natuurlijk onmogelijk. Daarom kan men enkel realistische resultaten verwachten van de social choice theorie, indien er een dominante oorzaak van nut is. Vaak komt dat nut van materiële zaken, zoals geld.
Voorts maken de zonet beschouwde modellen aannames, die omstreden zijn. De actoren moeten beschikken over volledige informatie. Bovendien is in de voorgaande paragrafen gewoonlijk verondersteld, dat de actoren in een coalitie hun afspraken nakomen. De afdwinging van het "contract" zou vanzelf gaan. In realiteit is dat natuurlijk allemaal onjuist, en kan informatie worden gebruikt als een bron van macht. De Gazet heeft dit thema al vaak behandeld, meestal in de vorm van het beslisser-uitvoerder probleem (principal-agent). Overigens reikt de public choice theorie hiervoor oplossingen aan. In specifieke situaties zoekt men naar self-enforcing contracten. In coproductie van beleid moet men het eigendom van de verschillende middelen en taken slim verdelen over het netwerk63.
Het loont de moeite om de social choice theorie te integreren in de decision theorie van de bestuurskunde. Zij kunnen elkaars zwakten compenseren. De huidige paragraaf wil deze mogelijkheid inventariseren.
De social choice theorie hanteert een beperkt aantal standaard modellen met een brede toepasbaarheid, zoals de theorie van het rente zoeken. Methodologisch bouwt zij voort op twee beproefde en solide benaderingen, te weten de speltheorie en de theorie van de maatschappelijke ruil64. De social choice theorie beschrijft de strategieën, die de diverse actoren hanteren in hun beleidsnetwerk. Hun motivatie wordt duidelijk gedefinieerd, namelijk als een (verlicht) eigenbelang. De vorming van coalities kan zelfs worden gemodelleerd in complexe situaties, zoals bij besluiten over bundels van beleidsvoornemens (package deal). Hierbij worden compromissen gesloten, waardoor de actoren bij sommige voornemens kiezen tegen hun eigenbelang in. Ook kan men situaties beschrijven, waarin de actoren elkaar compenseren voor ongunstige besluiten. En tenslotte krijgen de moraal en de instituties een plaats dankzij de spelregels en vondsten zoals de Shapley waarde65.
Het primaat van het eigenbelang past goed bij maatschappijen, bestaande uit goed geschoolde burgers, die het individualisme omarmen. De machtsverdeling vindt zijn weerslag in de onaantastbare spelregels. Een eerdere column beschreef al het voorstel van Buchanan en Tullock om collectieve rechten extern op te leggen, in de grondwet. Volgens de social choice theorie is binnen deze wettelijke kaders de beleidsformulering in beginsel doelloos66. Enkel de nutten tellen, en garanderen aldus het draagvlak van het beleid. De theorie is dus deductief, en juist dat maakt haar zo toepasbaar. Men name tonen spellen zonder kern de essentie van bestuurskundige begrippen zoals doormodderen en het vergaarbak beleid. De normaal vorm in de speltheorie is dan een geschikt instrument voor de analyse van het beleidsnetwerk.
De aanname, dat het gedrag van actoren wordt bepaald door hun nut, is een krachtige abstractie. Maar zij werkt ook verhullend. Immers, allerlei factoren dragen bij aan het nut, en veel van deze bijdragen zijn lastig meetbaar. Ten eerste wordt het nut van een actor mede bepaald diens moraal en door de maatschappelijke spelregels. De social choice theorie neemt aan, dat de spelregels vooraf zijn gegeven. Dien ten gevolge zijn de instituties en de maatschappelijke moraal een exogene factor in de modellen. De moraal en instituties worden enkel zichtbaar in het nut van de actor, voor zover zij hem een gevoel van voldoening of ongenoegen geven. Dat reduceert de moraal tot een voorkeur. Anderzijds heeft dit het voordeel, dat de social choice theorie ideologisch neutraal is. Ook de instrumenten voor de uitvoering van het beleid blijven onbepaald. Zij zijn spelregels en dragen bij aan de nutswaarden van actoren, in de vorm van middelen en hulpbronnen.
De actor kan de kosten en baten van een besluit enkel afwegen, wanneer hij rationele verwachtingen kan koesteren. Daarom moeten de diverse waarschijnlijkheden bekend zijn. In de realiteit is dit vaak niet het geval, omdat het beleid altijd onbedoelde bijwerkingen heeft67. Voorts hebben de compromissen in het besluit soms tot gevolg, dat de beleidsdoelen vaag zijn geformuleerd. Het beleid krijgt dan pas vorm tijdens de uitvoering68. Denk ook aan het vergaarbak model. Beleids-netwerken proberen deze onzekerheden te verminderen door informatie te delen met elkaar.
De speltheorie en de maatschappelijke ruiltheorie doen weinig onderzoek naar de specifieke aard van de machtsmiddelen, die worden ingezet door de actoren69. De strijd om de beheersing van de agenda blijft onbesproken. Wel onderzoekt de social choice theorie de diverse institutionele vormen van beleids-agenda's70. De social choice theorie verdiept zich nauwelijks in de manier, waarop netwerken worden gecoördineerd, afgezien van de spelregels71. Ook heeft zij weinig te vertellen over de invloed van communicatie op het beleid. En tenslotte, begrensd rationeel gedrag, zoals heuristieken en rollen, past eigenlijk slecht bij het actor model van de homo economicus. Er moet dan worden verondersteld, dat wordt gekozen voor de heuristiek of rol, omdat zij lagere transactie-kosten hebben dan rationeel gedrag.
De huidige column heeft duidelijk gemaakt, dat de social choice modellen niet in staat zijn om de realiteit accuraat te beschrijven. Dat is zelfs nooit de bedoeling geweest. Zij willen enkel meer inzicht geven in de algemene processen, die ten grondslag liggen aan de beleidsvorming. Als actor-model wordt de homo economicus gebruikt. Dit model heeft zijn waarde bewezen in de economie, sociologie en maatschappelijke psychologie. Overigens wordt gewoonlijk het model van de homo economicus zodanig toegepast, dat hij handelt binnen de kaders van de instituties.
Anderzijds kiest de bestuurskunde nog vaak voor verhalende modellen, ook in de decision theorie. Men kan dan alle factoren inventariseren, die relevant zijn voor het beleid. Maar deze aanpak heeft ook nadelen. De analist dreigt vast te lopen in een moeras van details. En de onderzoekers missen het houvast van beproefde standaard-modellen. Elke onderzoeker ontwikkelt zijn eigen model, waardoor het debat over de waarheidsvinding fragmenteert. Dat vergroot de kans, dat wetenschappers bezwijken voor de verleiding om een moraal of ideologie uit te dragen. Het nutsbegrip van de social choice theorie werkt hier als een remedie, omdat het vaak de zwakke zijden van zulke doctrines kan aanwijzen.