Speltheorie in de bestuurskunde (5)

Plaatsing in Heterodoxe Gazet Sam de Wolff: 3 april 2020

E.A. Bakkum is blogger voor het Sociaal Consultatiekantoor. Hij denkt graag na over de arbeiders beweging.

Opnieuw wordt er gezocht naar een vruchtbare integratie van bestuurkunde en speltheorie. De speltheorie is wegens haar abstractie en rationaliteit slechts beperkt practisch toepasbaar. Bestuurlijke evenwichten ontstaan dankzij advocacy coalities, maar zijn punctuated. Zelf-organisatie biedt kansen op consensus en een groeps-identiteit. Maar toch moet bijna altijd de staat ingrijpen, als derde partij. De speltheorie kan interventies modelleren. Het publieke goed met n actoren wordt nogmaals gemodelleerd. Het clubgoed wordt geïllustreerd met het afstands-gebaseerde nutsmodel.


Bestuurskunde en speltheorie

Het boek Gestion et théorie des jeux (afgekort GJ) lijkt ideaal te passen bij deze column1. Het doet verslag van een gedachtenwisseling tussen de bestuurskundige P. Romelaer en de speltheoretica G. Umbhauer. Ze richten hun analyse met name op de spelregels, het verloop in de tijd, en leerprocessen. Helaas valt het resultaat wat tegen, want het lukt de beide wetenschappers niet om een gedeelde taal te vinden. Romelaer geeft een uitleg over bestuurskunde, en Umbhauer gebruikt enkele trefwoorden uit dat betoog om haar eigen speltheoretische modellen te presenteren.

Romelaer benadrukt, dat spellen binnen een organisatie altijd genest (ingebed) zijn (p.58 in GJ). Elk van de interne coalities probeert haar eigen doelen en belangen te bevorderen (p.59). De interacties zijn dynamisch, omdat macht een belangrijke rol speelt (p.59, 82). De regels brengen enige stabiliteit in de organisatie (p.71). Het regel-systeem is uiterst complex door het aantal en de diversiteit van de regels (p.75). Het geheel moet coherent zijn (p.82, 184). Op het hogere niveau staan de spelregels zelf ter discussie (p.61). Zelfs de voorkeuren van actoren zijn veranderlijk (p.64). De factor tijd uit zich in de langzame rijping van nieuwe doelen en strategieën (p.122 en verder, 174, 180). Organisaties moeten collectief leren (p.174). Het leerproces is momenteel nog slecht begrepen (p.175 en verder). Vermoedelijk verloopt het schoks-gewijze (p.177). Zulke schokken zijn lastig voorspelbaar (p.179, 182).

Men ziet dat Romelaer vooral de complexiteit benadrukt, en weinig pogingen tot abstractie doet. Umbhauer heeft niet echt een weerwoord op het betoog van Romelaer. Ze wijst er op, dat het Nash evenwicht past bij de menselijke hang naar stabiliteit (p.193). Ze benadrukt, dat in de speltheorie de actoren zich rationeel gedragen. Daardoor kunnen zij de mogelijke strategieën en reacties van de andere actoren voorzien (p.205). Zij hebben hun eigen strategie al helemaal doordacht, voordat de interacties beginnen ("virtueel" leren door reflecteren) (p.206). De tabel 1 geeft een verrassend voorbeeld. De beide actoren spelen dit spel twee maal, en moeten daarbij hun strategie bepalen. Zij willen absoluut de combinaties (s1, s2) en (s2, s1) vermijden. Na de eerste ronde kunnen de beide actoren hun uitkomsten zien.

Tabel 1: uitkomsten van het Ponssard spel
  actor 2
  s1s2
actor 1  s1    (3, 1)    (0, 0)  
  s2    (0, 0)    (1, 3)  

Stel dat de actor 2 inventiever is dan de actor 1. Hij verwacht, dat in de eerste ronde de actor 1 zal kiezen voor s1, vanwege de mogelijke uitkomst u=3. Daarom besluit de actor 2 zelf te kiezen voor s1. Daarmee beloont hij de actor 1. Zelf krijgt hij in de eerste ronde maar u = 1. Echter, de actor 1 weet, dat de actor 2 een egoïst is. Dien ten gevolge moet de actor 1 wel aannemen, dat actor 2 ook u = 3 wil ontvangen. Daarom verwacht de actor 1, dat actor 2 in de tweede ronde kiest voor de strategie s2. Dit dwingt de actor 1 om ook te kiezen voor s2. Dankzij het doordenken heeft uiteindelijk ieder van de actoren een totaal nut u = 1+3 = 4 verworven. Merk op, dat deze goede uitkomst is te danken aan de heterogeniteit van de actoren, waarbij de actor 2 doortrapt handelt. Zijn strategie in de eerste ronde is een signaal, dat in de tweede ronde een focaal punt (meest logische keuze) schept voor de actor 1 2.

Leerspel in extensieve vorm
Figuur 1: Leerspel in extensieve vorm

Vermeldens waard is ook de manier, waarop Umbhauer leerprocessen weergeeft (p.217-219). Hierbij spelen twee factoren een rol, te weten de wijziging van een actor-strategie, en de reactie-tijd van de andere actoren. Een strategie kan wijzigen, doordat een actor experimenteert, zich vergist, of wordt vervangen door een ander. Umbhauer beschouwt een organisatie van drie actoren, zoals is weergegeven in de figuur 1. De uitkomsten (u1, u2, u3) worden getoond in extensieve vorm. Elk van de drie actoren beschikt over twee strategieën, te weten n en j. De actor 1 handelt als eerste, daarna de actor 2, en tenslotte de actor 3. Stel dat de actor 1 kiest voor de strategie n. De figuur 1 laat zien, dat dan de uitkomsten onafhankelijk zijn van de strategieën van actoren 2 en 3. Zij hebben wel een voorkeur, maar die blijft onzichtbaar, en wordt daarom latent genoemd (p.219, 224). Stel dat ook zij kiezen voor de strategie n.

Stel vervolgens dat de strategie van de actor 1 muteert naar j. Daardoor krijgen de latente strategieën van de actoren 2 en 3 plotseling relevantie. De uitkomst verandert van (1, 1, 1) in (0, 4, 0). Hierdoor worden de actoren 1 en 3 benadeeld, en dat start een leerproces bij hen. Stel dat de actor 3 het snelst reageert. Hij wijzigt zijn strategie naar j, en krijgt daardoor u3=2. Dit benadeelt de actor 2, die nu ook wordt geprikkeld tot leren. Als in deze situatie (j, n, j) de actor 1 sneller reageert dan 2, dan zal hij weer overgaan op strategie n, waarmee de begin-toestand is hersteld. Als anderzijds de actor 2 sneller reageert, dan kiest hij strategie j, waarmee het maatschappelijke optimum (2, 2, 2) wordt bereikt. Merk op, dat in dit optimum de voorkeur van actor 3 weer latent wordt.

Romelaer heeft enige algemene kritiek op de speltheorie van Umbhauer, althans wanneer die wordt toegepast in de bestuurskunde. Hij meent, dat groepen of organisaties zelden bewust de strategieën van concurrenten door-rekenen (p.226). En hij vindt, dat de speltheorie onvoldoende rekening houdt met omgevings-factoren (p.225). Hij vindt het bedenkelijk, dat de speltheorie nauwelijks gedragingen in de practijk kan voorspellen (p.226). Hij verwijt Umbhauer, dat ze weinig zegt over coalitie-modellen in de coöperatieve speltheorie (p.229)3. En organisaties bevinden zich nooit echt in een (Nash) evenwicht (p.230). Hij zou willen, dat de speltheorie de werkelijkheid stiliseert. Per saldo slaagt het boek niet in de verzoening van de bestuurskunde en de speltheorie4.


Modellen van beleids-analyse

Het boek Collective action and exchange (afgekort AE) van de econoom W.D. Ferguson geeft een beknopt maar interessant overzicht van enkele modellen van beleids-analyse5. Hij volgt de institutionele analyse van Elinor Ostrom (IAO). De actie arena heeft zeven soorten regels: van positie, toetreding (boundary), gezag, aggregatie, informatie, uitkomst, en armslag (scope) (p.296-297 in AE). Immers, de toetreding tot posities P moet worden geregeld. Het gezag verwijst naar de verdeling van macht R over de posities P. Aggregatie bepaalt de interferentie tussen de diverse actor-strategieën S. Volgens de bestuurskundige Scharpf bestaan de typen van aggregatie uit unilateralisme, onderhandelen, stemmen of bevelen6. De armslag definieert de mogelijke bereiken van materiële resultaten Q van de interacties. Soms is Q lastig meetbaar. De uitkomsten worden uitgedrukt als het netto actor-nut U. Merk op dat U = U(Q).

De zeven categorieën van regels zijn horizontaal (p.319). Maar de IAO brengt ook verticale lagen aan (p.293-295). Er is een hiërarchie van actie situaties, zodat elke actie situatie is genest of ingebed. Het hoogst in de hiërarchie is de meta-constitutie, gevolgd door de constitutie, de collectieve keuze, en de uitvoering. De meta-constitutie is het geheel van collectieve geschiedenis, cultuur en traditionele normen. De collectieve keuze bepaalt de procedures om regels op te leggen aan de uitvoering. De zeven types van regels zijn relevant voor elke laag. Bovendien worden de ervaringen op een lager niveau teruggekoppeld naar de hogere laag.

Interessant is ook de opvatting van Ferguson over de dynamiek van beleid. Het beleid kent lange perioden van stabiliteit en evenwicht, die nu en dan worden onderbroken door hervormingen. In de Engelse taal heet dit het punctuated equilibrium model (p.307). Het wordt toegeschreven aan de bestuurskundige Baumgartner. Ferguson verklaart de perioden van stabiliteit uit het pressie-coalitie model (advocacy coalition), dat is bedacht door Sabatier. Incidenteel zijn er kansrijke momenten voor nieuw beleid (windows of opportunity)7. Ferguson verklaart dit met het meer-stromen model van Kingdon.

De verklaring van Ferguson is essentieel hiërarchisch. Organisaties (corporate actors) bevinden zich op het micro-niveau. Op het meso-niveau zijn allerlei pressie-coalities actief, die er belang bij hebben om het bestaande beleid in stand te houden (p.307). Eventueel wordt het beleid incrementeel aangepast. Een coalitie behoort bij een sub-systeem van beleid (p.308), en is naar binnen gericht. Al deze sub-systemen worden overkoepeld door het macro-niveau. Nieuw beleid wordt gestart op dit niveau, waar zich de politiek en de media bevinden. Volgens het meer-stromen model moet men hier onderscheid maken tussen maatschappelijke problemen, beleid, en politiek (p.311). Problemen bereiken het niveau door terugkoppeling van onderen. Beleid verwijst naar de heersende ideeën. In kansrijke perioden kunnen deze drie domeinen samenkomen, en tezamen een thema op de beleids-agenda plaatsen. Er kan dan een kantelpunt worden overschreden8.


Zelf-organisatie

De niet-coöperatieve speltheorie toont aan, dat unilateraal handelen leidt tot (Nash) evenwichten, die niet efficiënt zijn. Ten einde het maatschappelijke optimum te bereiken, is samenwerking nodig, wat coördinatie en concertatie vereist. De groep van betrokken actoren formuleert tezamen een plan of beleid, dat de maatschappelijke problemen moet oplossen. Dit proces wordt beschreven als een beleids-cyclus9. Historisch is er waarde gehecht aan de zelf-organisatie van groepen. Katholieken noemen dat het beginsel van subsidiariteit, en protestanten spreken van de soevereiniteit in eigen kring. Het besluit is het resultaat van een onderhandeling. Aangezien elke actor een veto heeft, moet er consensus ontstaan. Actoren, die nadeel hebben van het besluit, kiezen voor de uittreding (exit) uit de groep. Ieder houdt zijn lot in eigen hand.

Een interessante beschouwing over zelf-organisatie is te vinden in Collective action and exchange (zie hoofdstuk 9). Zelf-organisatie vereist een interactie-oriëntatie van wederkerigheid (p.202 in AE). Immers, de verleiding is groot om de afgesproken verplichtingen niet na te komen, en zwart te rijden (free riding) op de inspanningen van de rest. Volgens Ferguson moet zelf-organisatie gepaard gaan met investeringen in maatschappelijk of sociaal kapitaal (p.203). De groep ontwikkelt collectieve normen van wenselijk gedrag10. Dit impliceert, dat maatschappelijke problemen worden vertaald in een gedeeld mentaal model. Trouwe lezers herkennen hierin het vertrouwens-model van de socioloog J.S. Coleman11. Ferguson koppelt het vertrouwen aan de reputatie van degene, die wordt vertrouwd. Een actor investeert in zijn reputatie om vertrouwen op te wekken.

De zelf-organisatie begint met de keuze voor een bepaalde oplossing van het probleem. Het besluit legt de verdeling van de kosten en baten over de actoren vast (p.207, 209). Maar de zelf-organisatie moet niet worden geïdealiseerd. Vertrouwen is voorwaardelijk, zodat er toch toezicht nodig is (p.202). En ondanks de consensus wordt het besluit toch bepaald door de machts-verhoudingen (p.212)12. Ferguson meent, dat collectief eigendom een extra prikkel kan geven tot samenwerking (p.216). Iedere actor moet dan een deel van de meerwaarde (het residu) ontvangen. Een eerdere column heeft laten zien, dat collectief eigendom toch problematisch is. Met name kan de waarde van het eigendom niet worden bepaald, en het is niet overdraagbaar (p.221). Daarom is Ferguson gedwongen om aan te nemen, dat veel van de actoren van het type homo sociologicus zijn (p.217). Die is bereid om opportunistisch gedrag af te straffen.

Ferguson wijst op de individuele voordelen van zelf-organisatie, die feitelijk voortkomen uit het lidmaatschap van de groep. Ieder participeert (voice), krijgt informatie, en wordt gesterkt in zijn identiteit (p.222). Er is collectief leren (p.223). Ferguson is enthousiast. Maar eerdere columns over de sociale psychologie hebben uitgelegd, dat groepen niet inherent een positief goed zijn. Ferguson geeft dat toe, en noemt enkele nadelen op. Zelf-organisatie kan hoge kosten hebben (p.226). Buitenstaanders hebben geen toegang tot het maatschappelijke kapitaal van de groep. Erger nog, de groep wentelt vaak haar kosten af op de rest (negatieve externaliteit) (p.228). Aangezien zelf-organisatie verloopt via onderhandelingen, is de interactie niet democratisch. Het besluit baseert op de materiële macht, en niet op de macht van de meerderheid (p.230). De meeste zelf-organisatie mist de religieuze moraal van een kerk of ander genootschap13.

Wellicht is het betoog in Collective action and exchange vooral interessant, omdat het een bevestiging is van eerdere columns in de Gazet. Uw columnist erkent de waarde van zelf-organisatie, waarin de actoren hun eigen lot besturen. In dit kader had Ferguson ook kunnen verwijzen naar de econoom F.A. (von) Hayek. Hayek benadrukt, dat kleine groepen toegang hebben tot veel relevante informatie. Juist die lokale informatie is essentieel voor het slagen van de collectieve activiteiten. Er ontstaat een spontane ordening. Anderzijds leidt de externe concertatie vaak tot onwerkbare regelingen. Overigens is de visie van Hayek nogal eenzijdig. Immers, er is een reële kans, dat de zelf-organisatie ontaardt. Daarom oordeelt de Franse antropoloog P. Bourdieu zelfs negatief over het sociale kapitaal14.

De voorgaande tekst verwijst terloops al naar enkele modellen van zelf-organisatie en vertrouwen, die zijn behandeld in de Gazet. Zij zijn een welkome aanvulling op het verhaal over sociaal kapitaal en vertrouwen. Een column beschrijft een slim model van gedrags-prikkels ten gevolge van collectief eigendom. In een andere column wordt het effect van wederkerigheid gemodelleerd. Enkele columns bespreken modellen, die vertrouwen verklaren uit het opbouwen van een reputatie. Een column over de speltheorie geeft de Tit-for-tat strategie als voorbeeld. De actoren zijn wederkerig. Zulke strategieën werken enkel bij een duurzaam contact. Namelijk, het motief om een reputatie op te bouwen is rationeel, gericht op eigen belang. Rationeel vertrouwen loont. Dit functioneert ook nog bij interacties op de markt, waar de gedeelde moraal minimaal is16.

Ferguson besteedt geen aandacht aan het onvoorwaardelijke vertrouwen tussen actoren17. Er is een emotionele band, die de econoom P. Frijters omschrijft als toewijding (love). Coleman modelleert dit als een sociale ruil. Ook Fao meent, dat een ruil vaak emotionele elementen heeft. In de actor huist een emotional man. Scharpf noemt dit een interactie-oriëntie. Dit soort vertrouwen is een socio-psychologisch verschijnsel. De actoren kunnen een goede wil (bienveillance) tonen18. Goede wil is gericht op een individuele actor. Ook deze vorm van vertrouwen groeit dankzij de duurzaamheid van het contact. De actoren leren elkaar beter kennen. Emotioneel vertrouwen is meer een persoonlijke overtuiging dan een rationele afweging. In de practijk zal vertrouwen steeds een mengvorm zijn van rationaliteit en emoties. De emotionele factor past slecht in een model, en maakt daarom de uitkomsten van interacties minder voorspelbaar.

Men zou denken, dat de maatschappelijke of sociale psychologie veel studies heeft uitgevoerd naar vertrouwen. Maar dat valt tegen. Zij bestudeert vooral de vooroordelen tussen groepen. De groep vormt een cognitief stereotype van anderen19. Een stereotype doet denken aan een reputatie, al gebruiken psychologen dit woord niet. Het stereotype is zelf geen vooroordeel, maar kan er wel toe leiden. Namelijk, het veroorzaakt een affectieve reactie binnen de groep. De actor neigt er toe om de eigen groep positiever te beoordelen dan andere groepen (favouritism)20. Als de eigen groep goed presteert, dan wordt dit toegeschreven aan kwaliteiten, en niet aan de situatie21. Concurrentie tussen groepen bevordert het ontstaan van vooroordelen22. De klassenstrijd was dus niet zo een goed idee. Aldus leert de psychologie, dat er vaste patronen van gedrag zijn, die meer het gemak dienen dan de rationaliteit. Maar ze zijn lastig modelleerbaar23.

Ferguson meent, dat maatschappelijk kapitaal enkel verschilt van fysieke kapitaal-goederen, doordat het eigendom collectief is (p.206). Die opvatting getuigt van te veel optimisme. Immers, beschrijvingen van sociaal kapitaal moeten noodgedwongen inductief zijn. Deductieve modellen baseren gewoonlijk op een nuts-maximalisatie. Een recente column laat zien, dat zelfs dan het verwachte nut van de actoren een gecompliceerde gedaante kan hebben. Een model moet het aantal leidende motieven van de actoren (de actor-modellen) zoveel mogelijk beperken. Als bijvoorbeeld de emoties of de groeps-identiteit worden meegewogen in de nuts-functie, dan dreigen de uitkomsten van het model ongrijpbaar en louter subjectief te worden. Helaas lost Ferguson dit probleem niet op in zijn analyse van zelf-organisatie.

Diverse columns van de Gazet zijn gewijd aan de negatieve kant van sociaal kapitaal, bijvoorbeeld die over het communitarisme en over het maatschappelijk kapitaal. Wegens de groeps-dynamiek heeft een column kritiek geleverd op de pleidooien voor netwerk sturing, die eveneens zelf-organisatie verlangen24. Het is beslist nodig, dat de staat toezicht houdt, en de democratische wil (het algemeen belang) waarborgt25. Volgens de bestuurskundige F.W. Scharpf moeten de onderhandelingen plaats vinden in de "schaduw van de staat"26. Hij en E. Ostrom verdedigen allebei de combinatie van individuele vrijheid en centrale inkadering. Vanuit het communitaristische perspectief vindt men dezelfde idee bij Etzioni, in zijn Ik & Wij model.


Staats-interventies

Ferguson erkent de problemen en gebreken van zelf-organisatie, maar is er per saldo toch enthousiast over. Bij sommige wetenschappers, waaronder Hayek, gaat de waardering voor zelf-organisatie gepaard met een afkeer van centrale sturing. Zij stellen, dat de staat niet bij machte is om de informatie te verzamelen, die relevant is voor beleid. Bovendien zou het centrale gezag geen beleid kunnen doorzetten, omdat het onvoldoende macht heeft, en omdat er geen duidelijk algemeen belang zou bestaan. Sommige sociologen stellen, dat in het modernisme het vertrouwen in de democratische instituties (zoals de staat) afneemt27. Daardoor zou het persoonlijke contact weer belangrijker worden. Maar Ferguson meent, dat in het modernisme de interacties complex worden (p.236). Daarom stelt hij, dat centrale sturing wenselijk en onmisbaar is, zij het binnen zekere grenzen. Zij blinkt uit in het oplossen van tweede orde problemen (handhaving van regels).

Volgens Collective action and exchange vindt zelf-organisatie altijd plaats binnen een groter maatschappelijk kader. Daarbij moet allereerst worden gedacht aan de staat. Meer algemeen betekent dit, dat het bestuur gelaagd is. Wijkraden of winkeliers-verenigingen functioneren binnen de gemeente. De gemeente is ondergeschikt aan de nationale staat. En de staat moet gehoorzamen aan (con)federaties en aan internationale instituties. Er is een hiërarchie. Het gezag is genest (p.250). Ferguson noemt het hogere gezag een externe derde partij voor de zelf-organisatie op het lagere niveau (p.232). De zelf-organisatie heeft toegang tot de regels en instituties van het hogere gezag. Omgekeerd kan het hogere gezag zodanige regelingen aanbrengen, waardoor de succesvolle zelf-organisatie juist mogelijk wordt. Immers, het hogere gezag beschikt gewoonlijk over meer middelen dan de lagere organen (p.249).

Bijvoorbeeld kunnen collectieve acties een beroep doen op nationale wetgeving, die contracten afdwingbaar maakt (p.234). Het contract is een ondersteunende (auxiliary) transactie om het collectieve probleem op te lossen. De legitimiteit van het hogere gezag is het grootst, wanneer het een goede aansluiting heeft met de groepsregels28. Met andere woorden, de externe regels moeten het maatschappelijke kapitaal van de groep instand houden (p.236, 240). Anders is zelfs denkbaar, dat de groep de externe regels negeert (p.241). Als de lagere en hogere regels verenigbaar zijn, dan biedt de inbreng van de derde partij voordelen. Zij kan de maatschappij beter overzien dan de lokale groep (p.246-247, 252). Dat vereenvoudigt de coördinatie (p.243). Het hogere gezag kan toezien op de samenhang tussen alle wetgeving (p.244)29. En wegens schaalvoordelen zijn de kosten van de externe dwang relatief laag (p.240, 243).

Voorts mag worden verwacht, dat een hoger gezag minder vatbaar is voor pressie-groepen dan de lagere collectieven (p.246)30. Wegens al deze overwegingen meent Ferguson, dat de realisatie van het maatschappelijke optimum een gemengd systeem vereist, waarin zelf-organisatie wordt overkoepeld door externe wetgeving van een derde partij (p.245). Het lagere gezag opereert in de schaduw van het hogere gezag. Natuurlijk biedt de externe inbreng geen garantie voor succes van de zelf-organisatie. De derde partij kan corrupt zijn. Maar men mag hopen, dat de integriteit toeneemt, naarmate het gezag hoger is. Algemeen moeten de problemen worden opgelost door het meest geschikte bestuurlijke laag (p.251)31.

Zijdelings zij opgemerkt, dat Ferguson de combinatie van zelf-organisatie en handhaving door de derde partij aanduidt als poly-centrisme (p.235, 240, 249). Hij neemt dit begrip over van Vincent Ostrom. Hiermee wordt bedoeld, dat organisaties in iedere bestuurslaag een zekere beleids-vrijheid hebben. De diverse actoren zijn wederzijds afhankelijk, omdat de middelen voor beleid gespreid zijn. Een bekend voorbeeld is de band tussen beleids-formulering en uitvoering. De uitvoering moet vanaf het begin worden betrokken bij de beleids-formulering. Des al niettemin bestaat er wel degelijk een hiërarchische verhouding tussen de diverse bestuurs-lagen (p.252). Uw columnist vindt de term polycentrisme minder gelukkig, omdat sommige bestuurskundigen (bijvoorbeeld in de Rotterdamse school van netwerk-sturing) de term opvatten als een systeem zonder hiërarchie. Dat wekt verwarring.


Een speltheorie van de staat

De centrale positie van de staat als een derde regelgever kan goed worden geïllustreerd aan de hand van de speltheorie32. Beschouw een maatschappij, bestaande uit twee actoren. Bij aanvang van het spel beschikken de beide actoren over een nut uk=3, met k=1 of 2. Stel dat de actor 1 een goed wil produceren. Het goed levert hem b=2 aan baten, en kost c=1 aan inspanning. Daarom is het netto nut van het goed u1=1. Maar daarna loopt hij het risico, dat de actor 2 zijn goed zal inpikken. In dat geval zouden de baten b=2 overgaan van de actor 1 naar de actor 2. Als de actor 1 deze onteigening niet kan verhinderen, dan zal hij afzien van de productie. Deze strategie is maatschappelijk sub-optimaal, omdat de productie meerwaarde schept. Meerwaarde vergroot het maatschappelijke nut W = Σk=12  uk. In een dergelijke situatie kan de staat als een derde partij de welvaart bevorderen door het private eigendoms-recht op te leggen.

Spel van de staat in extensieve vorm
Figuur 2: Spel van de staat
   in extensieve vorm

De zonet geschetste situatie kan worden weergegeven als een spel in extensieve vorm. Zie de figuur 2. De staat is als eerste aan zet. Hij heeft twee strategieën: het recht van privaat eigendom en diens handhaving kunnen worden vastgelegd in de grondwet (ja = j), of niet (nee = n). De besluitvorming van de staat streeft naar de maximalisatie van het maatschappelijke nut W. Als de strategie j wordt gekozen, dan wordt het inpikken van eigendom ongedaan gemaakt, en bovendien krijgt de overtreder een straf ter waarde van p=2. Ongeacht de staat behouden de actoren 1 en 2 hun strategieën, te weten het goed produceren (j) of niet (n) voor de actor 1, en het goed inpikken (j, indien geproduceerd) of niet (n) voor de actor 2. Deze strategieën bevinden zich op het uitvoerende niveau, dus in een laag beneden het grondwettelijk overleg. In totaal zijn er dus 2×2×2 = 8 combinaties van strategieën, en even zovele uitkomsten.

De onderste drie regels van de figuur 2 tonen de uitkomsten als vector (W, u1, u2). Het spel heeft een deelspel-volkomen Nash evenwicht (subgame perfect equilibrium)33. Dit is een evenwicht voor het totale spel, maar ook voor alle deelspellen. De deelspellen voltrekken zich op de lagere niveau's in de figuur 2, dus bij de actoren 1 en 2. Deelspellen zijn als het ware ingebed in het totale spel34. Het Nash evenwicht kan worden gevonden door achterwaartse (backward) inductie, beginnend vanaf het laagste niveau. Als de actor 1 niets produceert, dan kan de actor 2 niets inpikken. Als de actor 1 wel produceert, dan is zonder eigendoms-recht inpikken de beste strategie voor de actor 2. Met eigendoms-recht is juist niet inpikken de beste strategie, wegens de boete. Beschouw vervolgens de actor 1. Zonder eigendoms-recht loont produceren niet, maar met eigendom wel.

Beschouw tenslotte de staat. Zonder eigendoms-recht ontstaat het deelspel (n, n), met W=6. Met eigendoms-recht ontstaat het deelspel (j, n), met W=7. Dus de staat heeft als beste strategie het invoeren van het eigendoms-recht. Kennelijk is het deelspel-volkomen evenwicht gelijk aan (j, j, n). Dankzij de staats-interventie is het maatschappelijke nut verhoogd met 1, te weten de productie. Er is maatschappelijke efficiëntie. Bovendien laat het zojuist geschetste spel zien, dat de markt is ingebed door maatschappelijke instituties. In die zin is het ook een interessante toepassing van het actor-gerichte institutionalisme (AGI). Het model bevestigt hiermee algemene wijsheden, maar op een herkenbare manier, door de concrete interacties te analyseren. De introductie van het eigendoms-recht is een voorbeeld van het ontwerpen van een maatschappelijk mechanisme (social mechanism design)35. De institutie genereert de gewenste individuele prikkels.

De lezer dient zich bewust te zijn, dat het model een abstractie is. Bijvoorbeeld baseert de welvaarts-functie W op het utilitarisme. De functie W definieert de moraal van de maatschappelijke verdeling. Sommigen verkiezen wellicht een andere moraal, die inpikken rechtvaardigt. Dit zou het geval kunnen zijn, wanneer de actor 2 beschikt over een democratische meerderheid. Merk op, dat W het algemeen belang definieert. Wanneer men ontkent, dat het algemeen belang objectief kenbaar is (zoals het postmodernisme doet), dan kan de staats-interventie worden afgekeurd. Er kan dan een voorkeur zijn om het collectieve actie probleem op te lossen via zelf-organisatie, zoals onderhandelingen in een netwerk. De uitkomst uk wordt dan bepaald door het overleg van de actoren 1 en 2, waarbij de pogingen om elkaar te overtuigen moeten leiden tot een mentale convergentie. Uw columnist is hier niet weg van.


Modellen zonder en met zelf-organisatie

De aard van de geproduceerde goederen bepaalt, of een groep in staat is tot zelf-organisatie. Diverse columns hebben laten zien, dat zelf-organisatie niet aantrekkelijk is, wanneer de betreffende groep een zuiver publiek goed produceert. Immers, in die situatie levert zwart rijden meer nut op. Een volgende paragraaf zal dit fenomeen nogmaals illustreren, nu met een coalitie model, dus wat anders dan voorheen is gepresenteerd. Natuurlijk is dit model een abstractie. In werkelijkheid is vaak toch exclusie van consumptie mogelijk. Anderzijds maakt wegens de aggregatie technologie een actor soms kosten, die geen baten opleveren. Zelf-organisatie is zeker mogelijk, wanneer de groep een clubgoed produceert. Een volgende paragraaf zal dit illustreren aan de hand van een netwerk model. De beide modellen laten bovendien nogmaals zien, dat een actor het strategische gedrag in de actie arena kan doorrekenen.


Het publieke goed bij vele actoren

Een recente column beschrijft de productie van publieke goederen in een maatschappij met vele actoren, zeg n in aantal. Elke actor moet kiezen tussen bijdragen (strategie s') of afzijdig blijven (strategie s''). Een andere column constateert, dat zulke keuzes gepaard kunnen gaan met de vorming van coalities. Als een maatschappij of systeem wordt verdeeld in coalities, dan spreekt men van een partitie P. Dan is de maatschappij N de vereniging van coalities Cj (j=1, ..., J, met J≤n), die onderling geen actoren gemeen hebben. Gegeven de twee strategieën s' en s'' ligt de partitie {{C}, {N\C}} voor de hand. De maatschappij splitst in mensen van het type homo politicus en homo economicus. Maar deze splitsing is niet de enige mogelijkheid. De huidige paragraaf onderzoekt meer gecompliceerde partities36. Aangezien het actor-model in deze analyse de homo economicus is, kunnen de coalities natuurlijk niet stabiel zijn. Het opportunisme domineert.

Beschouw een systeem met n=5 actoren. De actoren zijn anoniem, zodat er symmetrie is in al hun individuele kenmerken. Stel de individuele baten van het publieke goed zijn b=3, en de kosten zijn c=7. Als de actoren unilateraal handelen, dan wordt het goed niet aangeboden. Toch zou het goed al een positief netto nut uk=2 geven aan de actor k, wanneer hij bijdraagt in een coalitie met m=3 leden. Algemener is uk = m×b − c, wanneer k zelf bijdraagt. Het loont dus om een coalitie van m≥3 te vormen, waarin alle leden zich verplichten tot bijdragen. Maar buitenstaanders hebben geen kosten c, en wegens de niet-rivaliteit van het goed kunnen zij zwart rijden (free riding) op de inspanning van de coalitie. De opbrengsten van de coalities Cj in een gegeven partitie P worden gegeven door de coalitie functie ρ(P, Cj). Duidt nu de coalities aan als Cm, waarbij m het aantal leden van de coalitie is. Dan geeft de tabel 2 de waarden van de coalitie functie ρ.

Tabel 2: partitie-functie voor systeem met n=5
partitie Ppartitie waarde ρ(P, C)
C5 = N40
C4, C120, 12
C3, C26, 18
C3, C1, C16, 9, 9
C2, C2, C10, 0, 0
C2, C1, C1, C10, 0, 0, 0
C1, C1, C1, C1, C10, 0, 0, 0, 0
Grafiek van nut door m bijdragen
Figuur 3: Nut door m bijdragen
   voor strategie s' en s''

In de tabel 2 is C1 de individuele actor. De vereniging van twee C1 tot één C2 loont niet, omdat de actoren hier nulspelers zijn. Vanaf C3 zou samenwerken s' de rationele strategie van de coalitie-leden zijn, indien exclusie van het goed mogelijk was. De figuur 3 toont het individuele nut uk als functie van m, voor de leden in Cm en voor de buitenstaanders N\Cm. De trouwe lezer herkent hierin het fenomeen, dat zwart rijden (s'') meer loont dan bijdragen (s'). Beneden m=3 geeft de strategie s' een negatief nut. De strategie s' wordt dan irrationeel, zodat in de figuur 1 voor dit m-domein uk(s'') = 0 is verondersteld. Samenwerking wordt pas overwogen, wanneer de drempel m=3 is bereikt. Maatschappelijk gezien is de triviale partitie C5 de optimale keuze, want daar is W = Σk=15  uk maximaal. Merk op, dat de partitie functie niets zegt over de verdeling binnen een coalitie.

Dankzij de partitie functie ρ(P, Cm) kan nu de stabiliteit van het systeem N worden onderzocht voor de diverse partities P in de tabel 2. De figuur 3 laat zien, dat coalities Cm met m>3 instabiel zijn, omdat uittreding loont voor een actor k. Helaas bestaat er verder geen eenvoudig recept voor de analyse. Men moet elke partitie afzonderlijk onderzoeken. Het optimum met m=5, de triviale partitie, is duidelijk niet stabiel, omdat een actor k zijn nut kan verbeteren door uittreding. Dat geeft hem uk=12. Aangezien de nucleolus voor deze partitie gelijk is aan uk=8, heeft C1 een nuts-overschot van e(un, {N}, C1) = 4. Maar ook de partitie {C4, C1} is instabiel. Aangezien de nucleolus gelijk is aan (5, 5, 5, 5, 12), kan C1 nog steeds putten uit een nuts-overschot van e(un, {C4, C1}, C1) = 4.

Beschouw vervolgens de partitie {C3, C1, C1}. Men zou denken, dat deze stabiel is. Echter, de leden van de coalitie C3 hebben er baat bij om uit te treden. Zij verlagen daarmee hun eigen nut naar uk=0. Maar tevens kunnen zij rationeel verwachten, dat de anderen vervolgens weer een coalitie C3 zullen vormen37. Daarmee hebben zij uitzicht op uk = 9 in plaats van uk=2. Met andere woorden, er treden cycli op. De partitie is stabiel qua vorm, maar de actoren wisselen voortdurend van coalitie. Dit heet ω-stabiliteit38. En tenslotte, partities die enkel bestaan uit C1 en C2 zijn instabiel, omdat de vorming van C3 loont. Aldus heeft geen enkele partitie in de tabel 2 een kern.

Uw columnist vindt dit model toch wat problematisch. Aangezien alle actoren liever lid zijn van C1 dan van C3, kan de vorming van C3 lang op zich laten wachten. In feite is dit een mengvorm van de coöperatieve en niet-coöperatieve speltheorie. Actoren kunnen na onderling overleg een coalitie vormen, waarbij zij hun verplichtingen vastleggen in een contract. Maar toch hebben ze daarna nog steeds de optie om hun coalitie te verlaten. Wegens deze mengvorm ontstaat er enige hoop, dat de actoren althans soms en tijdelijk zullen samenwerken. Ze ontsnappen even aan het gevangenen-dilemma.


Het clubgoed in een netwerk

Soms wil men niet enkel de partitie bestuderen, maar ook de bijbehorende netwerken. Immers, de netwerk-positie van een actor k in zijn coalitie bepaalt mede diens macht. Recente columns hebben het belang van netwerken geïllustreerd voor het unanimiteits-spel, voor kabinets-formaties, en voor de BPFN allocatie regel. Het is lastig om de vorm van netwerken te verklaren. Bijvoorbeeld, tijdens kabinets-formaties oefenen ideologische voorkeuren, bestuurbaarheid, en het signaal van de kiezers allemaal invloed uit op de vorm. De huidige paragraaf presenteert het afstands-gebaseerde nutsmodel (distance-based utility model). Het model is ontleend aan het boek Social and economic networks (afgekort SN) van de econoom M.O. Jackson39. Zij λ het netwerk. Dan berekent dit model het nut van de actor k als

(1)     uk(λ) = -dk(λ) × c + Σj≠k  b(lkj(λ))

Figuur van zes netwerken voor n=4
Figuur 4: Zes netwerken λj voor n=4
   met hun verschillende contacten

In de formule 1 is dk de graad van de actor k in het netwerk λ, dus zijn aantal directe contacten in het netwerk. En lkj is de afstand tussen de actoren k en j, geteld als het aantal tussenliggende contacten. De functie b drukt de baten uit van het contact tussen k en j. Gewoonlijk wordt verondersteld, dat de baten afnemen, naarmate de relatie afstandelijker is40. Wiskundig is dat ∂b/∂l < 0. De kosten om een direct contact te onderhouden zijn c. De sommatie over j loopt van 1 tot n, waarbij k wordt overgeslagen (tenzij men b(0)=0 wil nemen). Merk op, dat er volgens de formule 1 positieve externaliteiten zijn. Elke actor profiteert indirect mee van de contacten, die zijn directe contacten hebben.

Hoewel de formule 1 een logische indruk maakt, is zij niet altijd bruikbaar. Bijvoorbeeld, bij zuiver publieke goederen behoren de zwart-rijders tot het maatschappelijk netwerk. Maar hun kosten zijn nul, en hun baten hangen niet af van de afstand tot de diverse actoren. Een interessante toepassing van het afstands-gebaseerde nutsmodel is echter het clubgoed. Stel bijvoorbeeld, dat vier provincies tezamen een commissie (of club) vormen om informatie uit te wisselen over beleids-problemen. Hier mag worden verwacht, dat de uitwisseling beter verloopt, naarmate het contact inniger is. Dan worden zowel het aantal contacten dk als de positie in het netwerk relevant. De figuur 4 toont de zes mogelijke netwerken λj, die de vier provincies kunnen vormen in hun commissie. De zwarte punten stellen de actoren voor, en de rode lijnen zijn hun directe contacten. Het aantal paar-contacten varieert van 3 tot 6.

De formule 1 wordt simpeler, wanneer men aanneemt dat b(lkj) = βl(kj), waarbij β een constante is, die gelijk is aan b(1) (zie p.15 in SN). Neem voorts aan, dat geldt 0<β<1, zodat de baten inderdaad afnemen met de afstand. Definieer het directe netto nut van een contact als δ = β − c. De tabel 3 beschrijft nu de eigenschappen van de zes netwerken in de figuur 4. Getoond wordt het nut uk per provincie, genummerd van boven naar beneden en van links naar rechts in het netwerk. Ook het totale nut W = Σk=14  uk van de club is vermeld. De aanduiding van het type is afkomstig van de sociologische groepstheorie41. De daarvan afwijkende aanduiding tussen haakjes is gebruikelijk in de sociale netwerk analyse (SNA).

Tabel 3: zes netwerken van vier provincies
 λ1λ2λ3λ4λ5λ6
typekettingwiel
(ster)
cirkel
(wiel)
vliegerstreepcomcon
aantal
contacten
334456
u actor 1δ+β²+β³δ+2×β²2×δ+β²δ+2×β²2×δ+β²3×δ
u actor 22×δ+β²3×δ2×δ+β²3×δ3×δ3×δ
u actor 32×δ+β²δ+2×β²2×δ+β²2×δ+β²3×δ3×δ
u actor 4δ+β²+β³δ+2×β²2×δ+β²2×δ+β²2×δ+β²3×δ
W totaal6×δ+4×β²+2×β³6×δ+6×β²8×δ+4×β²8×δ+4×β²10×δ+2×β²12×δ

Men kan aantonen, dat zich geen netwerk vormt, wanneer geldt δ < (1 − ½×n) × β² (p.160-161). Voor n=4 heeft inderdaad bij deze negatieve δ altijd wel een actor een negatief nut. Maar het betekent in het bijzonder, dat bij een negatief netto nut zich geen paar-netwerk (met n=2) vormt. Kennelijk moeten netwerken dan ontstaan uit een multilateraal overleg. Bij grotere netwerken kunnen klaarblijkelijk de externe effecten compenseren voor het directe nadeel. Anderzijds, als geldt δ>β², dan worden alle mogelijke directe contacten inderdaad gerealiseerd (p.160)42. Men kan dit ook aflezen in de tabel 3, waar het nut uk = 3×δ optimaal wordt. Dan vormen de vier provincies het netwerk λ6.

Interessant is het geval (1 − ½×n) × β < δ < β², dus hier -β < δ < β². In dit geval heeft het wiel (ster) netwerk de grootste W waarde, en is daarom maatschappelijk (bezien vanuit de commissie) het meest efficiënt. Voorts kan men nu de paarsgewijze stabiliteit van de netwerken onderzoeken (p.156 in SN). Een contact is enkel stabiel, zolang beide actoren het accepteren. Het contact is bilateraal (p.16). Geen enkele actor wil unilateraal een contact verbreken, of tezamen met een andere actor een extra contact leggen. Bijvoorbeeld toont de tabel 3 aan, dat de actoren in een comcon-netwerk een contact zullen verbreken, omdat het streep-netwerk hen meer netto nut oplevert. Maar in het streep-netwerk zal nogmaals een contact worden verbroken om het vlieger- of cirkel-netwerk te bereiken. Tenslotte zal het vlieger-netwerk veranderen in het wiel-netwerk43.

Aldus wordt opnieuw duidelijk, dat unilaterale besluiten een obstakel zijn naar maatschappelijke efficiëntie. Immers, de actor, die in het wiel-netwerk λ2 de spil vormt, heeft een relatief laag nut. Daarom moeten de actoren vermijden in de spil-positie te belanden, wanneer zij het comcon-netwerk versimpelen en slanker maken44. De actor in de spilpositie van λ2 kan zijn situatie niet meer unilateraal verbeteren. Het wiel-netwerk is Pareto optimaal, evenals trouwens het ketting- en cirkel-netwerk (vergelijk p.158). De spil-provincie kan zelfs niet een betere coalitie vormen met een andere actor, op de manier van de voorgaande paragraaf over het publieke goed. Haar enige hoop is om een herverdeling voor te stellen in de club, waardoor iedereen uk=W/4 krijgt. Maar het is rationeel voor de andere provincies om dit voorstel te verwerpen.

De redenatie van zonet toont een gebrek van het afstands-gebaseerde nutsmodel. Immers, de spil-positie zou juist een extra macht moeten geven aan de provincie. Dit blijkt bijvoorbeeld uit een voorgaande column, waarin de de Myerson waarde μk(ν, λj) wordt berekend voor een unanimiteits-spel. Nog duidelijker is dit in de column over de algemene Nash oplossing van onderhandelen in een netwerk. Dit model van onderhandelen ziet de contacten als een kans voor voordelige ruil. Volgens de Nash oplossing kan de spil-actor zich zelfs 90% van alle toegevoegde waarde in het netwerk toe-ëigenen! Men kan natuurlijk tegenwerpen, dat het clubgoed van de provincies (te weten, de informatie) niet wordt geruild, maar aanwezig is als een extern effect45. Dan resteert het argument van Myerson, dat de spil-provincie de externaliteit doorgeeft, en zo waarde toevoegt. Daarom kan zij dreigen het netwerk te verlaten, tenzij zij side payments ontvangt (p.17)

Het boek van Jackson onderkent inderdaad dit probleem. Het veronderstelt, dat nut overdraagbaar is, en definieert dan de inkomens-overdracht als wk(λ) = uk(λ) + tk(λ) (p.174). Daarbij moet zijn voldaan aan Σk=1n  tk = 0, althans zolang het netwerk λ niet extern wordt gesubsidieerd. Dankzij de overdracht verandert het nut van de actor k in wk. In het simpelste geval worden de tk bepaald door middel van onderhandelingen tussen de n actoren. Maar er zou ook een staats-interventie kunnen zijn, waarbij de herverdeling verloopt via belastingen en uitkeringen. De overdracht kan zijn gebaseerd op principes van billijkheid, zoals gelijke behandeling in gelijke situaties (anonimiteit of symmetrie)46.

Maar de inclusie van overdrachten maakt de formule 1 nog allerminst universeel geldig. Vaak worden de baten bk voor de actor k niet veroorzaakt door de directe naburen in het netwerk, maar door ver afgelegen (indirecte) contacten. Denk aan innovaties, of aan bestuurlijke wetgeving. Ook bedreigingen komen vaak van ver (oorlog, ziekten, en dergelijke)47. En de kosten c van het contact zullen vaak verschillend zijn voor elke actor. Beschouw bijvoorbeeld het wiel-netwerk in de column over de kabinets-formatie. Het CDA bezet nogal eens de spil-positie. En die blijkt politiek uiterst nuttig te zijn48. Kennelijk is de toepasbaarheid van het afstands-gebaseerde nutsmodel beperkt. Zijn charme zit vooral in de eenvoud van de formule 1, die het nut uk simpel berekenbaar maakt, zonder de noodzaak om de waardes van allerlei coalities te inventariseren.


Evaluatie

Ook na vijf columns over speltheorie en bestuurskunde blijven de baten van de kruis-bestuiving ongewis. De speltheorie is enkel in uitzonderlijke situaties in staat om de werkelijkheid te voorspellen. Voorlopig ziet uw columnist de voornaamste winst van de speltheorie in de compacte weergave van complexe bestuurlijke situaties. Zie het inpik-spel van zonet, of het spel van de homo sociologicus, of het spel van de staat en de vakbeweging.

  1. Zie Gestion et théorie des jeux (1998, Librairie Vuibert) onder redactie van J. Thépot. (terug)
  2. Op p.225 in Gestion et théorie des jeux geeft Romelaer toe, dat organisaties altijd beschikken over focale punten, dankzij hun eigen missie en interne cultuur. Maar er zijn veel van deze punten, en het is lastig om uit deze verzameling punten de meest dominante aan te wijzen. Uw columnist vermeldt het spel van Ponssard vooral, omdat het een voorbeeld is van creatieve signalering. (terug)
  3. De Gazet maakt de coalitie-theorie juist tot een speerpunt! (terug)
  4. Zie p.231 in Gestion et théorie des jeux: "Les chercheurs en gestion attendent, d'une part, que des modèles de théorie des jeux leur apportent des fait stylisées nouveaux pour eux, et d'autre part qu'ils deviennent plus opérationnels, permettant de calculer, de prévoir et de piloter des situations réelles de gestion". Zijn reactie is begrijpelijk. Anderzijds doet Romelaer zelf nauwelijks pogingen tot abstractie, wat toch de kern van elke analyse moet zijn. Daardoor blijft de bestuurskunde hangen in fenomenologie. Het gevolg is dat bijvoorbeeld een naslagwerk als The SAGE handbook of administration (2008, SAGE Publications Ltd) onder redactie van B. Guy Peters en J. Pierre slechts 11 van de 640 pagina's wijdt aan wiskundige modellering. Bestuurskundigen zoals F.W. Scharpf, T. Sandler, K. Holzinger, en W.D. Ferguson (zie deze column) laten zien, dat wiskundige methoden wel degelijk nuttig zijn voor de bestuurskunde. (terug)
  5. Zie hoofdstuk 12 in Collective action and exchange (2013, Stanford University Press) van W.D. Ferguson. (terug)
  6. Het is niet eenvoudig om de zeven variabelen en hun corresponderende regels te interpreteren. In de hoofdtekst wordt het gezag gekoppeld aan macht R. Maar een eerdere column koppelde het gezag aan de strategie S, vanuit de veronderstelling, dat de beschikbare strategieën afhangen van het actor-gezag. In die column werd de aggregatie opgevat als een machtsstrijd, omdat macht inwerkt op interacties, zoals de onderhandeling of het bevel. Misschien sluit de opvatting van Ferguson toch beter aan bij de IAO. Denkbaar lijkt ook het compromis, dat de macht en de strategie afhankelijk zijn van zowel het gezag als de aggregatie. In formule R = R(G, A) en S = S(G, A). (terug)
  7. Dit herinnert uw columnist aan het model van de marxist Sam de Wolff, dat economische hervormingen koppelt aan incidentele schokken. En het inclusie-model van D. Acemolgu en J. Robinson neemt eveneens aan, dat een institutionele omslag slechts incidenteel mogelijk is. (terug)
  8. Het onderbroken-evenwicht model van Ferguson is slecht inpasbaar in het Rotterdamse paradigma van netwerk sturing. Immers het Rotterdamse paradigma gaat uit van wederzijdse afhankelijkheid in een egalitair poly-centrisme, en niet van een hiërarchisch systeem. De Gazet zal in de toekomst zeker uitgebreider aandacht besteden aan het onderbroken evenwicht (punctuation), de pressie-coalitie (advocacy), en de combinatie van stromen. Wie inter-disciplinair wil werken, moet van alle (en geen van de) markten thuis zijn. (terug)
  9. De beleids-cyclus is een fasen-model. Zie p.106 in Overheidsbeleid (2008, Kluwer) onder redactie van A. Hoogerwerf en M. Herweijer. Ook kan men p.302 in het rebelse boek Handboek beleidswetenschap (2001, Uitgeverij Boom) onder redactie van R. in 't Veld en T. Abma raadplegen. Vele bestuurskundigen relativeren tegenwoordig het belang van de beleids-cyclus. Zie bijvoorbeeld het garbage can model en het post-modernisme. Daarbij wordt ook het algemeen belang in twijfel getrokken. In feite zouden allerlei coalities proberen om groepsbelangen te verdedigen, waarbij vooral de macht de uitkomst bepaalt. Er is dan sprake van een stromenmodel (Zie deze column, of p.71-73 in Overheidsbeleid, of p.304-305 in Handboek beleidswetenschap). Het stromen-model geeft rationaliteit en de maatschappelijke efficiëntie weinig aandacht, omdat de situatie instabiel is. Sommigen verwerpen efficiëntie als criterium, omdat zij twijfelen aan de meetbaarheid van prestaties. Uw columnist is niet weg van zulke modellen. (terug)
  10. Op p.204 in Collective action and exchange spreekt Ferguson over netwerken. Kennelijk is hij beïnvloed door de sociale netwerk analyse (SNA). Dit is enigszins verwarrend, omdat strikt genomen een netwerk weinig samenhang heeft, en evenmin een gedeelde moraal. Maar Ferguson identificeert hier het netwerk toch duidelijk met een groep (p.204): "Networks are relationship links through which individuals communicate or interact, such as family, friendship, and collegiality". In het dagelijks spraakgebruik is het natuurlijk raar om de familie aan te duiden als een netwerk. (terug)
  11. Zie hoofdstuk 8 in Foundations of social theory (1990, Harvard University Press) van J.S. Coleman. Ferguson is in zijn opvattingen over maatschappelijk kapitaal meer verwant met Coleman dan met de politicoloog R. Putnam. Voor Putnam is het maatschappelijk kapitaal vooral verbonden aan het verenigings-leven. (terug)
  12. Het betoog van Ferguson put regelmatig uit de bevindingen van E. Ostrom. Die zijn ontleend aan vormen van zelf-organisatie in de Derde Wereld. Een typisch voorbeeld is de irrigatie in de landbouw. Men wil de hoeveelheid water billijk verdelen. De boeren in het stroom-opwaartse gebied hebben meer macht dan de boeren in het stroom-afwaartse gebied. De problemen zijn hier nog relatief simpel, en daarom heeft Ostrom ze natuurlijk geselecteerd. Uw columnist is niet overtuigd, dat zulke studies bruikbare resultaten opleveren voor moderne kennis-economieën. (terug)
  13. Ferguson verdiept zich niet in het corporatisme, hoewel dat toch een belangrijke vorm van zelf-organisatie is. Kenmerkend is dan de overdracht van wettelijke bevoegdheden van de staat aan private organisaties. Uw columnist denkt, dat de staat hierin terughoudend moet zijn, en dat Nederland direct na de Tweede Wereldoorlog te ver ging. (terug)
  14. Zie hoofdstuk 3 in Le capital social (2006, Éditions La Découverte) van de econome S. Ponthieux. Op p.153 in The limits of public choice (1996, Routledge) omarmt L. Udehn eigenlijk verrassend de negatieve visie van Bourdieu over sociaal kapitaal. Het verval van de Kerken illustreert de onbestendigheid van maatschappelijk kapitaal, dat zich niet meer kan vernieuwen. Tevens illustreert het de enorme taaiheid van een traditionele moraal en institutie. (terug)
  15. De bestuurskundige H. Feneteau beschrijft in hoofdstuk 4 van Gestion et théorie des jeux reputatie-modellen van Dasgupta en Kreps. Het model van Dasgupta baseert op het uitmelken van klanten door de verkoper. (terug)
  16. Udehn betwijfelt in The limits of public choice, dat zelf-organisatie wordt gemotiveerd door (verlicht) eigen belang. Op p.241 stelt hij, dat de eerste vakbonds-leiders in hun activiteiten werden gemotiveerd door hun moraal. Zij zetten zich in voor het algemeen belang van hun groep (p.245). Zie ook p.256 en verder. Op p.268 concludeert Udehn, dat samenwerking ontstaat uit de groeps-identiteit. Uw columnist denkt, dat actoren inderdaad neigen tot handelen volgens hun moraal. Maar men kiest de eigen moraal zodanig, dat zij verenigbaar is met het eigen belang. In die zin lijkt de mens toch op een homo economicus. (terug)
  17. Dit aspect wordt geanalyseerd op p.103-108 van Gestion et théorie des jeux. (terug)
  18. Zie p.106 in Gestion et théorie des jeux voor de nu volgende opmerkingen. De wiskundige K. Binmore meent in Just playing (1998, The MIT Press), dat actoren enkel affectief zijn jegens hun familie. Jegens onbekenden gedragen zij zich empathisch. Op p.31 in Économie de la confiance (2012, Éditions La Découverte) van É. Laurent wordt verwezen naar studies van de antropoloog M. Mauss, met betrekking tot primitieve stammen. Zij kennen soms de traditie van de gift (don), die feitelijk een maatschappelijke verplichting is. Inderdaad kan men vertrouwen op de gift. Maar geven is hier een strijd om status, die weinig te maken heeft met samenwerking. (terug)
  19. Zie p.379 in Sozialpsychologie (2008, Springer-Verlag) van L. Werth en J. Mayer. Op p.419-420 wordt toegevoegd, dat mensen (onbewust) proberen om hun stereotypen te bevestigen door selectief informatie te verzamelen. Er is een confirmation bias. (terug)
  20. Zie p.405 in Sozialpsychologie. (terug)
  21. Zie p.423 en verder in Sozialpsychologie. (terug)
  22. Zie p.411 in Sozialpsychologie. Vaak wordt hier een experiment van Sherif genoemd, die twee groepen van jongens in een zomerkamp liet wedijveren. (terug)
  23. Patronen van gedrag kunnen worden gekoppeld aan de groeps-identiteit. Er bestaan modellen om zulke situaties te modelleren. Bijvoorbeeld raken in het spel van de strijd der seksen (battle of the sexes) twee identiteiten met elkaar in conflict. Ook het spel van Ponssard behoort tot deze categorie. Dan impliceert samenwerking een keuze tussen twee evenwichten. In diverse columns is deze situatie uitgewerkt voor de inter-gemeentelijke standaardisatie. De twee gemeenten raken onderling in een moreel conflict. Dit soort modellen illustreert uitstekend het collectieve actie probleem, maar kan de toekomst helaas niet voorspellen. Maar R.A. McCain vermeldt op p.74-75 in Game theory and public policy (2010, Edward Elgar Publishing, Ltd), dat twee groepen hun conflict kunnen laten beslissen door het lot. Ze organiseren als het ware een loterij. Op die manier wordt een evenwicht geselecteerd. Men spreekt van een gecorreleerd evenwicht, omdat de actoren hun strategie kiezen via een signaal (hier de loterij). Signalering is al weer vier jaren terug beschreven in een column. Bijvoorbeeld kan een centrale bank altijd open zijn over haar nagestreefde inflatie-doel. Haar signaal bepaalt de verwachting van de burgers inzake de inflatie, en daarmee tevens hun strategieën. Het inflatie-doel van de bank is een natuur-verschijnsel (loterij) voor de burgers. In die zin is de bank institutioneel. Maar de bank kan haar signaal misbruiken om burgers te manipuleren, en wordt dan een actor. Boeken over speltheorie negeren zulke practische voorbeelden - de Gazet niet. (terug)
  24. Merkwaardiger wijze is Hayek ambivalent over zelf-organisatie, omdat volgens hem de belangen-groepen gewoonlijk proberen zich te verrijken op kosten van de staat. Daarom verbindt hij de zelf-organisatie aan het afslanken van de staats-interventies. De staat mag niet meer dan de absoluut onmisbare goederen en diensten aanbieden. Netwerk-sturing door de staat is een gruwel voor Hayek. (terug)
  25. Hier verdient vermelding, dat volgens p.49 in The limits of public choice ook de public choice theorie het bestaan van het algemeen belang zou ontkennen. Uw columnist spreekt dat tegen. Immers, in public choice literatuur wordt vaak verwezen naar maatschappelijke welvaarts-functies (SWF). En die drukken wel degelijk het algemeen belang uit. Udehn zoekt naar onvolkomenheden in de public choice theorie. Hij concentreert zich op de meest orthodoxe versie daarvan, en die is inderdaad nogal extreem. Maar de meeste public choice aanhangers hebben een genuanceerde visie op de mens en de maatschappij. Bijvoorbeeld wordt erkend, dat een actor nut kan hebben van de bevestiging van zijn eigen identiteit (p.87). Aldus zal een actor stemmen bij verkiezingen, louter om zijn groep te steunen (p.91). Op p.88 verwijt Udehn aan deze public choice aanhangers, dat zij parasiteren op de sociologie! En op p.92 noemt hij zulke nuances de dood-verklaring van de public choice theorie. Regelmatig klaagt hij over "economisch imperialisme" in de bestuurskunde (bijvoorbeeld op p.161 en 164). In de ogen van Udehn kan de public choice theorie geen goed doen. Zijn ideologische bril ontsiert zijn overigens interessante boek. (terug)
  26. Zie p.200-205 in Games real actors play (1997, Westview Press) van F.W. Scharpf. (terug)
  27. Zie p.10-12 in Économie de la confiance. Volgens enkele eerdere columns wijst de public choice theorie op het universeel heersende opportunisme. Politici, bestuurders en kiezers zouden allemaal hun eigen belang nastreven. Deze opvatting is niet nieuw. Ook een eeuw terug klaagden sociologen al over het verlies aan maatschappelijke binding. Marx ontwaart een individuele vervreemding. Durkheim vreest een toenemende anomie. Maar de politicoloog R. Dahl is juist positief over dit opkomende pluralisme. Uw columnist meent, dat het actor-gerichte institutionalisme (AGI) en de institutionele analyse (IAO) een neutrale positie innemen in dit debat. Ja, instituties zijn onmisbaar, maar zij zijn verenigbaar met pluralisme. (terug)
  28. Nogmaals: Hayek meent, dat de hogere wetgeving vaak strijdig is met de regels op het uitvoerende niveau. Het hogere gezag mist simpelweg essentiële lokale informatie. (terug)
  29. Hayek legt de nadruk op de noodzaak om de formele wetgeving samenhangend te houden. Anders ontstaan er interne tegenstrijdigheden. Hij meent, dat samenhang enkel realiseerbaar is, wanneer de wetgeving zich spontaan ontwikkelt. Het belangrijkste instrument van zulke wetgeving is de jurisprudentie (common law). (terug)
  30. Hayek is pessimistisch over de integriteit van het parlement, en meent, dat het een speelbal is van belangen-groepen. (terug)
  31. Als de lezer geboeid is door deze materie, dan zou hij een eerdere column kunnen raadplegen, waarin het WRR rapport Toezien op publieke belangen (2013) wordt besproken. Het rapport wil het toezicht van staatswege meer laten verlopen via netwerk-sturing. Daarbij kan de toezichthouder optreden als adviseur. Een dergelijke decentralisatie wordt in het algemeen niet aangeraden door Ferguson, al sluit hij haar niet uit voor bijzondere situaties. (terug)
  32. Het voorbeeld in deze paragraaf is een variant op een spel op p.93-95 van Game theory and public policy. Ook p.323-326 in Collective action and exchange toont zo een spel (snatch spel), kennelijk afkomstig van E. Ostrom. (terug)
  33. Dit is een bekend begrip uit de speltheorie. Zie p.85-87 in Game theory and public policy, p.140 in Game theory and political theory (1993, Cambridge University Press) van P.C. Ordeshook, of p.409 in Kooperative Spieltheorie (2005, Oldenbourg Wissenschaftsverlag GmbH) van H. Wiese (terug)
  34. Deze belangrijke observatie wordt gemaakt op p.93 in Game theory and public policy. Met andere woorden, het deelspel is genest in het totale spel. (terug)
  35. Zie hoofdstuk 7 in Game theory and public policy. De uitdrukking is afkomstig uit de speltheorie. Maar de institutionele analyse en ontwikkeling (IAO, institutional analysis and development) heeft dezelfde ambities. (terug)
  36. Het voorbeeld is ontleend aan p.213-216 van Game theory and public policy. (terug)
  37. Volgens p.175-177 in Game theory and public policy wordt de stabiliteit dus mede bepaald door de vooruit ziende blik van de actoren. Bijziende actoren zullen enkel de directe gevolgen van hun uittreden zien, en dat is uk=0. Dan zou de partitie echt stabiel blijven. McCain noemt zulke actoren naïef (p.175). Daarom onderscheidt hij op p.175-176, 181-183, 199 en 214 een pessimistische en een optimistische vorm van stabiliteit. Beide vormen zijn ver vooruitziend. Namelijk, stel dat een coalitie C overweegt om de partitie P te verlaten. Nu moet C nagaan welke partities Q mogelijk zijn voor de restant verzameling N\C. In de pessimistische vorm van stabiliteit neemt C aan, dat de partitie Q vormt, die C haar laagste waarde ρ(Q, C) geeft. Daarbij veronderstelt McCain wel, dat de partitie Q een verbetering brengt voor N\C (p.199). Dus in de tabel 2 mag N\C niet bijvoorbeeld de atomaire partitie kiezen. Evenzo stelt de optimistische vorm van stabiliteit, dat C haar grootste waarde van ρ(Q, C) krijgt. Voorbeeld: zij P = {C3, C2}. Stel C1 verlaat C3, wat naïef zou geven {C2, C2, C1}. Dan is {C3, C1, C1} pessimistisch voor C1, en {C4, C1} is optimistisch voor C1. (terug)
  38. Zie p.189-191 en 215 van Game theory and public policy. Uw columnist vindt ω-stabiliteit een vreemd concept. Immers, een actor heeft meer baat bij cycli dan bij gevangen zitten in de coalitie C3. Dus uittreden is altijd rationeel. En in de situatie {C2, C2, C1} kunnen de actoren eindeloos lang op elkaar wachten, alvorens weer C3 te vormen. Umbhauer onderzoekt in hoofdstuk 9 van Gestion et théorie des jeux ook het effect van ver vooruit zien. In haar voorbeelden wordt tenslotte wel een evenwicht bereikt. (terug)
  39. Zie hoofdstuk 6 in Social and economic networks (2008, Princeton University Press) van M.O. Jackson, met name p.159-162. Hetzelfde wordt uitgelegd op p.294-301 van La théorie des jeux (2009, éditions Flammarion) van G. Giraud. (terug)
  40. De baten b worden wel de vervals-centraliteit (decay centrality) genoemd. Zie p.39 in Social and economic networks of p.262 in Collective action and exchange. Naarmate de graad van de actor k groter is, nemen zijn baten toe, en is zijn positie meer centraal. (terug)
  41. Zie p.131 in Group dynamics (1993, Brooks/Cole Publishing Company) van D.R. Forsyth. De Gazet besteedde hieraan al vier jaren terug aandacht, in een column over de rationele keuzeleer. (terug)
  42. Dit is vrij simpel in te zien. Het nut β² ontstaat, wanneer een actor een indirect contact heeft op afstand 2. Als δ groter is dan dit nut, dan loont het kennelijk om het indirecte contact te vervangen door een direct contact. (terug)
  43. Merk op, dat het cirkel-netwerk niet kan worden veranderd in het wiel-netwerk, alleen door een contact te verbreken. Het lukt ook niet via tussenstappen, omdat daarbij altijd enkele actoren zouden verliezen. (terug)
  44. In het streep-netwerk hebben de provincies 2 en 3 (die allebei drie contacten hebben) een prikkel om het contact met de provincie 1 of 4 te verbreken. De traagste van de twee provincies zal zijn drie contacten behouden, en kan niet meer ontsnappen aan de spilfunctie (tenzij zij het netwerk verlaat). Eventueel kunnen de provincies 2 en 3 in het streep-netwerk solidair zijn met elkaar door het onderlinge contact te verbreken. Dan ontstaat het cirkel-netwerk. Maar dat is minder aantrekkelijk voor de provincies 1 en 4. (terug)
  45. Terzijde zij opgemerkt, dat deze kritiek ook kan worden gericht tegen het model van de socioloog J.S. Coleman, dat de maatschappelijke ruil wil beschrijven. Immers, de ruil van immateriële zaken zal vaak gepaard gaan met externe effecten. Kennelijk is dit model ongeschikt voor tal van situaties. (terug)
  46. Als er bijvoorbeeld een keten-netwerk is, dan kunnen de actoren 1, 3 en 4 elk t = -(β² − δ)/3 afstaan en overdragen aan de actor 2. Dan is die bereid om het vlieger-netwerk te vormen, waarna de actoren 3 en 4 er een wiel-netwerk (ster) van maken. (terug)
  47. Volgens de socioloog M. Granovetter gebruikt een actor zijn zwakke contacten (weak ties) aan de periferie van het netwerk om nieuwe kansen te scheppen. De sterke contacten (zeg, de directe buren) geven de actor een zekere geborgenheid, maar zij perken tevens zijn vrijheid in. Zie p.69-70 in Social and economic networks, p.35-37 in in Social network analysis (2013, Sage Publications Ltd) van J. Scott, p.186-187 in Économie et sociologie (2004, Presses Universitaires de France) van F. Cusin en D. Benamouzig, of p.24 Le capital social (2006, Éditions La Découverte) van S. Ponthieux. Op p.28-29 verwijst Ponthieux naar R.S. Burt, die meent dat juist de structurele gaten in het netwerk moeten worden gedicht. Actoren kunnen een brug bouwen tussen gescheiden netwerken. Zie ook Jackson op p.70-71, en 174. (terug)
  48. Vermoedelijk is zeker in die situatie de aanname in het afstands-gebaseerde nutsmodel van een constante c voor alle actoren weinig realistisch. De kosten van contact leggen met andere partijen zijn meestal lager voor het CDA dan voor een gepolariseerde partij als de SP. Op p.170-173 in Social and economic networks wordt voorgesteld om het leggen van een contact duurder te maken, naarmate de afstand lkj tussen de twee actoren groter is. Wiskundig is dat ∂c/∂l > 0. Bijvoorbeeld, het contact van de SP met de VVD zou kunnen verlopen via de keten PvdA - CDA - VVD. Dit pad heeft een lengte van 3, zodat de kosten van het directe contact tussen de SP en de VVD hoog zijn. (terug)