Opnieuw wordt er gezocht naar een vruchtbare integratie van bestuurkunde en speltheorie. De speltheorie is wegens haar abstractie en rationaliteit slechts beperkt practisch toepasbaar. Bestuurlijke evenwichten ontstaan dankzij advocacy coalities, maar zijn punctuated. Zelf-organisatie biedt kansen op consensus en een groeps-identiteit. Maar toch moet bijna altijd de staat ingrijpen, als derde partij. De speltheorie kan interventies modelleren. Het publieke goed met n actoren wordt nogmaals gemodelleerd. Het clubgoed wordt geïllustreerd met het afstands-gebaseerde nutsmodel.
Het boek Gestion et théorie des jeux (afgekort GJ) lijkt ideaal te passen bij deze column1. Het doet verslag van een gedachtenwisseling tussen de bestuurskundige P. Romelaer en de speltheoretica G. Umbhauer. Ze richten hun analyse met name op de spelregels, het verloop in de tijd, en leerprocessen. Helaas valt het resultaat wat tegen, want het lukt de beide wetenschappers niet om een gedeelde taal te vinden. Romelaer geeft een uitleg over bestuurskunde, en Umbhauer gebruikt enkele trefwoorden uit dat betoog om haar eigen speltheoretische modellen te presenteren.
Romelaer benadrukt, dat spellen binnen een organisatie altijd genest (ingebed) zijn (p.58 in GJ). Elk van de interne coalities probeert haar eigen doelen en belangen te bevorderen (p.59). De interacties zijn dynamisch, omdat macht een belangrijke rol speelt (p.59, 82). De regels brengen enige stabiliteit in de organisatie (p.71). Het regel-systeem is uiterst complex door het aantal en de diversiteit van de regels (p.75). Het geheel moet coherent zijn (p.82, 184). Op het hogere niveau staan de spelregels zelf ter discussie (p.61). Zelfs de voorkeuren van actoren zijn veranderlijk (p.64). De factor tijd uit zich in de langzame rijping van nieuwe doelen en strategieën (p.122 en verder, 174, 180). Organisaties moeten collectief leren (p.174). Het leerproces is momenteel nog slecht begrepen (p.175 en verder). Vermoedelijk verloopt het schoks-gewijze (p.177). Zulke schokken zijn lastig voorspelbaar (p.179, 182).
Men ziet dat Romelaer vooral de complexiteit benadrukt, en weinig pogingen tot abstractie doet. Umbhauer heeft niet echt een weerwoord op het betoog van Romelaer. Ze wijst er op, dat het Nash evenwicht past bij de menselijke hang naar stabiliteit (p.193). Ze benadrukt, dat in de speltheorie de actoren zich rationeel gedragen. Daardoor kunnen zij de mogelijke strategieën en reacties van de andere actoren voorzien (p.205). Zij hebben hun eigen strategie al helemaal doordacht, voordat de interacties beginnen ("virtueel" leren door reflecteren) (p.206). De tabel 1 geeft een verrassend voorbeeld. De beide actoren spelen dit spel twee maal, en moeten daarbij hun strategie bepalen. Zij willen absoluut de combinaties (s1, s2) en (s2, s1) vermijden. Na de eerste ronde kunnen de beide actoren hun uitkomsten zien.
actor 2 | |||
---|---|---|---|
s1 | s2 | ||
actor 1 | s1 | (3, 1) | (0, 0) |
s2 | (0, 0) | (1, 3) |
Stel dat de actor 2 inventiever is dan de actor 1. Hij verwacht, dat in de eerste ronde de actor 1 zal kiezen voor s1, vanwege de mogelijke uitkomst u=3. Daarom besluit de actor 2 zelf te kiezen voor s1. Daarmee beloont hij de actor 1. Zelf krijgt hij in de eerste ronde maar u = 1. Echter, de actor 1 weet, dat de actor 2 een egoïst is. Dien ten gevolge moet de actor 1 wel aannemen, dat actor 2 ook u = 3 wil ontvangen. Daarom verwacht de actor 1, dat actor 2 in de tweede ronde kiest voor de strategie s2. Dit dwingt de actor 1 om ook te kiezen voor s2. Dankzij het doordenken heeft uiteindelijk ieder van de actoren een totaal nut u = 1+3 = 4 verworven. Merk op, dat deze goede uitkomst is te danken aan de heterogeniteit van de actoren, waarbij de actor 2 doortrapt handelt. Zijn strategie in de eerste ronde is een signaal, dat in de tweede ronde een focaal punt (meest logische keuze) schept voor de actor 1 2.
Vermeldens waard is ook de manier, waarop Umbhauer leerprocessen weergeeft (p.217-219). Hierbij spelen twee factoren een rol, te weten de wijziging van een actor-strategie, en de reactie-tijd van de andere actoren. Een strategie kan wijzigen, doordat een actor experimenteert, zich vergist, of wordt vervangen door een ander. Umbhauer beschouwt een organisatie van drie actoren, zoals is weergegeven in de figuur 1. De uitkomsten (u1, u2, u3) worden getoond in extensieve vorm. Elk van de drie actoren beschikt over twee strategieën, te weten n en j. De actor 1 handelt als eerste, daarna de actor 2, en tenslotte de actor 3. Stel dat de actor 1 kiest voor de strategie n. De figuur 1 laat zien, dat dan de uitkomsten onafhankelijk zijn van de strategieën van actoren 2 en 3. Zij hebben wel een voorkeur, maar die blijft onzichtbaar, en wordt daarom latent genoemd (p.219, 224). Stel dat ook zij kiezen voor de strategie n.
Stel vervolgens dat de strategie van de actor 1 muteert naar j. Daardoor krijgen de latente strategieën van de actoren 2 en 3 plotseling relevantie. De uitkomst verandert van (1, 1, 1) in (0, 4, 0). Hierdoor worden de actoren 1 en 3 benadeeld, en dat start een leerproces bij hen. Stel dat de actor 3 het snelst reageert. Hij wijzigt zijn strategie naar j, en krijgt daardoor u3=2. Dit benadeelt de actor 2, die nu ook wordt geprikkeld tot leren. Als in deze situatie (j, n, j) de actor 1 sneller reageert dan 2, dan zal hij weer overgaan op strategie n, waarmee de begin-toestand is hersteld. Als anderzijds de actor 2 sneller reageert, dan kiest hij strategie j, waarmee het maatschappelijke optimum (2, 2, 2) wordt bereikt. Merk op, dat in dit optimum de voorkeur van actor 3 weer latent wordt.
Romelaer heeft enige algemene kritiek op de speltheorie van Umbhauer, althans wanneer die wordt toegepast in de bestuurskunde. Hij meent, dat groepen of organisaties zelden bewust de strategieën van concurrenten door-rekenen (p.226). En hij vindt, dat de speltheorie onvoldoende rekening houdt met omgevings-factoren (p.225). Hij vindt het bedenkelijk, dat de speltheorie nauwelijks gedragingen in de practijk kan voorspellen (p.226). Hij verwijt Umbhauer, dat ze weinig zegt over coalitie-modellen in de coöperatieve speltheorie (p.229)3. En organisaties bevinden zich nooit echt in een (Nash) evenwicht (p.230). Hij zou willen, dat de speltheorie de werkelijkheid stiliseert. Per saldo slaagt het boek niet in de verzoening van de bestuurskunde en de speltheorie4.
Het boek Collective action and exchange (afgekort AE) van de econoom W.D. Ferguson geeft een beknopt maar interessant overzicht van enkele modellen van beleids-analyse5. Hij volgt de institutionele analyse van Elinor Ostrom (IAO). De actie arena heeft zeven soorten regels: van positie, toetreding (boundary), gezag, aggregatie, informatie, uitkomst, en armslag (scope) (p.296-297 in AE). Immers, de toetreding tot posities P moet worden geregeld. Het gezag verwijst naar de verdeling van macht R over de posities P. Aggregatie bepaalt de interferentie tussen de diverse actor-strategieën S. Volgens de bestuurskundige Scharpf bestaan de typen van aggregatie uit unilateralisme, onderhandelen, stemmen of bevelen6. De armslag definieert de mogelijke bereiken van materiële resultaten Q van de interacties. Soms is Q lastig meetbaar. De uitkomsten worden uitgedrukt als het netto actor-nut U. Merk op dat U = U(Q).
De zeven categorieën van regels zijn horizontaal (p.319). Maar de IAO brengt ook verticale lagen aan (p.293-295). Er is een hiërarchie van actie situaties, zodat elke actie situatie is genest of ingebed. Het hoogst in de hiërarchie is de meta-constitutie, gevolgd door de constitutie, de collectieve keuze, en de uitvoering. De meta-constitutie is het geheel van collectieve geschiedenis, cultuur en traditionele normen. De collectieve keuze bepaalt de procedures om regels op te leggen aan de uitvoering. De zeven types van regels zijn relevant voor elke laag. Bovendien worden de ervaringen op een lager niveau teruggekoppeld naar de hogere laag.
Interessant is ook de opvatting van Ferguson over de dynamiek van beleid. Het beleid kent lange perioden van stabiliteit en evenwicht, die nu en dan worden onderbroken door hervormingen. In de Engelse taal heet dit het punctuated equilibrium model (p.307). Het wordt toegeschreven aan de bestuurskundige Baumgartner. Ferguson verklaart de perioden van stabiliteit uit het pressie-coalitie model (advocacy coalition), dat is bedacht door Sabatier. Incidenteel zijn er kansrijke momenten voor nieuw beleid (windows of opportunity)7. Ferguson verklaart dit met het meer-stromen model van Kingdon.
De verklaring van Ferguson is essentieel hiërarchisch. Organisaties (corporate actors) bevinden zich op het micro-niveau. Op het meso-niveau zijn allerlei pressie-coalities actief, die er belang bij hebben om het bestaande beleid in stand te houden (p.307). Eventueel wordt het beleid incrementeel aangepast. Een coalitie behoort bij een sub-systeem van beleid (p.308), en is naar binnen gericht. Al deze sub-systemen worden overkoepeld door het macro-niveau. Nieuw beleid wordt gestart op dit niveau, waar zich de politiek en de media bevinden. Volgens het meer-stromen model moet men hier onderscheid maken tussen maatschappelijke problemen, beleid, en politiek (p.311). Problemen bereiken het niveau door terugkoppeling van onderen. Beleid verwijst naar de heersende ideeën. In kansrijke perioden kunnen deze drie domeinen samenkomen, en tezamen een thema op de beleids-agenda plaatsen. Er kan dan een kantelpunt worden overschreden8.
De niet-coöperatieve speltheorie toont aan, dat unilateraal handelen leidt tot (Nash) evenwichten, die niet efficiënt zijn. Ten einde het maatschappelijke optimum te bereiken, is samenwerking nodig, wat coördinatie en concertatie vereist. De groep van betrokken actoren formuleert tezamen een plan of beleid, dat de maatschappelijke problemen moet oplossen. Dit proces wordt beschreven als een beleids-cyclus9. Historisch is er waarde gehecht aan de zelf-organisatie van groepen. Katholieken noemen dat het beginsel van subsidiariteit, en protestanten spreken van de soevereiniteit in eigen kring. Het besluit is het resultaat van een onderhandeling. Aangezien elke actor een veto heeft, moet er consensus ontstaan. Actoren, die nadeel hebben van het besluit, kiezen voor de uittreding (exit) uit de groep. Ieder houdt zijn lot in eigen hand.
Een interessante beschouwing over zelf-organisatie is te vinden in Collective action and exchange (zie hoofdstuk 9). Zelf-organisatie vereist een interactie-oriëntatie van wederkerigheid (p.202 in AE). Immers, de verleiding is groot om de afgesproken verplichtingen niet na te komen, en zwart te rijden (free riding) op de inspanningen van de rest. Volgens Ferguson moet zelf-organisatie gepaard gaan met investeringen in maatschappelijk of sociaal kapitaal (p.203). De groep ontwikkelt collectieve normen van wenselijk gedrag10. Dit impliceert, dat maatschappelijke problemen worden vertaald in een gedeeld mentaal model. Trouwe lezers herkennen hierin het vertrouwens-model van de socioloog J.S. Coleman11. Ferguson koppelt het vertrouwen aan de reputatie van degene, die wordt vertrouwd. Een actor investeert in zijn reputatie om vertrouwen op te wekken.
De zelf-organisatie begint met de keuze voor een bepaalde oplossing van het probleem. Het besluit legt de verdeling van de kosten en baten over de actoren vast (p.207, 209). Maar de zelf-organisatie moet niet worden geïdealiseerd. Vertrouwen is voorwaardelijk, zodat er toch toezicht nodig is (p.202). En ondanks de consensus wordt het besluit toch bepaald door de machts-verhoudingen (p.212)12. Ferguson meent, dat collectief eigendom een extra prikkel kan geven tot samenwerking (p.216). Iedere actor moet dan een deel van de meerwaarde (het residu) ontvangen. Een eerdere column heeft laten zien, dat collectief eigendom toch problematisch is. Met name kan de waarde van het eigendom niet worden bepaald, en het is niet overdraagbaar (p.221). Daarom is Ferguson gedwongen om aan te nemen, dat veel van de actoren van het type homo sociologicus zijn (p.217). Die is bereid om opportunistisch gedrag af te straffen.
Ferguson wijst op de individuele voordelen van zelf-organisatie, die feitelijk voortkomen uit het lidmaatschap van de groep. Ieder participeert (voice), krijgt informatie, en wordt gesterkt in zijn identiteit (p.222). Er is collectief leren (p.223). Ferguson is enthousiast. Maar eerdere columns over de sociale psychologie hebben uitgelegd, dat groepen niet inherent een positief goed zijn. Ferguson geeft dat toe, en noemt enkele nadelen op. Zelf-organisatie kan hoge kosten hebben (p.226). Buitenstaanders hebben geen toegang tot het maatschappelijke kapitaal van de groep. Erger nog, de groep wentelt vaak haar kosten af op de rest (negatieve externaliteit) (p.228). Aangezien zelf-organisatie verloopt via onderhandelingen, is de interactie niet democratisch. Het besluit baseert op de materiële macht, en niet op de macht van de meerderheid (p.230). De meeste zelf-organisatie mist de religieuze moraal van een kerk of ander genootschap13.
Wellicht is het betoog in Collective action and exchange vooral interessant, omdat het een bevestiging is van eerdere columns in de Gazet. Uw columnist erkent de waarde van zelf-organisatie, waarin de actoren hun eigen lot besturen. In dit kader had Ferguson ook kunnen verwijzen naar de econoom F.A. (von) Hayek. Hayek benadrukt, dat kleine groepen toegang hebben tot veel relevante informatie. Juist die lokale informatie is essentieel voor het slagen van de collectieve activiteiten. Er ontstaat een spontane ordening. Anderzijds leidt de externe concertatie vaak tot onwerkbare regelingen. Overigens is de visie van Hayek nogal eenzijdig. Immers, er is een reële kans, dat de zelf-organisatie ontaardt. Daarom oordeelt de Franse antropoloog P. Bourdieu zelfs negatief over het sociale kapitaal14.
De voorgaande tekst verwijst terloops al naar enkele modellen van zelf-organisatie en vertrouwen, die zijn behandeld in de Gazet. Zij zijn een welkome aanvulling op het verhaal over sociaal kapitaal en vertrouwen. Een column beschrijft een slim model van gedrags-prikkels ten gevolge van collectief eigendom. In een andere column wordt het effect van wederkerigheid gemodelleerd. Enkele columns bespreken modellen, die vertrouwen verklaren uit het opbouwen van een reputatie15. Een column over de speltheorie geeft de Tit-for-tat strategie als voorbeeld. De actoren zijn wederkerig. Zulke strategieën werken enkel bij een duurzaam contact. Namelijk, het motief om een reputatie op te bouwen is rationeel, gericht op eigen belang. Rationeel vertrouwen loont. Dit functioneert ook nog bij interacties op de markt, waar de gedeelde moraal minimaal is16.
Ferguson besteedt geen aandacht aan het onvoorwaardelijke vertrouwen tussen actoren17. Er is een emotionele band, die de econoom P. Frijters omschrijft als toewijding (love). Coleman modelleert dit als een sociale ruil. Ook Fao meent, dat een ruil vaak emotionele elementen heeft. In de actor huist een emotional man. Scharpf noemt dit een interactie-oriëntie. Dit soort vertrouwen is een socio-psychologisch verschijnsel. De actoren kunnen een goede wil (bienveillance) tonen18. Goede wil is gericht op een individuele actor. Ook deze vorm van vertrouwen groeit dankzij de duurzaamheid van het contact. De actoren leren elkaar beter kennen. Emotioneel vertrouwen is meer een persoonlijke overtuiging dan een rationele afweging. In de practijk zal vertrouwen steeds een mengvorm zijn van rationaliteit en emoties. De emotionele factor past slecht in een model, en maakt daarom de uitkomsten van interacties minder voorspelbaar.
Men zou denken, dat de maatschappelijke of sociale psychologie veel studies heeft uitgevoerd naar vertrouwen. Maar dat valt tegen. Zij bestudeert vooral de vooroordelen tussen groepen. De groep vormt een cognitief stereotype van anderen19. Een stereotype doet denken aan een reputatie, al gebruiken psychologen dit woord niet. Het stereotype is zelf geen vooroordeel, maar kan er wel toe leiden. Namelijk, het veroorzaakt een affectieve reactie binnen de groep. De actor neigt er toe om de eigen groep positiever te beoordelen dan andere groepen (favouritism)20. Als de eigen groep goed presteert, dan wordt dit toegeschreven aan kwaliteiten, en niet aan de situatie21. Concurrentie tussen groepen bevordert het ontstaan van vooroordelen22. De klassenstrijd was dus niet zo een goed idee. Aldus leert de psychologie, dat er vaste patronen van gedrag zijn, die meer het gemak dienen dan de rationaliteit. Maar ze zijn lastig modelleerbaar23.
Ferguson meent, dat maatschappelijk kapitaal enkel verschilt van fysieke kapitaal-goederen, doordat het eigendom collectief is (p.206). Die opvatting getuigt van te veel optimisme. Immers, beschrijvingen van sociaal kapitaal moeten noodgedwongen inductief zijn. Deductieve modellen baseren gewoonlijk op een nuts-maximalisatie. Een recente column laat zien, dat zelfs dan het verwachte nut van de actoren een gecompliceerde gedaante kan hebben. Een model moet het aantal leidende motieven van de actoren (de actor-modellen) zoveel mogelijk beperken. Als bijvoorbeeld de emoties of de groeps-identiteit worden meegewogen in de nuts-functie, dan dreigen de uitkomsten van het model ongrijpbaar en louter subjectief te worden. Helaas lost Ferguson dit probleem niet op in zijn analyse van zelf-organisatie.
Diverse columns van de Gazet zijn gewijd aan de negatieve kant van sociaal kapitaal, bijvoorbeeld die over het communitarisme en over het maatschappelijk kapitaal. Wegens de groeps-dynamiek heeft een column kritiek geleverd op de pleidooien voor netwerk sturing, die eveneens zelf-organisatie verlangen24. Het is beslist nodig, dat de staat toezicht houdt, en de democratische wil (het algemeen belang) waarborgt25. Volgens de bestuurskundige F.W. Scharpf moeten de onderhandelingen plaats vinden in de "schaduw van de staat"26. Hij en E. Ostrom verdedigen allebei de combinatie van individuele vrijheid en centrale inkadering. Vanuit het communitaristische perspectief vindt men dezelfde idee bij Etzioni, in zijn Ik & Wij model.
Ferguson erkent de problemen en gebreken van zelf-organisatie, maar is er per saldo toch enthousiast over. Bij sommige wetenschappers, waaronder Hayek, gaat de waardering voor zelf-organisatie gepaard met een afkeer van centrale sturing. Zij stellen, dat de staat niet bij machte is om de informatie te verzamelen, die relevant is voor beleid. Bovendien zou het centrale gezag geen beleid kunnen doorzetten, omdat het onvoldoende macht heeft, en omdat er geen duidelijk algemeen belang zou bestaan. Sommige sociologen stellen, dat in het modernisme het vertrouwen in de democratische instituties (zoals de staat) afneemt27. Daardoor zou het persoonlijke contact weer belangrijker worden. Maar Ferguson meent, dat in het modernisme de interacties complex worden (p.236). Daarom stelt hij, dat centrale sturing wenselijk en onmisbaar is, zij het binnen zekere grenzen. Zij blinkt uit in het oplossen van tweede orde problemen (handhaving van regels).
Volgens Collective action and exchange vindt zelf-organisatie altijd plaats binnen een groter maatschappelijk kader. Daarbij moet allereerst worden gedacht aan de staat. Meer algemeen betekent dit, dat het bestuur gelaagd is. Wijkraden of winkeliers-verenigingen functioneren binnen de gemeente. De gemeente is ondergeschikt aan de nationale staat. En de staat moet gehoorzamen aan (con)federaties en aan internationale instituties. Er is een hiërarchie. Het gezag is genest (p.250). Ferguson noemt het hogere gezag een externe derde partij voor de zelf-organisatie op het lagere niveau (p.232). De zelf-organisatie heeft toegang tot de regels en instituties van het hogere gezag. Omgekeerd kan het hogere gezag zodanige regelingen aanbrengen, waardoor de succesvolle zelf-organisatie juist mogelijk wordt. Immers, het hogere gezag beschikt gewoonlijk over meer middelen dan de lagere organen (p.249).
Bijvoorbeeld kunnen collectieve acties een beroep doen op nationale wetgeving, die contracten afdwingbaar maakt (p.234). Het contract is een ondersteunende (auxiliary) transactie om het collectieve probleem op te lossen. De legitimiteit van het hogere gezag is het grootst, wanneer het een goede aansluiting heeft met de groepsregels28. Met andere woorden, de externe regels moeten het maatschappelijke kapitaal van de groep instand houden (p.236, 240). Anders is zelfs denkbaar, dat de groep de externe regels negeert (p.241). Als de lagere en hogere regels verenigbaar zijn, dan biedt de inbreng van de derde partij voordelen. Zij kan de maatschappij beter overzien dan de lokale groep (p.246-247, 252). Dat vereenvoudigt de coördinatie (p.243). Het hogere gezag kan toezien op de samenhang tussen alle wetgeving (p.244)29. En wegens schaalvoordelen zijn de kosten van de externe dwang relatief laag (p.240, 243).
Voorts mag worden verwacht, dat een hoger gezag minder vatbaar is voor pressie-groepen dan de lagere collectieven (p.246)30. Wegens al deze overwegingen meent Ferguson, dat de realisatie van het maatschappelijke optimum een gemengd systeem vereist, waarin zelf-organisatie wordt overkoepeld door externe wetgeving van een derde partij (p.245). Het lagere gezag opereert in de schaduw van het hogere gezag. Natuurlijk biedt de externe inbreng geen garantie voor succes van de zelf-organisatie. De derde partij kan corrupt zijn. Maar men mag hopen, dat de integriteit toeneemt, naarmate het gezag hoger is. Algemeen moeten de problemen worden opgelost door het meest geschikte bestuurlijke laag (p.251)31.
Zijdelings zij opgemerkt, dat Ferguson de combinatie van zelf-organisatie en handhaving door de derde partij aanduidt als poly-centrisme (p.235, 240, 249). Hij neemt dit begrip over van Vincent Ostrom. Hiermee wordt bedoeld, dat organisaties in iedere bestuurslaag een zekere beleids-vrijheid hebben. De diverse actoren zijn wederzijds afhankelijk, omdat de middelen voor beleid gespreid zijn. Een bekend voorbeeld is de band tussen beleids-formulering en uitvoering. De uitvoering moet vanaf het begin worden betrokken bij de beleids-formulering. Des al niettemin bestaat er wel degelijk een hiërarchische verhouding tussen de diverse bestuurs-lagen (p.252). Uw columnist vindt de term polycentrisme minder gelukkig, omdat sommige bestuurskundigen (bijvoorbeeld in de Rotterdamse school van netwerk-sturing) de term opvatten als een systeem zonder hiërarchie. Dat wekt verwarring.
De centrale positie van de staat als een derde regelgever kan goed worden geïllustreerd aan de hand van de speltheorie32. Beschouw een maatschappij, bestaande uit twee actoren. Bij aanvang van het spel beschikken de beide actoren over een nut uk=3, met k=1 of 2. Stel dat de actor 1 een goed wil produceren. Het goed levert hem b=2 aan baten, en kost c=1 aan inspanning. Daarom is het netto nut van het goed u1=1. Maar daarna loopt hij het risico, dat de actor 2 zijn goed zal inpikken. In dat geval zouden de baten b=2 overgaan van de actor 1 naar de actor 2. Als de actor 1 deze onteigening niet kan verhinderen, dan zal hij afzien van de productie. Deze strategie is maatschappelijk sub-optimaal, omdat de productie meerwaarde schept. Meerwaarde vergroot het maatschappelijke nut W = Σk=12 uk. In een dergelijke situatie kan de staat als een derde partij de welvaart bevorderen door het private eigendoms-recht op te leggen.
De zonet geschetste situatie kan worden weergegeven als een spel in extensieve vorm. Zie de figuur 2. De staat is als eerste aan zet. Hij heeft twee strategieën: het recht van privaat eigendom en diens handhaving kunnen worden vastgelegd in de grondwet (ja = j), of niet (nee = n). De besluitvorming van de staat streeft naar de maximalisatie van het maatschappelijke nut W. Als de strategie j wordt gekozen, dan wordt het inpikken van eigendom ongedaan gemaakt, en bovendien krijgt de overtreder een straf ter waarde van p=2. Ongeacht de staat behouden de actoren 1 en 2 hun strategieën, te weten het goed produceren (j) of niet (n) voor de actor 1, en het goed inpikken (j, indien geproduceerd) of niet (n) voor de actor 2. Deze strategieën bevinden zich op het uitvoerende niveau, dus in een laag beneden het grondwettelijk overleg. In totaal zijn er dus 2×2×2 = 8 combinaties van strategieën, en even zovele uitkomsten.
De onderste drie regels van de figuur 2 tonen de uitkomsten als vector (W, u1, u2). Het spel heeft een deelspel-volkomen Nash evenwicht (subgame perfect equilibrium)33. Dit is een evenwicht voor het totale spel, maar ook voor alle deelspellen. De deelspellen voltrekken zich op de lagere niveau's in de figuur 2, dus bij de actoren 1 en 2. Deelspellen zijn als het ware ingebed in het totale spel34. Het Nash evenwicht kan worden gevonden door achterwaartse (backward) inductie, beginnend vanaf het laagste niveau. Als de actor 1 niets produceert, dan kan de actor 2 niets inpikken. Als de actor 1 wel produceert, dan is zonder eigendoms-recht inpikken de beste strategie voor de actor 2. Met eigendoms-recht is juist niet inpikken de beste strategie, wegens de boete. Beschouw vervolgens de actor 1. Zonder eigendoms-recht loont produceren niet, maar met eigendom wel.
Beschouw tenslotte de staat. Zonder eigendoms-recht ontstaat het deelspel (n, n), met W=6. Met eigendoms-recht ontstaat het deelspel (j, n), met W=7. Dus de staat heeft als beste strategie het invoeren van het eigendoms-recht. Kennelijk is het deelspel-volkomen evenwicht gelijk aan (j, j, n). Dankzij de staats-interventie is het maatschappelijke nut verhoogd met 1, te weten de productie. Er is maatschappelijke efficiëntie. Bovendien laat het zojuist geschetste spel zien, dat de markt is ingebed door maatschappelijke instituties. In die zin is het ook een interessante toepassing van het actor-gerichte institutionalisme (AGI). Het model bevestigt hiermee algemene wijsheden, maar op een herkenbare manier, door de concrete interacties te analyseren. De introductie van het eigendoms-recht is een voorbeeld van het ontwerpen van een maatschappelijk mechanisme (social mechanism design)35. De institutie genereert de gewenste individuele prikkels.
De lezer dient zich bewust te zijn, dat het model een abstractie is. Bijvoorbeeld baseert de welvaarts-functie W op het utilitarisme. De functie W definieert de moraal van de maatschappelijke verdeling. Sommigen verkiezen wellicht een andere moraal, die inpikken rechtvaardigt. Dit zou het geval kunnen zijn, wanneer de actor 2 beschikt over een democratische meerderheid. Merk op, dat W het algemeen belang definieert. Wanneer men ontkent, dat het algemeen belang objectief kenbaar is (zoals het postmodernisme doet), dan kan de staats-interventie worden afgekeurd. Er kan dan een voorkeur zijn om het collectieve actie probleem op te lossen via zelf-organisatie, zoals onderhandelingen in een netwerk. De uitkomst uk wordt dan bepaald door het overleg van de actoren 1 en 2, waarbij de pogingen om elkaar te overtuigen moeten leiden tot een mentale convergentie. Uw columnist is hier niet weg van.
De aard van de geproduceerde goederen bepaalt, of een groep in staat is tot zelf-organisatie. Diverse columns hebben laten zien, dat zelf-organisatie niet aantrekkelijk is, wanneer de betreffende groep een zuiver publiek goed produceert. Immers, in die situatie levert zwart rijden meer nut op. Een volgende paragraaf zal dit fenomeen nogmaals illustreren, nu met een coalitie model, dus wat anders dan voorheen is gepresenteerd. Natuurlijk is dit model een abstractie. In werkelijkheid is vaak toch exclusie van consumptie mogelijk. Anderzijds maakt wegens de aggregatie technologie een actor soms kosten, die geen baten opleveren. Zelf-organisatie is zeker mogelijk, wanneer de groep een clubgoed produceert. Een volgende paragraaf zal dit illustreren aan de hand van een netwerk model. De beide modellen laten bovendien nogmaals zien, dat een actor het strategische gedrag in de actie arena kan doorrekenen.
Een recente column beschrijft de productie van publieke goederen in een maatschappij met vele actoren, zeg n in aantal. Elke actor moet kiezen tussen bijdragen (strategie s') of afzijdig blijven (strategie s''). Een andere column constateert, dat zulke keuzes gepaard kunnen gaan met de vorming van coalities. Als een maatschappij of systeem wordt verdeeld in coalities, dan spreekt men van een partitie P. Dan is de maatschappij N de vereniging van coalities Cj (j=1, ..., J, met J≤n), die onderling geen actoren gemeen hebben. Gegeven de twee strategieën s' en s'' ligt de partitie {{C}, {N\C}} voor de hand. De maatschappij splitst in mensen van het type homo politicus en homo economicus. Maar deze splitsing is niet de enige mogelijkheid. De huidige paragraaf onderzoekt meer gecompliceerde partities36. Aangezien het actor-model in deze analyse de homo economicus is, kunnen de coalities natuurlijk niet stabiel zijn. Het opportunisme domineert.
Beschouw een systeem met n=5 actoren. De actoren zijn anoniem, zodat er symmetrie is in al hun individuele kenmerken. Stel de individuele baten van het publieke goed zijn b=3, en de kosten zijn c=7. Als de actoren unilateraal handelen, dan wordt het goed niet aangeboden. Toch zou het goed al een positief netto nut uk=2 geven aan de actor k, wanneer hij bijdraagt in een coalitie met m=3 leden. Algemener is uk = m×b − c, wanneer k zelf bijdraagt. Het loont dus om een coalitie van m≥3 te vormen, waarin alle leden zich verplichten tot bijdragen. Maar buitenstaanders hebben geen kosten c, en wegens de niet-rivaliteit van het goed kunnen zij zwart rijden (free riding) op de inspanning van de coalitie. De opbrengsten van de coalities Cj in een gegeven partitie P worden gegeven door de coalitie functie ρ(P, Cj). Duidt nu de coalities aan als Cm, waarbij m het aantal leden van de coalitie is. Dan geeft de tabel 2 de waarden van de coalitie functie ρ.
partitie P | partitie waarde ρ(P, C) |
---|---|
C5 = N | 40 |
C4, C1 | 20, 12 |
C3, C2 | 6, 18 |
C3, C1, C1 | 6, 9, 9 |
C2, C2, C1 | 0, 0, 0 |
C2, C1, C1, C1 | 0, 0, 0, 0 |
C1, C1, C1, C1, C1 | 0, 0, 0, 0, 0 |
In de tabel 2 is C1 de individuele actor. De vereniging van twee C1 tot één C2 loont niet, omdat de actoren hier nulspelers zijn. Vanaf C3 zou samenwerken s' de rationele strategie van de coalitie-leden zijn, indien exclusie van het goed mogelijk was. De figuur 3 toont het individuele nut uk als functie van m, voor de leden in Cm en voor de buitenstaanders N\Cm. De trouwe lezer herkent hierin het fenomeen, dat zwart rijden (s'') meer loont dan bijdragen (s'). Beneden m=3 geeft de strategie s' een negatief nut. De strategie s' wordt dan irrationeel, zodat in de figuur 1 voor dit m-domein uk(s'') = 0 is verondersteld. Samenwerking wordt pas overwogen, wanneer de drempel m=3 is bereikt. Maatschappelijk gezien is de triviale partitie C5 de optimale keuze, want daar is W = Σk=15 uk maximaal. Merk op, dat de partitie functie niets zegt over de verdeling binnen een coalitie.
Dankzij de partitie functie ρ(P, Cm) kan nu de stabiliteit van het systeem N worden onderzocht voor de diverse partities P in de tabel 2. De figuur 3 laat zien, dat coalities Cm met m>3 instabiel zijn, omdat uittreding loont voor een actor k. Helaas bestaat er verder geen eenvoudig recept voor de analyse. Men moet elke partitie afzonderlijk onderzoeken. Het optimum met m=5, de triviale partitie, is duidelijk niet stabiel, omdat een actor k zijn nut kan verbeteren door uittreding. Dat geeft hem uk=12. Aangezien de nucleolus voor deze partitie gelijk is aan uk=8, heeft C1 een nuts-overschot van e(un, {N}, C1) = 4. Maar ook de partitie {C4, C1} is instabiel. Aangezien de nucleolus gelijk is aan (5, 5, 5, 5, 12), kan C1 nog steeds putten uit een nuts-overschot van e(un, {C4, C1}, C1) = 4.
Beschouw vervolgens de partitie {C3, C1, C1}. Men zou denken, dat deze stabiel is. Echter, de leden van de coalitie C3 hebben er baat bij om uit te treden. Zij verlagen daarmee hun eigen nut naar uk=0. Maar tevens kunnen zij rationeel verwachten, dat de anderen vervolgens weer een coalitie C3 zullen vormen37. Daarmee hebben zij uitzicht op uk = 9 in plaats van uk=2. Met andere woorden, er treden cycli op. De partitie is stabiel qua vorm, maar de actoren wisselen voortdurend van coalitie. Dit heet ω-stabiliteit38. En tenslotte, partities die enkel bestaan uit C1 en C2 zijn instabiel, omdat de vorming van C3 loont. Aldus heeft geen enkele partitie in de tabel 2 een kern.
Uw columnist vindt dit model toch wat problematisch. Aangezien alle actoren liever lid zijn van C1 dan van C3, kan de vorming van C3 lang op zich laten wachten. In feite is dit een mengvorm van de coöperatieve en niet-coöperatieve speltheorie. Actoren kunnen na onderling overleg een coalitie vormen, waarbij zij hun verplichtingen vastleggen in een contract. Maar toch hebben ze daarna nog steeds de optie om hun coalitie te verlaten. Wegens deze mengvorm ontstaat er enige hoop, dat de actoren althans soms en tijdelijk zullen samenwerken. Ze ontsnappen even aan het gevangenen-dilemma.
Soms wil men niet enkel de partitie bestuderen, maar ook de bijbehorende netwerken. Immers, de netwerk-positie van een actor k in zijn coalitie bepaalt mede diens macht. Recente columns hebben het belang van netwerken geïllustreerd voor het unanimiteits-spel, voor kabinets-formaties, en voor de BPFN allocatie regel. Het is lastig om de vorm van netwerken te verklaren. Bijvoorbeeld, tijdens kabinets-formaties oefenen ideologische voorkeuren, bestuurbaarheid, en het signaal van de kiezers allemaal invloed uit op de vorm. De huidige paragraaf presenteert het afstands-gebaseerde nutsmodel (distance-based utility model). Het model is ontleend aan het boek Social and economic networks (afgekort SN) van de econoom M.O. Jackson39. Zij λ het netwerk. Dan berekent dit model het nut van de actor k als
(1) uk(λ) = -dk(λ) × c + Σj≠k b(lkj(λ))
In de formule 1 is dk de graad van de actor k in het netwerk λ, dus zijn aantal directe contacten in het netwerk. En lkj is de afstand tussen de actoren k en j, geteld als het aantal tussenliggende contacten. De functie b drukt de baten uit van het contact tussen k en j. Gewoonlijk wordt verondersteld, dat de baten afnemen, naarmate de relatie afstandelijker is40. Wiskundig is dat ∂b/∂l < 0. De kosten om een direct contact te onderhouden zijn c. De sommatie over j loopt van 1 tot n, waarbij k wordt overgeslagen (tenzij men b(0)=0 wil nemen). Merk op, dat er volgens de formule 1 positieve externaliteiten zijn. Elke actor profiteert indirect mee van de contacten, die zijn directe contacten hebben.
Hoewel de formule 1 een logische indruk maakt, is zij niet altijd bruikbaar. Bijvoorbeeld, bij zuiver publieke goederen behoren de zwart-rijders tot het maatschappelijk netwerk. Maar hun kosten zijn nul, en hun baten hangen niet af van de afstand tot de diverse actoren. Een interessante toepassing van het afstands-gebaseerde nutsmodel is echter het clubgoed. Stel bijvoorbeeld, dat vier provincies tezamen een commissie (of club) vormen om informatie uit te wisselen over beleids-problemen. Hier mag worden verwacht, dat de uitwisseling beter verloopt, naarmate het contact inniger is. Dan worden zowel het aantal contacten dk als de positie in het netwerk relevant. De figuur 4 toont de zes mogelijke netwerken λj, die de vier provincies kunnen vormen in hun commissie. De zwarte punten stellen de actoren voor, en de rode lijnen zijn hun directe contacten. Het aantal paar-contacten varieert van 3 tot 6.
De formule 1 wordt simpeler, wanneer men aanneemt dat b(lkj) = βl(kj), waarbij β een constante is, die gelijk is aan b(1) (zie p.15 in SN). Neem voorts aan, dat geldt 0<β<1, zodat de baten inderdaad afnemen met de afstand. Definieer het directe netto nut van een contact als δ = β − c. De tabel 3 beschrijft nu de eigenschappen van de zes netwerken in de figuur 4. Getoond wordt het nut uk per provincie, genummerd van boven naar beneden en van links naar rechts in het netwerk. Ook het totale nut W = Σk=14 uk van de club is vermeld. De aanduiding van het type is afkomstig van de sociologische groepstheorie41. De daarvan afwijkende aanduiding tussen haakjes is gebruikelijk in de sociale netwerk analyse (SNA).
λ1 | λ2 | λ3 | λ4 | λ5 | λ6 | |
---|---|---|---|---|---|---|
type | ketting | wiel (ster) | cirkel (wiel) | vlieger | streep | comcon |
aantal contacten | 3 | 3 | 4 | 4 | 5 | 6 |
u actor 1 | δ+β²+β³ | δ+2×β² | 2×δ+β² | δ+2×β² | 2×δ+β² | 3×δ |
u actor 2 | 2×δ+β² | 3×δ | 2×δ+β² | 3×δ | 3×δ | 3×δ |
u actor 3 | 2×δ+β² | δ+2×β² | 2×δ+β² | 2×δ+β² | 3×δ | 3×δ |
u actor 4 | δ+β²+β³ | δ+2×β² | 2×δ+β² | 2×δ+β² | 2×δ+β² | 3×δ |
W totaal | 6×δ+4×β²+2×β³ | 6×δ+6×β² | 8×δ+4×β² | 8×δ+4×β² | 10×δ+2×β² | 12×δ |
Men kan aantonen, dat zich geen netwerk vormt, wanneer geldt δ < (1 − ½×n) × β² (p.160-161). Voor n=4 heeft inderdaad bij deze negatieve δ altijd wel een actor een negatief nut. Maar het betekent in het bijzonder, dat bij een negatief netto nut zich geen paar-netwerk (met n=2) vormt. Kennelijk moeten netwerken dan ontstaan uit een multilateraal overleg. Bij grotere netwerken kunnen klaarblijkelijk de externe effecten compenseren voor het directe nadeel. Anderzijds, als geldt δ>β², dan worden alle mogelijke directe contacten inderdaad gerealiseerd (p.160)42. Men kan dit ook aflezen in de tabel 3, waar het nut uk = 3×δ optimaal wordt. Dan vormen de vier provincies het netwerk λ6.
Interessant is het geval (1 − ½×n) × β < δ < β², dus hier -β < δ < β². In dit geval heeft het wiel (ster) netwerk de grootste W waarde, en is daarom maatschappelijk (bezien vanuit de commissie) het meest efficiënt. Voorts kan men nu de paarsgewijze stabiliteit van de netwerken onderzoeken (p.156 in SN). Een contact is enkel stabiel, zolang beide actoren het accepteren. Het contact is bilateraal (p.16). Geen enkele actor wil unilateraal een contact verbreken, of tezamen met een andere actor een extra contact leggen. Bijvoorbeeld toont de tabel 3 aan, dat de actoren in een comcon-netwerk een contact zullen verbreken, omdat het streep-netwerk hen meer netto nut oplevert. Maar in het streep-netwerk zal nogmaals een contact worden verbroken om het vlieger- of cirkel-netwerk te bereiken. Tenslotte zal het vlieger-netwerk veranderen in het wiel-netwerk43.
Aldus wordt opnieuw duidelijk, dat unilaterale besluiten een obstakel zijn naar maatschappelijke efficiëntie. Immers, de actor, die in het wiel-netwerk λ2 de spil vormt, heeft een relatief laag nut. Daarom moeten de actoren vermijden in de spil-positie te belanden, wanneer zij het comcon-netwerk versimpelen en slanker maken44. De actor in de spilpositie van λ2 kan zijn situatie niet meer unilateraal verbeteren. Het wiel-netwerk is Pareto optimaal, evenals trouwens het ketting- en cirkel-netwerk (vergelijk p.158). De spil-provincie kan zelfs niet een betere coalitie vormen met een andere actor, op de manier van de voorgaande paragraaf over het publieke goed. Haar enige hoop is om een herverdeling voor te stellen in de club, waardoor iedereen uk=W/4 krijgt. Maar het is rationeel voor de andere provincies om dit voorstel te verwerpen.
De redenatie van zonet toont een gebrek van het afstands-gebaseerde nutsmodel. Immers, de spil-positie zou juist een extra macht moeten geven aan de provincie. Dit blijkt bijvoorbeeld uit een voorgaande column, waarin de de Myerson waarde μk(ν, λj) wordt berekend voor een unanimiteits-spel. Nog duidelijker is dit in de column over de algemene Nash oplossing van onderhandelen in een netwerk. Dit model van onderhandelen ziet de contacten als een kans voor voordelige ruil. Volgens de Nash oplossing kan de spil-actor zich zelfs 90% van alle toegevoegde waarde in het netwerk toe-ëigenen! Men kan natuurlijk tegenwerpen, dat het clubgoed van de provincies (te weten, de informatie) niet wordt geruild, maar aanwezig is als een extern effect45. Dan resteert het argument van Myerson, dat de spil-provincie de externaliteit doorgeeft, en zo waarde toevoegt. Daarom kan zij dreigen het netwerk te verlaten, tenzij zij side payments ontvangt (p.17)
Het boek van Jackson onderkent inderdaad dit probleem. Het veronderstelt, dat nut overdraagbaar is, en definieert dan de inkomens-overdracht als wk(λ) = uk(λ) + tk(λ) (p.174). Daarbij moet zijn voldaan aan Σk=1n tk = 0, althans zolang het netwerk λ niet extern wordt gesubsidieerd. Dankzij de overdracht verandert het nut van de actor k in wk. In het simpelste geval worden de tk bepaald door middel van onderhandelingen tussen de n actoren. Maar er zou ook een staats-interventie kunnen zijn, waarbij de herverdeling verloopt via belastingen en uitkeringen. De overdracht kan zijn gebaseerd op principes van billijkheid, zoals gelijke behandeling in gelijke situaties (anonimiteit of symmetrie)46.
Maar de inclusie van overdrachten maakt de formule 1 nog allerminst universeel geldig. Vaak worden de baten bk voor de actor k niet veroorzaakt door de directe naburen in het netwerk, maar door ver afgelegen (indirecte) contacten. Denk aan innovaties, of aan bestuurlijke wetgeving. Ook bedreigingen komen vaak van ver (oorlog, ziekten, en dergelijke)47. En de kosten c van het contact zullen vaak verschillend zijn voor elke actor. Beschouw bijvoorbeeld het wiel-netwerk in de column over de kabinets-formatie. Het CDA bezet nogal eens de spil-positie. En die blijkt politiek uiterst nuttig te zijn48. Kennelijk is de toepasbaarheid van het afstands-gebaseerde nutsmodel beperkt. Zijn charme zit vooral in de eenvoud van de formule 1, die het nut uk simpel berekenbaar maakt, zonder de noodzaak om de waardes van allerlei coalities te inventariseren.
Ook na vijf columns over speltheorie en bestuurskunde blijven de baten van de kruis-bestuiving ongewis. De speltheorie is enkel in uitzonderlijke situaties in staat om de werkelijkheid te voorspellen. Voorlopig ziet uw columnist de voornaamste winst van de speltheorie in de compacte weergave van complexe bestuurlijke situaties. Zie het inpik-spel van zonet, of het spel van de homo sociologicus, of het spel van de staat en de vakbeweging.