Economen raken steeds meer geïnteresseerd in de maatschappelijke evolutie, die wordt gedreven door de interacties tussen belangengroepen. De huidige column bespreekt kort enkele essentiële aspecten van de evolutie, zoals de groepsdynamiek en de zoektocht naar een goede beleidsmix. Men streeft naar een maatschappelijk evenwicht. Ter illustratie volgt een uitleg van de coördinatie-problemen tussen groepen, het zwartrijden (free riding) binnen een groep, en de toepassing van de speltheorie en populatiemodellen op de evolutie.
Binnen de nieuwe institutionele economie (afgekort NIE) is het populair om de maatschappelijke ontwikkeling te beschrijven als een evolutie van instituties. Instituties worden onderhouden door collectieven, en zijn daarom het onderwerp van studie voor de maatschappelijke psychologie en de sociologie. De instituties ontstaan op het micro- en meso-niveau van de maatschappij, in de kleine en grote groepen. Men onderscheidt de commerciële groepen, die tot de marktsector worden gerekend, en de non-profit groepen, die wel worden aangeduid als het maatschappelijke middenveld (civil society)1. De maatschappij is pluralistisch. Veel van die groepen vullen elkaar aan in een netwerk, en versterken elkaar.
Echter onvermijdelijk raken er ook groepen in conflict, wegens hun verschillende doelen en instituties2. Dit heeft psychologische redenen3. Enerzijds is er binnen de groep is een collectieve druk op de individu om samen te werken en zich aan te passen. Daardoor wordt de groep homogeen van samenstelling. Men vertrouwt elkaar. Anderzijds zijn de groepen onderling geneigd om te wedijveren. Een groep wil zich afgrenzen van de andere groepen. Gewoonlijk hanteert de groep stereotypen en zelfs vooroordelen jegens de buitenwereld. Groepen jagen hun eigenbelang na (rente zoekend gedrag). Soms proberen groepen zelfs om elkaar te verdringen. Denk aan religies, of politieke ideologieën4. Dien ten gevolge leiden groepsacties tot positieve of negatieve externe effecten voor hun buitenwereld. De externaliteiten worden wel een publiek goed genoemd5.
Het bemiddelen tussen al die groepsbelangen is een belangrijke bestaansreden van de nationale staat. De vrijwillige onderwerping van de groepen aan de staat kan worden opgevat als het afsluiten van een maatschappelijk contract. De wedijver tussen groepen wordt beteugeld door de nationale grondwet. Natuurlijk bestaat het bestuur van de staat zelf ook weer uit allerlei groepen. Kennelijk worden de instituties onderhouden en vernieuwd door een mix van het middenveld, de markt en de staat. De samenstelling van de mix verandert voortdurend in een dynamisch proces. Bijvoorbeeld in de decennia direct na de Tweede Wereldoorlog werd regulering door de staat populair, maar sinds de jaren 80 van de vorige eeuw groeit de waardering voor marktwerking weer. De NIE bestudeert twee aspecten in de collectieve besluitvorming: (a) de rationele overwegingen, die vaak baseren op een nuts-maximalisatie; (b) de morele standpunten, die volgen uit de groeps-identiteit.
Een jaar terug besteedde de Gazet aandacht aan de theorie van belangengroepen, in het kader van rente zoeken. Gewoonlijk dient rente zoeken het eigenbelang. Het is natuurlijk goed denkbaar, dat het eigenbelang van een groep samenvalt met het algemeen belang. De lobby voor een doel veroorzaakt kosten, die moeten worden gedekt door de leden van de groep. Daarom is het belangrijk, dat de groep haar leden motiveert. Daardoor krijgt de groep tenminste enige duurzaamheid6. De groepsmoraal of ideologie moet met name sterk zijn, indien het nagestreefde doel meer een algemeen belang is dan een eigenbelang. De groep kan proberen om haar kosten te verminderen door een netwerk op te bouwen met andere groepen. Hierdoor neemt het aantal persoonlijke relaties toe, zodat de leden affectief worden gebonden aan hun groep7. Naarmate de moraal en de affectie meer domineren (type b), geeft een model van nuts-maximalisatie (type a) minder inzicht.
Voorts moet de belangengroep een strategie of gedragswijze kiezen voor haar acties. De strategie is de wijze, waarop de groep haar middelen inzet voor het doel. Veel voorkomende methoden zijn overtuigen, argumenteren, demonstreren, procederen, en bestrijden8. In deze volgorde wordt de groepsmacht toenemend ingezet voor dwang. Naarmate meer macht moet worden aangewend, is er kennelijk minder maatschappelijk draagvlak voor het doel of de verandering. Het rente zoeken veroorzaakt dan hoge kosten voor de maatschappij als geheel9.
Belangengroepen kunnen hun activiteiten expliciet richten op de vernieuwing van de maatschappelijke instituties. In strict economische zin zijn hun activiteiten niet productief. Aangezien de belangengroep wel kosten c maakt, daalt per saldo de maatschappelijke welvaart. Daar staat tegenover, dat dankzij de institutionele innovatie de maatschappij doelmatiger kan worden. Dit was bijvoorbeeld de (misplaatste) verwachting van de vroege socialisten. De actie geeft aan de pressiegroep een verwacht nut E(u) = E(π) − c, waarin E(π) de verwachte waarde van de doel-realisatie is (E van expected). De groep zal alleen actie voeren, indien geldt E(u) ≥ 0. Dit is een zuiver rationele overweging (type (a)), al hangt de waarde van E(π) natuurlijk wel af van de morele bevlogenheid (type (b)). Bij een onderlinge strijd tussen pressiegroepen kan worden gesproken een toernooi, met als hoofdprijs het recht om de eigen instituties op te leggen aan de maatschappij.
De econoom Olson vreest, dat allerlei kleine pressiegroepen verzeild zullen raken in een eindeloze strijd, die de welvaart leegzuigt. Het ontaarde pluralisme veroorzaakt een wildgroei van instituties. Alleen een sterke staat zou het algemeen belang (de publieke goederen) kunnen handhaven. Daarentegen verwacht de econoom Becker, dat de activiteiten van pressiegroepen elkaar compenseren door macht en tegenmacht. Bovendien oefenen neutrale organisaties, zoals de media en de wetenschap, een matigende invloed uit. De argumenten van Olson en Becker bevatten allebei een kern van waarheid10. In dit kader zij nog eens herinnerd aan het debat over het maatschappelijke kapitaal. De socioloog Putnam prijst dit aan, maar anderen wijzen op de bijkomende afschotting en exclusie. Evenzo kan corporatisme de harmonie bevorderen, maar ook leiden tot politieke patposities.
Ook intern kan de belangengroep ontaarden. Sommige groepsleden zijn geneigd om hun eigen kostenbijdrage aan de groepsactie te verminderen (zwartrijden). Dat vergroot hun eigen nut, want zij profiteren wèl van E(π) 11. Zwartrijden gebeurt vooral, wanneer het lid meent, dat zijn individuele kostenbijdrage aan de actie onbetekenend is voor het realiseren van π. De NIE schenkt aandacht aan zulk parasitair gedrag, omdat het de institutionele evolutie afremt. De Gazet heeft allerlei speciale gevallen van dit fenomeen ter sprake gebracht. Anderzijds zijn er goede redenen om juist wèl bij te dragen12. Beschouw twee strijdende groepen (j = 1, 2), die ieder hun eigen doel πj nastreven. In beginsel zijn π1 en π2 verschillend. Elke groep j heeft een fonds cj om haar lobby te bekostigen. Zij pj de kans, dat de groep j haar eigen doel realiseert. Veronderstel, dat de lobby effect heeft. Dan moet er gelden ∂pj/∂cj > 0 (zie figuur 1). Logisch is ook ∂p1/∂c2 < 0 en ∂p2/∂c1 < 0.
Beschouw nu een individu k. Diens nutsfunctie is uk(π). Daarom kan de optimale π* van k afwijken van de groepsdoelen. Elke belangengroep j wil graag de individu k motiveren om zich aan te sluiten. Immers, k kan een bijdrage leveren aan het groepsfonds cj van beschikbare middelen. De groep j wordt aantrekkelijker voor k, naarmate j haar doel πj laat naderen tot π* van k. Tenzij j orthodox is in de leer, zal zij πj zodanig aanpassen, dat veel leden worden geworven. Daarmee kan j zorgen voor voldoende cj, althans in vergelijking met de middelen, waarover de concurrerende groep beschikt. In formule wordt dit πj = πj(c1, c2), met j = 1 of 2. Dit model heeft een verrassende consequentie. Namelijk, de individu k beseft nu, dat hij het doel van de groepen kan beïnvloeden door zelf lid te worden. Dat geldt extra, wanneer hij veel zal doneren. Zijn nut wordt uk(πj(c1, c2)). De individu k kan zijn eigen nutsopbrengst enigszins sturen via donaties13.
In de columns over rente zoeken, soms in combinatie met een toernooi, worden enkel modellen behandeld van een strijd tussen twee belangengroepen of individuen. In die situaties is steeds de beste strategie van elke groep duidelijk. Soms bepaalt het toeval, wie de strijd zal winnen, maar de verwachte uitkomst is dan toch bekend. De politicoloog P.C. Ordeshook beschrijft in zijn boek Game theory and political theory (afgekort GP) een strijd tussen drie belangengroepen, waarin geen sprake is van een natuurlijk evenwicht14. Elke groep j heeft haar eigen project, dat zij wil realiseren (bijvoorbeeld een institutionele verandering). Elk project veroorzaakt bij uitvoering maatschappelijke kosten c, die gelijk worden verdeeld over de drie groepen (dus c/3 per groep). Als een project wordt gerealiseerd, dan heeft de bijbehorende groep baten ter waarde van π, terwijl het niets oplevert voor de overige twee groepen.
Aldus moet er worden besloten over drie projecten. Elke groep voert een lobby om goedkeuring te krijgen voor zijn eigen project, en daarnaast twee lobby's om een afwijzing te krijgen voor de overige projecten. Zij de index van het eigen project ν=j. Dan stelt de groep j voor haar drie lobby's middelen of fondsen beschikbaar ter grootte van kν(j), met ν = 1, 2 en 3. Dit wordt de strategie gj genoemd van de groep15. De drie groepen besteden tezamen een som κ(j) = Σj=13 kν(j) om het besluit over het project ν te beïnvloeden. Veronderstel dat de kans op goedkeuring voor het project ν wordt gegeven door pν = kν(ν)/κν. Dat wil zeggen, de kans op goedkeuring wordt bepaald door de middelen van de vóór- lobby van de groep j=ν, in verhouding tot de middelen van de tegen-campagne. Nu kan het verwachte nut van de groep j=1 worden berekend uit E(u) = E(π) − E(c), dat hier wordt:
(1) E(u1) = p1 × (π − c/3) − Σν=23 pν × c/3
Net zulke formules gelden voor E(u2) en E(u3). Men ziet hier duidelijk, dat het project van elke groep 2×c/3 van de kosten afwentelt op de maatschappij. Stel dat de groepen j beschikken over gelijke begrotingen β = Σν=13 kν(j). Men kan aantonen, dat in een dergelijke situatie tenminste één evenwicht bestaat (zie p.217 in GP). Dat wil zeggen, er is minstens één collectie van strategieën of gedragingen {g1, g2, g3}, die leidt tot een stabiel verwacht besluit over de drie projecten. Dit evenwicht kan symbolisch worden voorgesteld als {g1*, g2*, g3*}, en is een soort stilzwijgend maatschappelijk contract. Nu is het met enig rekenwerk mogelijk om de waarde van de bijbehorende pν* te bepalen, en vervolgens ook van E(uj)*. Namelijk, veronderstel dat twee groepen al hun gj* hebben bepaald. Dan moet de overgebleven groep zijn gj optimaal maken. Stel gemaks halve, dat dit j=1 is. Men kan het optimum berekenen met behulp van de Lagrangiaan:
(2) L = E(u1(k(1), k(2)*, k(3)*)) − λ1 × (Σν=13 kν(1) − β)
In de formule 2 is de vector k(j) een beknopte schrijfwijze voor zijn componenten kν(j). Deze vector is simpelweg een alternatieve schrijfwijze voor de strategie gj. Het verwachte nut van j=1 hangt af van zijn eigen k(1), en van de optima k(2)* en k(3)*, waarbij de begroting een beperking oplegt. De variabele λ1 is de zogenaamde multiplicator van Lagrange. Men vindt het optimum van j=1 door de Lagrangiaan optimaal te maken, dankzij een geschikte keuze van kν(1). Met andere woorden, het optimum vereist ∂L/∂kν(1) = 0 voor ν = 1, 2, en 3. Substitueer de formule 1 in de formule 2, dan vindt men16
(3a) (π − c/3) × (κ1 − k1(1)) / κ1² = λ1
(3b) (k2(2) × c/3) / κ2² = λ1
(3c) (k3(3) × c/3) / κ3² = λ1
Uiteraard moeten de groepen 2 en 3 soortgelijke formules hebben gebruikt bij het bepalen van hun optimale strategie. Na enig stug rekenwerk (p.218-219) vindt met met al deze formules, dat in het optimum moet gelden κ1 = κ2 = κ3, k1(1) = k2(2) = k3(3), en dus p1 = p2 = p3 17. Dat wil zeggen, er wordt steeds een gelijke som besteed om een project te beïnvloeden. Bovendien besteedt elke groep een zelfde bedrag aan haar vóór-lobby. Daardoor krijgt elk project dezelfde kans om te worden goedgekeurd. Deze kans wordt berekend door de formules 3a en 3b te combineren. Het resultaat is18
(4) p* = 1 − c / (3 × π)
Merk op, dat blijkens de formule 4 moet gelden c ≤ 3×π. Een groep zal strijden voor haar project, zodra de opbrengst π groter is dan de eigen kosten c/3. Zij belast de rest van de maatschappij met de overige kosten 2×c/3. Echter, zolang geldt π < c, tast het project de maatschappelijke welvaart W(u1, u2, u3) aan. Het rekenvoorbeeld is in zoverre bijzonder, dat de drie groepen elkaar gelijk belasten. De formule 1 (en de equivalenten voor j = 2 en 3) laat zien, dat in het optimum van de groep j geldt E(uj)* = (π − c) × p*. In de situatie π < c vindt de groep j de projecten onwenselijk, maar het heeft geen zin om haar eigen project te stoppen. Immers de schade komt juist van de twee overige projecten. Men noemt zo een verliesbrengend evenwicht Pareto inferieur (p.220 in GP).
Merk voorts op, dat het gevonden evenwicht niet uniek is. Namelijk, uit de definitie van p volgt dat het evenwicht moet voldoen aan (-1 + 1/p*) × k1(1) = k2(1) + k3(1). Combinatie van deze vergelijking met de begrotings-beperking geeft, dat k1(1) = β×p*. Kennelijk is in het optimum de groep 1 toch vrij om zelf de waarde van k2(1) of k3(1) te kiezen. De groepen 2 en 3 hebben net zo een keuzevrijheid. Er zijn dus inderdaad diverse evenwichten {g1*, g2*, g3*}, die bovendien gelijkwaardig zijn in E(uj). De situatie van diverse evenwichten plaatst de groepen j = 1, 2 en 3 voor een probleem. Immers elke groep kiest haar evenwicht zelfstandig. Daarmee is de kans groot, dat de drie groepen niet allen zullen kiezen voor hetzelfde evenwicht. Maar dan zal de uitkomst van {g1, g2, g3} geen evenwicht meer zijn. De kans pν zal verschillen per project. Dat wil zeggen, minstens één groep heeft een opbrengst, die niet haar optimum is19.
De benadeelde groep zal haar strategie gj veranderen, maar zonder coördinatie, zodat een evenwicht uitblijft. Er ontstaat een chaotische tijdreeks van suboptimale besluiten (p.220). Men heeft instituties nodig om de strategieën te coördineren, maar daarin voorziet het model niet. Bij de inleiding van de huidige column is opgemerkt, dat de staat zulke instituties kan oprichten. De coördinatie is zelf een publiek goed20. Die instituties kunnen bovendien afdwingen, dat de projecten worden afgewezen, indien zij de maatschappelijke welvaart W verlagen. Die situatie treedt bijvoorbeeld op, indien het project van groep j de rest van de maatschappij belast via negatieve externe effecten. Er is dan sprake van marktfalen. Anderzijds zou de rest van de maatschappij ook kunnen worden belast, doordat de groep j met succes rente zoekt bij de staat. De staat subsidieert het project van de groep j. Dan is er juist sprake van staatsfalen! (p.213)
Historisch vormt elke staat zijn eigen instituties, al naar gelang van de specifieke omstandigheden. Dit schept een pad-afhankelijkheid van de evolutie. Een Nederlands voorbeeld van de coördinatie is het tripartiete overleg tussen de bedrijfsgenoten en de staat, bijvoorbeeld in de Sociaal-economische Raad (SER). Het model met de drie pressiegroepen laat zien, waarom dit corporatisme kan falen21. Zodra het onderlinge overleg hapert, gaat elke groep zelfstandig een strategie kiezen. Men kan in een beslissingsval belanden, waardoor het corporatisme immobiel wordt.
De econoom A. Drazen geeft in zijn boek Political economy in macroeconomics (afgekort PM) een interessant model van zwartrijden (parasiteren)22. Beschouw het simpele geval van een groep met twee leden j = 1, 2. Elk lid moet besluiten of hij een zeker publiek goed wil aanschaffen. Het goed geeft aan het lid k een nut uk = π − ck, waarin π de opbrengst is en ck de kosten. De strategie gk van het lid k bij zijn aankoop-besluit is dus "doen" (d) of "laten" (l). Zij behoort tot de verzameling {d, l}. Aangezien het een publiek goed is, komt het ter beschikking aan de hele groep, zonder rivaliteit of uitsluiting. Daarom heeft elk groepslid er baat bij om de kosten te ontlopen. Zie de tabel 1. Het ligt voor de hand, dat het lid met de kleinste ck tenslotte het goed zal kopen. Stel echter, dat geen van de leden de kosten ck van de anderen kent. Ze weten alleen, dat c is verdeeld volgens de cumulatieve verdelingsfunctie F(c) op het interval [0, cm]. Dat compliceert de zaak.
g2=d | g2=l | |
---|---|---|
g1=d | π − c1, π − c2 | π − c1, π |
g1=l | π, π − c2 | 0, 0 |
Merk allereerst op, dat een dergelijke situatie relevant is voor de evolutie in de tijd van instituties, zoals publieke goederen. Immers, elk groepslid is geneigd om te wachten tot een ander het goed betaalt. Drazen noemt dit een uitputtingsslag (war of attrition) (p.397, en uitgebreider p.432-439 in PM). Er ontstaat een patstelling, waardoor de maatschappelijke ontwikkeling stagneert. Gemakshalve wordt echter uitgegaan van een statische situatie. Dan zal er een beslissing zijn, en zij moet een evenwicht g* = {g1(c1)*, g2(c2)*} zijn. Dat representeert het groepscontract. Het evenwicht kan worden berekend. Namelijk, men kan uitrekenen, dat het lid k de aankoop doet (gk=d), indien geldt ck ≤ π × (1 − p). Hierin is p de kans, dat het andere lid de aankoop zal doen23. Het lid prefereert gk=l, indien geldt ck > π × (1 − p). Dat wil zeggen, als het lid k vast gelooft, dat een ander lid het goed zal betalen, dan zal hij het zelf nalaten.
Het model leidt tot een verrassende consequentie. Namelijk, het lid k toetst zijn besluit niet aan ck ≤ π. Hij zal de koop van het goed al nalaten bij kosten, waar betalen eigenlijk nut heeft voor hem. Dit is te wijten aan zijn risico-neutrale houding. Hij accepteert gelaten, dat wellicht het goed niet beschikbaar komt. Slechts het verwachte nut telt, niet het slechtst denkbare nut. Kennelijk leidt de neiging tot zwartrijden gemiddeld tot een verminderd aanbod van het publieke goed. Het plaatst een rem op de evolutie van het goed, en dus op het vernieuwen van de instituties24. Ook in dit geval kan coördinatie de collectieve welvaart W(u1, u2) vergroten. Bijvoorbeeld kan de groep zelf of de staat kiezen voor regulering, waarbij zwartrijders een sanctie krijgen (p.389 in PM)25. Daarnaast herinnert de lezer zich uit de inleiding, dat leden kunnen worden gemotiveerd via morele en affectieve prikkels (p.389).
Het zonet beschreven model kan worden opgevat als een staatstheorie (p.401 in PM). De column is begonnen met het hoopvolle model van Downs, waarin de leden graag betalen aan hun groep, omdat zij daardoor de groepsdoelen kunnen sturen. Echter, het parasiteren van individuen of zelfs van groepen is een fundamenteel probleem, dat van oudsher heeft aangezet tot filosofieën over de rol van de staat. Vanaf de zeventiende eeuw krijgen die de vorm van theorieën over het maatschappelijk contract. Zie ook het boek Individuals, institutions and markets (afgekort IM)26. Hoewel sindsdien de onmisbaarheid van de staat onomstreden is, zoekt men nog steeds naar de beste bestuurlijke mix. Bij aanvang van de column is al geconstateerd, dat sinds de jaren 80 van de vorige eeuw de vrees voor het staatsfalen groeit. Men moet steeds de kans van markt- en staatsfalen tegen elkaar afwegen.
Zo een afweging is enkel mogelijk, wanneer men inzicht verwerft in de maatschappelijke evolutie. Dankzij de public choice theorie en de NIE is de kennis van instituties uitgebouwd. Vaak ontstaan instituties op een organische manier, uit een natuurlijk (spontaan) maatschappelijk proces (p.80-81, p.90-96 in IM). Zij worden bedacht op het meso-niveau, in de groepen. Zulke instituties zijn langdurig beproefd in de practijk, en hebben vanzelf al enig draagvlak (common law). Maar instituties kunnen ook centraal door de staat en zijn politieke leiders worden opgelegd, op het macro-niveau, om pragmatische redenen (p.91) (statutory law)27. De staat bezit het geweldsmonopolie, en kan het verzet tegen zijn instituties smoren (p.81, 149). Aldus moet men bij de evolutie van instituties een afweging maken tussen twee kwaden: (a) de chaotische wedijver tussen de groepen in het middenveld, en (b) de dictatuur en het machtsmisbruik van de gewapende politieke heerser.
Het zij nog eens herhaald: de rol van het maatschappelijk middenveld (civil society) is tweesnijdend. Belangengroepen kunnen zowel nieuwe instituties propageren als de vooruitgang blokkeren (p.95). De moraal is een krachtig middel om de individuen te mobiliseren ten behoeve van hervormingen. Helaas laat die moraal zich lastig modelleren (p.97, p.106-117 in IM). Zodra zich een evenwicht vormt tussen de diverse groepen, is er feitelijk een maatschappelijke conventie ontstaan (ook wel routine of heuristiek genoemd) (p.88, 101-105). De conventie wordt verinnerlijkt, zodat de individu er door wordt geleefd. De spelregels beperken hem in de keuze van zijn strategieën (p.106, 125). Hoewel conventies zijn gebonden aan de cultuur, lijkt het leervermogen een genetische oorsprong te hebben28. Aldus leert de individu het nut van wederkerigheid. De conventies vormen zich vrij eenvoudig op het meso niveau, binnen de groepen (p.127-129).
De staat plaatst de groepen in het externe regelkader op macro niveau (p.129). De liberale staat schept vertrouwen via het rechtssysteem (p.133, 143). De wetgeving beschermt het individuele eigendom, als een onderdeel van de burgerrechten. Het eigendom ondersteunt de ontplooiing van de groepen (p.147). De staat kan de wetten, de conventies en de moraal inprenten bij de individuen via de media, het onderwijs en soortgelijke vorming (p.151). Dankzij deze socialisatie van de individuen kan het toezicht door de staat beperkt blijven. Bovendien hebben de individuen een voice vanwege de parlementaire democratie. De politiek zal reageren op deze terugkoppeling, zoals blijkt uit het recente reformisme in de sociaal-democratie. Aldus zal althans een integere staat zorgen, dat het maatschappelijke spel een solide draagvlak behoudt (p.146, 156). Anderzijds is het voor individuen kostbaar om een perverse staat te verlaten via de exit optie (p.137, 142).
De NIE veronderstelt, dat de maatschappelijke instituties worden geselecteerd in een evolutionair proces. De groepen met de beste instituties hebben een voordeel in hun wedijver met andere groepen. Daardoor zullen zij groeien ten koste van de groepen met ondeugdelijke instituties. De econoom K. Binmore laat zien, dat een dergelijk ontwikkelingspad kan worden gemodelleerd met de speltheorie29. Beschouw allereerst het spel van de gevangenen (prisoner's dilemma). Dit beschrijft een interactie tussen twee spelers 1 en 2, alsmede de mogelijke uitkomsten (u1, u2) van hun interactie. De uitkomst uj (j=1 of 2) hangt af van de manier, waarop de beide spelers zich gedragen. Er zijn twee gedragingen denkbaar, te weten samenwerken (afgekort s) of parasiteren (afgekort p). Met andere woorden, het gedrag gk van de speler is een element van de verzameling {s, p}.
g2=s | g2=p | |
---|---|---|
g1=s | 1, 1 | -1, 2 |
g1=p | 2, -1 | 0, 0 |
De tabel 2 vat de kenmerken van het gevangenenspel samen. In de vier vakken zijn de mogelijke paren uitkomsten (u1, u2) weergegeven, voor elke combinatie {g1, g2} van gedragingen. De tabel laat zien, dat de maatschappelijke welvaartsfunctie W(u1, u2) = u1 + u2 het grootste is, wanneer de spelers allebei samenwerken. Dan is W=2. Echter ieder heeft de verleiding om op de ander te parasiteren, aangezien dat voor hemzelf meer oplevert (2>1). Daardoor zullen de spelers allebei kiezen voor gk=p, wat leidt tot W=0. Men noemt {p, p} de dominante strategie, omdat geen van de spelers een alternatief heeft, dat zeker meer oplevert. Het is tragisch, maar rationeel, om te kiezen voor gk=p. Aldus zal dit het normale gedrag zijn in een groep van het type homo economicus.
j=2 in A | j=2 in B | |
---|---|---|
j=1 in A | α, α | γ, δ |
j=1 in B | δ, γ | β, β |
Beschouw vervolgens groepen A en B van het type homo behavioralis. Dit is een heel ander type dan de homo economicus, want het wordt geleefd door de instituties. Het heeft een vaste moraal, een strategie, die niet kan worden gewijzigd via rationeel denken. Stel dat de groep A altijd samenwerkt (gA=s), en de groep B wil altijd parasiteren (gB=p). Stel dat de beide groepen samenleven in dezelfde maatschappij, waarvan A een fractie q uitmaakt en dien ten gevolge B een fractie 1 − q. Nu kan opnieuw een tabel worden opgesteld, in dit geval van de uitkomsten bij interacties tussen twee leden van de maatschappij. Zie de tabel 3. Die heeft een wat andere aard dan de tabel 2, want er valt niets meer te kiezen. Bij elke interactie heeft een lid van A een verwachte uitkomst E(uA) = q×α + (1 − q)×γ. Een lid van B verwacht E(uB) = q×δ + (1 − q)×β.
Stel nu, dat de uitkomsten zorgen voor een evolutionaire selectie. De groep met de grootste verwachte uitkomsten zal de andere tenslotte verdringen. Dan zal bijvoorbeeld de groep B worden verdrongen, indien is voldaan aan de voorwaarde q×α + (1−q) × γ > q×δ + (1−q) × β. Beschouw ter illustratie een maatschappij van louter groep A, waarin door een toevallige mutatie soms een groepje B ontstaat. Zolang de mutanten B worden verdrongen, blijft de maatschappij van A evolutionair stabiel. Stel dat q bijna gelijk is aan 1, omdat immers de groep B enkel kan ontstaan dankzij de mutatie. Als q willekeurig dicht naar 1 kan naderen, dan is de voorwaarde voor stabiliteit α≥δ 30. Bijvoorbeeld α=β=1 en γ=δ=0. Anderzijds, als men voor α, β, γ en δ de waarden van de tabel 2 invult, dan blijkt dat de groep A zal worden verdrongen door de mutanten.
Deze toepassing van de speltheorie is interessant, omdat zo de evolutionaire deugdelijkheid van allerlei institutionele gedragingen (vaste strategieën) kan worden onderzocht. Beschouw bijvoorbeeld een maatschappij, waarin tijdens de interactie de beide spelers elkaars type kunnen zien31. Dan kan elke speler zijn eigen gedrag aanpassen bij het type van de ander. Veronderstel, dat de groep C een institutie heeft, die het gedrag van imiteren aanmoedigt (gC=i). In de interactie werkt een speler in C samen, als eerst de ander bereidheid toont tot samenwerken. En de speler in C wil parasiteren, nadat ook de ander dat wil. Merk op, dat een maatschappij van louter groep C zich net zo gedraagt als A - hoewel hun instituties verschillen! Stel weer, dat door een toevallige mutatie een groepje B kan ontstaan. Stel dat de uitkomsten worden bepaald door de tabel 2. Dat wil zeggen, de uitkomsten van het gevangenen spel gelden.
In deze maatschappij is de interactie van een lid van de mutanten B altijd {p, p}, met uitkomst u=0. Als een lid van de groep C een interactie heeft met een mutant, dan is diens uitkomst eveneens u=0. Als het lid van C een ander lid van C ontmoet, dan moeten allebei kiezen uit een gedrag s of p. De rationele keuze van beiden is s, met als uitkomst u=1. Dankzij de lucratieve interacties tussen de leden van C onderling hebben zij grotere verwachte uitkomsten dan de mutanten. Daardoor worden de mutanten verdrongen, en de maatschappij van groep C is evolutionair stabiel.
Helaas is de groep C toch niet onkwetsbaar. Namelijk, veronderstel dat er mutanten A ontstaan. In de maatschappij van C hebben de A mutanten dezelfde uitkomsten als C. Het is denkbaar, dat de groep A tenslotte deze maatschappij helemaal overneemt. De weerbare groep C sterft uit. Als dan vervolgens groepjes mutanten B ontstaan, dan kunnen die simpel de groep A verdringen. Kennelijk hangt de ontwikkeling van instituties af van de kans op mutaties!32 Het ligt voor de hand, dat mutaties een voorkeur (grote kans) hebben voor vereenvoudiging. Dat bevoordeelt de mutatie van C naar A. Anderzijds, zolang er tevens mutaties B ontstaan, behoudt de groep C een voordeel over haar mutatie A. Dan werken de mutaties B als een soort vaccinatie, die de anti-lichamen mobiliseert, zodat er toch een kans is op handhaving van het institutionele gedrag van C. Zie voor dit fenomeen de figuur 3, links op de tijdlijn.
Merk evenwel op, dat een mutatie denkbaar is, waarbij de mutant B zich kan voordoen als een lid van C. Dan wordt het imitatie gedrag van de groep C ondeugdelijk, want zij degenereert feitelijk tot A. De "super" mutanten B zullen nu de groep C verdringen, en daarmee de welvaart W verlagen. Zie de figuur 3, rechts op de tijdlijn.Overigens is er nog hoop, want er kan een "super" mutant C ontstaan, die wèl in staat is om de "super" mutanten B te herkennen! Deze "super" mutanten C zullen de "super" mutanten B verdringen. Het oorspronkelijke spel tussen C en B is teruggekeerd, zij het nu met de extra optie van "vermommen" bij B. Zie in de figuur 3, uiterst rechts op de tijdlijn.
g2=s | g2=p | |
---|---|---|
g1=s | 3, 3 | -2, 2 |
g1=p | 2, -2 | 0, 0 |
Het is nuttig om nogmaals te benadrukken, dat naast het institutionele gedrag (de vaste strategie) ook de uitkomsten (de maatschappelijke beloningen) cruciaal zijn. Bijvoorbeeld, beschouw weer de homo economicus, maar nu in het spel van de hertenjacht (stag hunt)33. Dat heeft andere uitkomsten dan het gevangenen spel. Er geldt α=3, β=0, γ=-2, en δ=2. Zie de tabel 4. In dit spel is {s, s} de dominante strategie, in de zin van Pareto. Echter, als de spelers een interactie {p, p} hebben, dan kan het Pareto optimum niet worden bereikt. Immers, wie in die situatie zou kiezen voor gj=s, loopt het risico op een uitkomst uj=-2. Natuurlijk is de keuze gj=p niet rationeel. Toch is zij denkbaar, bijvoorbeeld indien een speler zich vergist, of gj=s te vermoeiend vindt, of een wrok koestert34.
Het hangt af van het wederzijds vertrouwen t, of een speler het gedrag gj=s aandurft. Stel t kan variëren tussen 0 en 1, zodat het een kans is. De verwachte uitkomst van gj=s is E(u) = t×3 + (1−t) × (-2). De verwachte uitkomst van gj=p is E(u) = 2×t + 0. Voor een risico neutrale speler j loont gj=s, zolang geldt t ≥ 2/3. Een boeiend aspect van het hertenjacht spel is, dat het wegens zijn specifieke beloningen zijn eigen evolutionaire selectie heeft. Immers, beschouw weer groepen van het type homo behavioralis. In tegenstelling met het gevangenen spel is nu de groep A wèl stabiel ten opzichte van mutanten B (want α=3 > δ=2). De groep A schept onderling simpelweg hogere uitkomsten. En nu zullen in een maatschappij C ook kleine groepjes "super" mutanten B, die zich kunnen vermommen als C, geen kans maken.
De speltheorie illustreert de morele afwegingen, die de diverse individuen en groepen maken in hun onderlinge interactie. Een andere aanpak vindt men bij de bevolkings- of populatie-modellen, die de omvang van diverse groepen beschrijven35. De onderlinge interacties tussen de diverse groepen hebben invloed op de maatschappelijke verdeling van de macht en de welvaart. Zwakke groepen zullen neigen tot krimpen. Stel dat de maatschappij bestaat uit de groepen A en B, met een omvang van respectievelijk NA(t) en NB(t). Hierin is t de tijdsvariabele. De dynamiek van de samenstelling van de maatschappij kan worden beschreven met het stelsel vergelijkingen36:
(5a) dNA/dt = αA×NA − βA×NA² − γA×NA × NB
(5b) dNB/dt = αB×NB − βB×NB² − γB×NB × NA
De α, β en γ zijn model-constanten. De bedoeling van het stelsel 5a-b is natuurlijk om de werkelijk optredende verschijnselen te benaderen via een simpele wiskundige uitdrukking. In dit model wordt de verandering van de bevolking bepaald door de drie termen in het rechterlid van de formules. De eerste term is eenvoudig het netto effect van de geboortes, sterfgevallen en migraties. Bij een positieve α is er een overschot, zodat er in beginsel een exponentiële groei is. De tweede term is de verdringing binnen de eigen groep, die ontstaat vanwege de schaarste aan beschikbare middelen. Bij een positieve β remt deze term de groei. De derde term is de verdringing ten gevolge van de wedijverende groep, eveneens vanwege de schaarste, en wellicht ook wegens ronduit vijandig gedrag van die groep. Deze term koppelt de twee formules, en beschrijft de wederzijdse afhankelijkheid van de groepen A en B.
Neem gemakshalve αA = αB = 1, βA = βB = 1, en γA = γB = 2. Dat maakt de formules 5a en 5b gelijk, afgezien van de verwisseling van NA en NB. Deze keuze vereenvoudigt het betoog, maar zij is overigens noch nodig noch essentieel. Helaas kan zelfs met deze vereenvoudiging het stelsel 5a-b niet exact worden opgelost voor NA(t) en NB(t). Maar wel kunnen vrij gemakkelijk in het (NA, NB) vlak de evolutie-paden worden ingetekend. Deze methode wordt geïllustreerd in de figuren 4a-b. Beschouw eerst de figuur 4a. De horizontale NA-as is NB=0. Wegens de formule 1b is dNB/dt = 0 op de as, zodat de as een evolutie-pad is. Hier voldoet NA aan de formule
(6) dNA/dt = NA − β × NA²
De formule 6 wordt de logistieke groei-vergelijking genoemd. De formule 6 is exact oplosbaar, en heeft als oplossing37
(7) NA(t) = 1 / [β − (β − 1/NA(0)) × e-t]
Zonet is al vermeld, dat in het huidige geval is gekozen voor β=1. Dus voor t→∞ vindt men op de as, dat NA = 1. Blijkens de formule 3 evolueert NA(t) naar deze waarde toe, ongeacht de beginwaarde NA(0). In de figuur 4a is deze evolutie weergegeven via pijlen. Dit punt, dat nooit wordt bereikt (tenzij NA(0) = 1), is een evenwicht. Wegens de symmetrie in het stelsel 5a-b vindt men precies hetzelfde voor de NB as. Een ander interessant geval doet zich voor bij NA = NB. Immers invullen in de formule 1a geeft opnieuw de logistieke groei formule 6, maar nu met β=3. De formule 7 is de oplossing. Voor t→∞ krijgt men NA = NB = 1/3, en ook dit punt is een evenwicht. Ongeacht de beginwaarde NA(0) = NB(0), evolueert de bevolking naar dit punt. In de figuur 4a is ook dat weergegeven met pijlen op de lijn NA = NB. Merk op, dat op deze lijn geld dNB/dNA = 1. Zo een lijn wordt een isocline genoemd.
Beschouw vervolgens de vergelijking NA − NA² − 2×NA × NB = 0. Als dit geldt, dan is dNA/dt = 0. Men vindt twee oplossingen, te weten NA=0 en NB = ½ × (1 − NA). Kennelijk zijn ook deze lijnen isoclines. De laatst genoemde isocline is weergegeven in de figuur 4a, inclusief de pijlen voor dNA/dt = 0. Vanwege de symmetrie vindt men net zo een isocline voor dNB/dt = 0. Zie de figuur 4a. Het snijpunt van de twee isoclines is het zonet gevonden evenwicht NA = NB = 1/3. De twee dalende isoclines scheiden het (NA, NB) vlak in vier delen, met per deel unieke tekens voor dNA/dt en dNB/dt (te weten (+,+), (+,−), (−,+) en (−,−)). In de figuur 4a zijn in elk deel de bijbehorende richtingen van evolutie aangegeven met een losse pijl (twee voor (+,+) en (−,−)). Aldus is in het (NA, NB) vlak een stromings- of richtingen-veld geconstrueerd, althans de voornaamste kenmerken ervan.
De figuur 4b toont vier typerende evolutie-paden in het (NA, NB) vlak. Men ziet dat de twee groepen A en B onderling uiterst vijandig zijn. Immers, alle beginpunten ter linker zijde van de lijn NA = NB evolueren naar het punt (NA, NB) = [0, 1]. En alle beginpunten ter rechter zijde van de lijn NA = NB evolueren naar het punt (NA, NB) = [1, 0]. Steeds wordt één groep tenslotte helemaal verdrongen. Alleen een maatschappij op de lijn NA = NB ontwikkelt zich evenwichtig, qua samenstelling. Echter ook hier zal bij een kleine verstoring alsnog de totale verdringing van een groep optreden. Merk evenwel op, dat deze dramatische situatie is te wijten aan de gekozen constanten in het stelsel 5a-b. Bij sommige andere combinaties van constanten blijken de paden juist te evolueren naar het centrale evenwichtspunt, het snijpunt van de twee isoclines38. Kennelijk kunnen dan de twee groepen worden verzoend.
Het voorgaande wettigt de conclusie, dat inderdaad de instituties van sommige groepen kunnen worden verdrongen uit de maatschappij! Bovendien toont de figuur 4a-b aan, dat in de directe omgeving van de lijn NA = NB kleine verschillen bepalen, wie van de twee groepen A en B tenslotte zal overwinnen. Er is dan niet sprake van een duidelijke superioriteit van het overgebleven regime in vergelijking met de verdreven instituties. Kennelijk kunnen geringe wijzigingen in het beleid van de staat dramatische gevolgen hebben, die niet bij voorbaat een verbetering inhouden.
Natuurlijk moet bij elke toepassing worden gecontroleerd, of het stelsel 5a-b een geloofwaardige abstractie is. Immers, dit model is ontwikkeld voor ecologische systemen, waarin de groepen A en B diersoorten zijn met biologische verschillen. Als het model wordt toegepast op groepen mensen, dan negeert men de mogelijkheid, dat mensen kunnen wisselen van groep39. In het bijzonder is de interpretatie van de derde term γ×NA × NB in het stelsel 5a-b lastig, omdat de interactie tussen menselijke groepen allerlei vormen kan aannemen. Het is denkbaar dat de groepen een compromis sluiten, en hun instituties harmoniseren. Daardoor zou het stelsel 5a-b zelf veranderen. Overigens zal dit op de korte termijn weinig voorkomen, omdat een kenmerk van instituties juist hun starheid is. Volgens het communitarisme wordt daadwerkelijk de identiteit van individuen grotendeels bepaald door hun groep van afkomst.
Merk voorts op, dat de constanten in het stelsel 5a-b niet noodzakelijk positief zijn. Bijvoorbeeld, als men de kapitalistische klassenstrijd tussen het proletariaat en de bourgeoisie wil modelleren, dan is er niet per se sprake van een evolutionaire verdringing. Een roofdier-prooi model ligt dan meer voor de hand. Hierin is de constante γ van de bourgeoisie negatief, zodat zij baat heeft bij een groeiend proletariaat. Namelijk, het proletariaat is de arbeidskracht, die de meerwaarde voortbrengt. Als de bourgeoisie te zeer groeit, dan verpaupert het proletariaat40. Ondanks de uitpersing is het proletariaat niet meer in staat om de bourgeois honger naar meerwaarde te stillen (zou Marx zeggen). Dien ten gevolge leidt het roofdier-prooi model tot een periodieke golfbeweging van de populatie grootte, waarbij de cyclus van het roofdier (groep B, zoals de bourgeoisie) een tijdsvertraging heeft ten opzichte van de cyclus van de prooi (groep A, zoals het proletariaat)41.