In deze column wordt nader ingegaan op het model, waarmee Binmore de maatschappelijke moraal beschrijft. De bron van empathie wordt getraceerd naar primitieve stamverbanden. Er wordt uitgelegd, hoe Binmore waarde toekent aan individuen. De individuele nutsopties blijken een effect te hebben op de gekozen nutsverdeling. Ook wordt de moraal-theorie van Coleman uitgelegd, en in een rekenvoorbeeld vergeleken met het model van Binmore. Tenslotte wordt apart ingegaan op bepaalde specifieke aspecten van de modellen, zoals de status quo en consensus.
De Gazet heeft vanaf zijn oprichting gezocht naar een model voor de homo sapiens. Steeds was het uitgangspunt de homo economicus. Al snel is deze genuanceerd, door hem te vergelijken met het Leninistische mensbeeld, te weten de homo politicus. Overigens kan dit mensbeeld wellicht beter de homo sociologicus worden genoemd. Hij wordt gekenmerkt door de gehoorzaamheid aan de collectieve moraal. Aan het einde van 2014 is in een column het interessante mensbeeld beschreven, dat is voorgesteld door de Nederlandse econoom P. Frijters. In diens visie onderwerpen individuen zich aan hun groep, omdat zij daarbij een persoonlijk voordeel hebben. Deze onderwerping heeft tot gevolg, dat de voorkeuren van de betreffende individu veranderen. Het model van Frijters vindt steun in de maatschappelijke psychologie, inclusief de groepstheorie.
Ruim een jaar later wordt de rationele keuze leer van de socioloog J.S. Coleman beschreven, dat de collectieve moraal beschouwt als een maatschappelijk kapitaal. Normen maken het gedrag beter voorspelbaar, en verminderen daardoor de transactie-kosten. In netwerken worden macht en gezag overgedragen, net zoals producten worden geruild op de markt. Hoewel ook Coleman de individuele verinnerlijking van de collectieve moraal denkbaar vindt, kent hij hieraan toch minder betekenis toe dan Frijters. Onlangs zijn de zonet genoemde columns aangevuld met de visie van de wiskundige K.G. Binmore, die terugkeert naar het mensbeeld van Adam Smith. Collectief handelen wordt dan verklaard uit het menselijke vermogen om empathie te voelen voor andere individuen. Aangezien de empathie werkt als een bindmiddel, kan daaruit een maatschappelijke moraal ontstaan, zij het dat die zal verschillen per cultuur1.
Binmore stelt zich de empathie voor als het maatschappelijke overleg achter een sluier van onwetendheid, waarin niemand zijn actuele maatschappelijke positie kent. Iedereen erkent de onzekerheden van het leven, en abstraheert daarom even van zijn eigen realiteit. De idee van een grondwettelijk beraad ten einde tezamen in consensus de maatschappelijke moraal vast te stellen stamt oorspronkelijk van de filosoof J. Rawls. Binmore koppelt die idee evenwel aan het onderhandelings-model van Nash. Het beraad onderhandelt onderling, en kiest tenslotte voor het meest aantrekkelijke type maatschappij. De moraal krijgt de gedaante van een democratische afweging van de diverse groepsbelangen in de maatschappij. Enerzijds zorgt het besluit voor een optimale welvaart (utilitarisme), en anderzijds garandeert het besluit een evenwichtige groei, waarin niemand achterblijft (proportionaliteit, ofwel het maximin beginsel).
Natuurlijk vertegenwoordigt geen van de genoemde modellen de waarheid. Elk mensbeeld belicht een bepaald aspect van de realiteit. Vaak wordt de keuze voor een zeker model bepaald door de specifieke omstandigheden, waarin de groepen verkeren. Des al niettemin blinkt het model van Binmore uit door de rijkdom aan kennis, waarmee de diverse veronderstellingen worden ondersteund. Een beperkt aantal plausibele argumenten is voldoende om de maatschappelijke moraal en haar evolutie te verklaren. Aldus reikt Binmore een solide denkkader aan voor politieke economen. Natuurlijk blijft het denkkader controversieel, en wordt inderdaad aangevallen door vele opponenten. Maar tot op heden is uw columnist nog geen enkele overtuigende weerlegging tegengekomen2. Daarom zal de huidige column nogmaals terugkomen op het model van Binmore, en enkele van zijn interessantste bouwstenen behandelen.
De hoeksteen van de maatschappelijke moraal is de empathie. Binmore stelt, dat de evolutie van de mensheid relatief gunstig is verlopen, juist dankzij de empathie. Hij neemt aan, dat de groepen met de meest effectieve moraal overwinnen in de strijd om te overleven3. Die strijd bestaat al sinds de aarde leven kent. In de rondzwervende groepen jagers en plukkers van de prehistorie merkten de individuele groepsleden al, dat zij niet elke dag slaagden in het vinden van voedsel. Omgekeerd vonden anderen in de groep soms meer dan die zelf konden consumeren. Dankzij hun empathische vermogen kwamen zij tot de conclusie, dat het risico van honger lijden kan worden verminderd door alle etenswaren in een collectief fonds te storten. Elke dag kan men uit het fonds dan ieder een eerlijk deel geven. Natuurlijk moeten de deelnemers aan het fonds vooraf een contract afsluiten over de verdeling. Dat houdt rekening met de individuele vaardigheden.
Binmore beschrijft een model, waarin de sluier van onwetendheid enkel leidt tot onzekerheid over de individuele buit op een zekere dag. Zie p.212-215 in het boek Just playing (afgekort JP)4. Beschouw gemakshalve een situatie met twee jagers of plukkers (n=1 en 2). Stel dat x een fractie van het fonds is. Het nut van x is respectievelijk u1(x) en u2(x). Zij gemakshalve u1(x) = u2(x), en noem dat u(x). Stel dat dagelijks maar één jager een zodanig rijke buit maakt, dat hij kan afdragen aan het collectieve fonds. De ervaring leert, dat er elke dag een kans p1 is, dat jager n=1 de rijke buit heeft. De kans, dat n=2 kan afdragen, is dan p2 = 1 − p1. De jagers onderhandelen nu achter de sluier van onzekerheid over hun contract. Zij weten nog niet, wie morgen de rijke buit heeft en zal afdragen aan het fonds. Maar het contract legt vast, dat morgen de rijke jager een fractie χ uit het fonds zal krijgen, zodat de arme jager dan 1 − χ krijgt. Noem ze respectievelijk r en a.
Dien ten gevolge moeten n=1 en 2 geheel vertrouwen op het contract, dat als collectieve moraal de verdeling ur = u(χ), en ua = u(1−χ) dicteert. De realiteiten van de toekomst zijn verborgen voor hen. Het fonds werkt als een verzekering tegen pech. Aldus is het verwachte nut
(1a) E(u1) = p1×ur + p2×ua = p1 × u(χ) + (1−p1) × u(1−χ)
(1b) E(u2) = p2×ur + p1×ua = (1−p1) × u(χ) + p1 × u(1−χ)
Zonder contract geldt de status quo, die in zekere zin eveneens een contract is, met χ=1. Achter de sluier van onzekerheid is de status quo gelijk aan
(2a) E'(u1) = p1 × u(1) + (1−p1) × u(0)
(2b) E'(u2) = (1−p1) × u(1) + p1 × u(0)
Aldus wordt het contract met de optimale verdeling χo gevonden door het Nash probleem op te lossen
(3) maximaliseer voor alle χ in [0,1]: fN = Πn=12 (E(un) − E'(un))
Binmore gebruikt de onafhankelijkheid van lineaire nuts-transformaties, en definieert u(0)=0 en u(1)=1 (p.214 in JP). Dat versimpelt het stelsel 2a-b, en dus ook de formule 3. Men vindt (p.215 in JP)
(4) fN = p1 × (1−p1) × (u(χ)−1 − u(1−χ))² + (u(χ)−1) × u(1−χ)
Des al niettemin is het stelsel van de formules 3 en 4 in beginsel alleen oplosbaar, indien de vorm van u(x) bekend is. Een speciaal geval betreft twee jagers, die allebei neutraal zijn voor risico. Dan is hier u(x) = x. De formule 4 krijgt de simpele vorm fN = (4×p1 × (1−p1) − 1) × (1 − χ)² = -4 × (p1 − ½)² × (1−χ)² (p.215). Dus fN is maximaal (zo min mogelijk negatief) in het punt χ=1. Kennelijk hebben risico neutrale jagers geen behoefte aan delen. Ze blijven in de status quo. Dat is trouwens logisch, want het verzekeringsfonds voegt niets toe aan de totale buit. Kortom, het contract heeft enkel zin, zolang geldt ∂u/∂x > 0 en ∂²u/∂x² <0. Dan is u een concave functie, en de jagers zijn risico mijdend.
Ook een ander speciaal geval verdient vermelding, te weten wanneer de jagers identieke vaardigheden hebben. Dan is de maatschappij symmetrisch in n=1 en 2, zodat geldt p1=½. Dan vindt men fN = ¼ × (u(χ)−1 + u(1−χ))² (p.215). In het maximum van fN moet u(χ)−1 + u(1−χ) een extreme waarde aannemen. Dat geval doet zich voor, wanneer de afgeleide gelijk is aan nul. Met andere woorden, er geldt ∂u(χ)/∂χ = ∂u(1−χ)/∂χ. Echter zonet is al geconstateerd, dat er enkel een fonds zal komen, wanneer fN concaaf is. Daarom kan aan de zonet genoemde indentiteit enkel worden voldaan in het punt χ=½. Het optimale contract dicteert een gelijke verdeling van het fonds. Dat is trouwens logisch in een symmetrische situatie.
Het contractuele beraad in de zonet beschreven maatschappij van jagers is natuurlijk minder ingrijpend dan het constitutionele beraad in het model van Binmore. De jagers kunnen in het contract rekening houden met hun werkelijke positie, hun eigen vaardigheden pn en hun voorkeuren un. Daarom hoeven de jagers enkel empathie te tonen voor hun toekomstige Zelf, in de situatie waarin zij zullen worden geconfronteerd met de werkelijke omvang van hun buit (p.218). Dat is louter egoïstisch gedrag. Toch is het voorbeeld verhelderend, omdat het de afwegingen illustreert, die een maatschappelijk beraad zal maken. Elke jager maakt wel degelijk een intrapersoonlijke vergelijking, tussen zijn Zelf met en zonder contract. Ook dat vereist empathie. Op p.302-303 in JP onderzoekt Binmore daadwerkelijk een situatie, waarin de twee jagers hun beraad houden achter de sluier van onwetendheid. Dit zal verderop in deze column nader worden uitgewerkt.
Het beraad komt tot een besluit over de maatschappelijke moraal, door middel van het recept van onderhandeling volgens Nash. Een voorgaande column heeft aangetoond, dat dit recept impliciet een interpersoonlijke vergelijking veronderstelt. De Nash oplossing combineert het utilitarisme en de proportionele methode (egalitarisme)5. Het recept is dan: kies de vector α van individuele weegfactoren zodanig, dat de utilitaristische oplossing σU en de proportionele oplossing σP samenvallen. De betreffende definities zijn σU = {nutsvector u in de verzameling U van mogelijkheden, die α · (u − ν) maximaal maakt}, en σP = {nutsvector u in de verzameling U van mogelijkheden, die γ = αn × (un − νn) maximaal maakt voor alle n in (1, ..., N)}. In deze definities representeert de nutsvector ν de status quo. Het model van Binmore veronderstelt, dat de interpersoonlijke vergelijking inderdaad mogelijk is, dankzij de empathie.
Het is interessant, dat Binmore de socialistische ideologie beschouwt als een vorm van utilitarisme. Namelijk, de centrale staat hanteert de maatschappelijke welvaartsfunctie W = α · (u − ν) als de moraal, die de verdeling van het nut u voorschrijft (p.469 in JP). En de liberale ideologie hanteert de proportionele methode, omdat iedereen gelijk wordt behandeld. Binmore geeft nu ook een interpretatie van de individuele weegfactoren αn (p.450 en verder). Op de korte termijn, tussen twee constitutionele beraden, zijn alle αn vast. Zowel in het utilitarisme als in de proportionele aanpak is 1 util (nutseenheid) van n even veel waard als αn/αm utils van m (n≠m) (p.451). Maar de effecten van deze ruilverhouding zijn verschillend voor de twee ideologieën (p.452). Enerzijds is in het utilitarisme αn/αm de relatieve prioriteit, die het nut van n krijgt in de optimalisatie. Anderzijds is in het egalitarisme αn/αm het aantal utils nut, dat m moet krijgen, opdat n een util extra krijgt.
Merk op, dat deze weging van utils baseert op de maatschappelijke moraal, en niet op de individuele waardering. Een util heeft natuurlijk voor elke individu evenveel nut. De utils van n en m zijn hier nadrukkelijk al gefixeerd, en niet meer onafhankelijk van lineaire nuts-transformaties. Vervolgens definieert Binmore de maatschappelijke waarde wn van de individu n als 1/αn (p.399). Dat betekent in het egalitarisme, dat wm utils moeten worden gegeven aan m, wanneer n er wn krijgt. De verdeling verloopt overeenkomstig de maatschappelijke waarde6. Hierbij is wn niet (uitsluitend) de marktwaarde van n, maar de waarde-inschatting tijdens het politieke proces (p.455). Met andere woorden, wn wordt bepaald in een politieke machtsstrijd. Binmore stelt hier inderdaad vast, dat de macht wordt bepaald door de vorm van de Pareto grens van de verzameling U van nutsmogelijkheden (p.457). De waarde wn is historisch geëvolueerd (p.458).
Deze voorstelling van zaken betekent echter, dat in het utilitarisme de individuen met een geringe waarde wn juist een hoge prioriteit krijgen bij de verdeling (p.452). Dit is een merkwaardige paradox. Socialisten willen geven aan de armen, die van weinig waarde zijn voor de maatschappij. Volgens Binmore zullen de individuen in het leven van alle dag een dergelijke verdeling onbillijk vinden (p.453). Zij zijn van nature egalitair aangelegd (p.455). Binmore lost deze paradox op met de vaststelling, dat behoeftige (needy) individuen wanhopig zijn. Zij zijn bereid tot grote inspanningen en het aangaan van risico's ten einde hun positie te verbeteren (p.460). Juist deze eigenschap geeft hen macht, en daarmee vergroten zij hun waarde wn (p.463). Bijvoorbeeld kan op een zeker moment in de klassenstrijd het proletariaat wellicht meer waarde bijeen garen dan de bourgeoisie. Op dat moment zal een utilitarist een hogere prioriteit geven aan de bourgeoisie (p.464)!7
De inspanning om macht te verwerven is feitelijk rente zoeken. Zij moet niet worden verward met de inspanning om veel te produceren. Immers Sam de Wolff, de naamgever van de Gazet, constateerde al, dat iedereen, die hard werkt, een onlust ervaart. De onlust O vermindert het nut van de werker (u'n = un − O), en daardoor verandert de grens van de verzameling U van nutsmogelijkheden. Ter illustratie toont de figuur 1a het geval met twee individuen (N=2, ν=0), waarbij de individu n=1 zich bijzonder inspant op het werk (p.465). De verzameling U', die ontstaat na correctie voor de onlust O, is kleiner dan U. Bovendien is de Nash oplossing σ zodanig van aard, dat nu de individu n=2 een relatief groter deel zal krijgen van het beschikbare nut. Dankzij de gewijzigde vorm van de grens van nutsmogelijkheden (U' in het positieve kwadrant van het vlak (u1, u2)) heeft n=1 kennelijk macht verloren. Dus door het harde werken daalt de waarde w1 ten opzichte van w2.
Hieruit kan worden geconcludeerd, dat individuen met natuurlijke talenten beschikken over een hoge waarde wn (p.467). Immers, een dergelijke individu kan produceren met een verminderde inspanning. Omgekeerd vereist het verwerven van menselijk kapitaal een inspanning, die leidt tot een dalende waarde wn (p.466-467). Binmore merkt ook nog op, dat een toename van de individuele status kan worden opgevat als een verbeterde status quo. Daardoor neemt immers het nut toe, met zeg νn. Volgens Binmore leidt de verhoging van een individuele status niet tot een andere verzameling U. De figuur 1b toont deze ontwikkeling voor de individu n=1. De verschuiving van ν impliceert feitelijk een veranderde vorm van de grens van U in het kwadrant met de nieuwe ν' als oorsprong. Opnieuw wordt n=1 minder machtig, en daalt diens waarde wn. Aristocraten tonen zich liefdadig en sober (p.468).
Aldus verzoent Binmore het ogenschijnlijke conflict van utilitarisme en egalitarisme over wn. Een hoge waarde wn ontstaat simpelweg uit het verwerven van macht, en uit het bezitten van natuurlijke talenten. Uw columnist kan alle consequenties van dit model nog niet overzien, maar is onder indruk van de inventiviteit. Als de redenatie van Binmore inderdaad solide is, dan levert zij een krachtig instrument voor abstracte analyses van de individuele waarde.
In de voorgaande paragraaf is geconstateerd, dat volgens Binmore de vorm van de grens van de verzameling U invloed heeft op de waarde wn van individu n. Een grote wn kan worden uitgelegd als veel macht. Uw columnist heeft het geval N=2 beschouwd, een maatschappij van twee individuen, en gezocht naar de grens, die relatief veel macht geeft aan de individu n=1 8. Dat wil zeggen, de individu n=1 krijgt in de verdeling van de maatschappelijke baten x het grootste deel. Dien ten gevolge zal in deze oplossing u1 naderen naar diens maximum, terwijl u2 ver beneden diens maximum blijft. De verdeling wordt bepaald met behulp van het model van Nash. Volgens de eigenschap van de onafhankelijkheid van lineaire nuts-transformaties mogen u1 en u2 naar believen worden geschaald. Neem als status quo ν=0, en als maximale waarde un=1 (n=1 en 2). Zie de figuur 2.
Beschouw de Nash kromme u1×u2 = γ, waarin γ een positieve constante is. Zij is de groene kromme in de figuur 2. Definieer deze kromme als u2 = f(u1) = γ/u1. Definieer de gezochte grens van de verzameling U van nutsmogelijkheden als u2 = g(u1). In een situatie, waarin de individu n=1 zijn maximale nut ontvangt, moet de Nash kromme in u1=1 raken aan de grens van U. De Nash oplossing is dan σ = (1, f(1)) = (1, γ). Aangezien u1=1 per definitie de rechter grens is van U, loopt de functie g in het punt σ loodrecht naar beneden. Zie de rode kromme in de figuur 2 9. Er wordt een g gezocht, waarbij σ2=γ ver beneden 1 blijft, wat inderdaad de "machteloosheid" van de individu n=2 representeert.
Aangezien σ een raakpunt is, moet gelden f(1) = g(1) en ∂f/∂u1(1) = ∂g/∂u1(1). Er volgt dat g(1)=γ. Ook is g(1) = g(0) + ∫01 ∂g/∂u1 du1. Dien ten gevolge geldt γ = 1 + ∫01 ∂g/∂u1 du1. Merk op, dat de Nash kromme voldoet aan ∂f/∂u1 = -f/u1, zodat geldt ∂f/∂u1(1) = -γ. Dit impliceert ∂g/∂u1(1) = -γ. Aangezien U een convexe verzameling is, moet de functie g van de grens concaaf zijn. Dan moet zij voldoen aan ∂²g/∂u1² ≤ 0 op het interval (0,1). Met andere woorden, op het interval is ∂g/∂u1 ≥ -γ. Invullen in de integraal formule van zonet geeft γ ≥ 1 − ∫01 γ du1 = 1 − γ. Aldus vindt men γ≥½. Aangezien hier de grens met de kleinste γ wordt gezocht, is daarvoor kennelijk γ=½. Dan is ∂g/∂u1 = -γ op het hele interval (0,1). De grens g is hier een rechte lijn. Zie de figuur 2. En de individu 2 krijgt een nut σ2=½ toebedeeld, wat 50% is van zijn maximum10.
De gevonden rode grens g in de figuur 2 is eigenlijk logisch. Immers g bepaalt de marginale substitutie-verhouding MSV = du2/du1 aan de grens van U. De helling du2/du1 = -½ garandeert, dat men op de grens u1 kan vergroten zonder u2 zeer te schaden. Pas voorbij (of in) σ1=1 stort u2 op de grens desastreus in. Ter illustratie beschouwe men nog eens de figuur 1a, waar de machteloze individu n=1 door zijn zeer harde werken de grens van de verzameling U zodanig vervormt, dat de nieuwe U' nadert naar de gedaante van de functie g (met de assen verwisseld, zodat individu 2 hard werkt, en niet 1).
Eerder in deze column is de situatie van twee jagers beschouwd achter de sluier van onzekerheid. De jagers kunnen hun beraad ook houden achter de sluier van onwetendheid. Daar verliezen zij alle informatie over hun eigen identiteit, met uitzondering van hun individuele empathie. Zie p.302-303 in JP. Binmore beschrijft de onderhandeling in dit constitutionele beraad met een gecompliceerd wiskundig model, voor het geval N=2. Wellicht zal uw columnist dit ooit uitwerken in de Gazet. De huidige paragraaf wil het model slechts schetsen, als ware het in vogelvlucht. Duid datgene, wat achter de sluier van onwetendheid resteert van de jagers n=1 en 2, aan als I en II. Beschouw eerst de individu I. Zijn empathie-functie is vI(un). Dat wil zeggen, I waardeert de toestand un (n=1 of 2) met behulp van de functie vI. Er is een kans ½, dat hij in werkelijkheid de individu n=1 is. Anders is hij n=2. Daarom wordt de verwachte empathie met betrekking tot de werkelijkheid gegeven door
(5) E(vI) = ½ × vI(u1) + ½ × vI(u2)
Zie voor deze formule p.291 in het boek Playing fair (afgekort PF)11. De formule 5 drukt uit, dat I zijn verwachte empathie-waarde moet berekenen voor elk punt u in de verzameling U van nutsmogelijkheden. Hetzelfde betoog kan worden gehouden voor de individu II achter de sluier. Zijn empathie-functie is vII(un). Tezamen vormt het beraad achter de sluier dus een verzameling T van empathische nutsmogelijkheden, met elementen (E(vI), E(vII)) (p.234 en verder in JP)12. Binmore definieert nu de constanten α1(k) = vk(u1=1) en α2(k) = 1 − vk(u2=0), voor k=I en II (p.293 in PF). Hieruit kan worden afgeleid (p.294 in PF, p.233 in JP)
(6a) vk(u1) = α1(k) × u1
(6b) vk(u2) = 1 − α2(k) × (1 − u2)
De constanten αn(k) zijn de weegfactoren van de belangen van de jagers 1 en 2, en zij stellen tezamen de maatschappelijke moraal voor. Dan resteert het probleem, dat de individuen k=I en II ieder hun eigen maatschappelijke moraal hebben. Binmore lost dat op p.297 in PF en p.222-223 in JP op door te veronderstellen, dat k=I en II dezelfde empathie-functie v(un) hebben. Hij rechtvaardigt die aanname met de opmerking, dat empathie ontstaat ten gevolge van de maatschappelijke evolutie. De empathie is een collectief fenomeen. Dien ten gevolge zijn ook de constante weegfactoren constanten αn(k) gelijk voor k=I en II 13. Als nu de formules 6a-b worden ingevuld in de formule 5, dan is het resultaat (p.294 in PF, p.436 in JP)
(7) E(v) = ½ × α1 × u1 + ½ × α2 × u2 + ½ × (1 − α2)
De formule 7 is de utilitaristische welvaartsfunctie, afgezien van de term ½ × (1 − α2) en de schaling met de factor ½. Maar deze twee afwijkingen beïnvloeden het punt uP van maximale welvaart niet. De twee jagers achter de sluier moeten nu de verhouding α2/α1 bepalen. Dat gaat als volgt. Stel I en II kiezen het optimum uP, dat de verwachte empathie-functie E(v) maximaal maakt. In de alledaagse werkelijkheid zal dit optimum één van de twee jagers bevoordelen over de andere. Er zou een "filosoof-koning" nodig zijn om het contract te handhaven (p.258-261 in JP). De individuen I en II verwerpen zo een welwillende dictator, want zij geven de voorkeur aan de democratie. Daarom moet het contract worden gehandhaafd door middel van zelf-binding (self-enforcing, self-policing contract). Een voorgaande column heeft aangetoond, dat dit lukt bij een proportionele verdeling. Binmore leidt af, dat proportionaliteit hier de gedaante heeft van (p.295 in PF, p.435 in JP)
(8) α1 × u1 = α2 × u2 + 1 − α2
De term 1 − α2 kan worden opgevat als de status quo (1/α1, 1). De formules 7 en 8 leggen tezamen het optimale contract op de grens van de verzameling U van nutsmogelijkheden vast. Dit contract is de maatschappelijke moraal in het evenwicht. De verhouding α2/α1 is hiermee eveneens vastgelegd. Een eerdere column heeft laten zien, dat het contract simpelweg de oplossing σ van het Nash probleem is. Daarmee is de rechtvaardiging van het model van Binmore voltooid. Uw columnist is zich bewust dat deze paragraaf enkel begrijpelijk is, wanneer men de boeken van Binmore zelf bij de hand heeft. De paragraaf is vooral bedoeld als een bladwijzer in JP en PF14.
In het model van Binmore wordt een maatschappelijk evenwicht geconstrueerd, dat baseert op de waarde van individuen. Drie jaren terug is in de Gazet de rationele keuze leer van de socioloog J.S. Coleman behandeld, die iets dergelijks doet. Dit model wordt ontwikkeld in het boeiende boek Foundations of social theory (afgekort ST)15. Coleman gaat uit van een vrijwillige ruil van eigendommen door individuen. Een dergelijke situatie wordt gemodelleerd met de Edgeworth box. Dankzij de ruil kunnen de individuen hun nut vergroten ten opzichte van de status quo ν, net zoals in het arbitrage-model van Nash. De verzameling U van nutsmogelijkheden dankzij ruil wordt de kern genoemd. En de Pareto-optimale grens van U wordt aangeduid als de contract kromme. Coleman presenteert een methode om het optimale evenwicht op de grens van U te bepalen, net zoals Binmore. Daarom worden in deze paragraaf de beide modellen vergeleken16.
Beschouw gemakshalve ook de rationele keuze leer van Coleman voor de situatie van de twee jagers. Volgens Coleman geeft het eigendom van goederen (resources) macht (p.133 in ST). Immers de goederen worden begeerd door de andere(n). Overigens kan het eigendom bestaan uit het recht van zeggenschap over gebeurtenissen (events) (p.33 in ST). De macht, die het eigendom van een eenheid van een zeker goed k geeft, wordt uitgedrukt door diens waarde vk. Coleman definieert de waarde als een systeem-variabele (p.133). Daarmee krijgt vk dezelfde betekenis als de prijs ten gevolge van marktwerking. Merk op, dat strikt genomen in een geïsoleerde gemeenschap van twee jagers de waarde vk onbepaald is. Immers voor de jagers tellen enkel hun persoonlijke voorkeuren uk. De belangstellende lezer kan de column over het consumenten-surplus naslaan voor een uitleg van het verschil tussen de prijs (waarde) en het individuele nut.
Kortom, voorkeuren en eigendom zijn individueel, terwijl macht en waarde universeel zijn (p.133). Hoewel Coleman dit niet expliciet vermeldt, neemt hij kennelijk aan, dat groepen zijn ingebed in de grotere maatschappij. De waarde vk wordt dan van buiten opgelegd aan de groep, omdat de individuen een exit optie hebben. Bijvoorbeeld kan een jager ruilen met individuen uit een naburige stam. De ruil-mogelijkheden worden nu bepaald door de begrotings-beperking. In hoofdstuk 25 van ST wordt het model van Coleman wiskundig uitgewerkt17. Zie de column over het perfecte maatschappelijke systeem. Ter illustratie zal nu dit model worden toegepast op de maatschappij van twee jagers. Stel dat de maatschappij twee goederen k=1 en 2 kent. Dat kan vlees en groente zijn, maar eventueel ook gebeurtenissen, zoals jagen en rusten. Het zou zelfs kunnen gaan om regels, zoals vrijheid en gelijkheid - al zijn die slecht uitwisselbaar tussen personen.
De jager n=1 heeft een nutsfunctie u1 = c110.6 × c120.4. Evenzo heeft de jager n=2 een nutsfunctie u1 = c210.8 × c220.2. Hierin is cnk de hoeveelheid van goed k in eigendom van jager n. De exponenten hangen af van de individuele voorkeuren voor het goed k. Immers, zij zijn gelijk aan (∂un/∂cnk) / (un/cnk) 18. Zij drukken de intensiteit uit van de voorkeur. Klaarblijkelijk heeft de jager 1 meer behoefte aan het goed 2 dan de jager 2. Voorts is hier belangrijk, dat jager 1 en 2 allebei een intense voorkeur hebben voor het goed 1. Daardoor zijn hun voorkeuren concurrerend, en dat maakt de verzameling U van nutsmogelijkheden convex19. Dit is een eis voor de toepassing van het model van Nash. Stel dat de status quo van de eigendommen wordt gegeven door c11 = c12 = 4, en c21 = c22 = 6. Dus er geldt ν = (4, 6). Ieders begroting (budget-lijn) is rn = Σk=12  cnk×vk (compacter: r = C v). Aangezien geldt c1k < c2k, is in het model van Coleman de jager 2 machtiger dan 1.
In dit geval wordt de contract kromme gegeven door 8×c11×c22 = 3×c12×c21 (p.678 in ST). Zij is schematisch weergegeven in de figuur 3a, in blauw. Op de contract kromme is het nut van iedere jager minstens zo groot als in de status quo. Dankzij de ruil van goederen kunnen de jagers hun nut vergroten. Zij moeten overleggen hoe de baten van de transactie (de nutstoename) onderling worden verdeeld. Wegens c11+c21 = c12+c22 = 10, volgt dat de contract kromme voldoet aan c12 = 16×c11 / (c11+6). Kennelijk heeft men op de contract kromme u1 = u1(c11) en u2 = u2(c11), en dus ook u2 = u2(u1) 20. Hieruit leidt men af
(9) du2/du1 = -0.6295 × (c11 + 6)0.2
De marginale substitutie verhouding MSV neemt duidelijk af met c11, zodat de grens van U concaaf is. Daarom is U zelf inderdaad convex. De grens wordt afgebeeld in de figuur 3b. Op de twee uiteinden van de contract kromme zijn u1 = 4.240 (bij c11=3.432) en u2 = 6.235 (bij c11=3.207). De MSV in deze twee punten is respectievelijk -0.9861 en -0.9813. Kennelijk is de convexiteit gering, en is de grens van U bijna lineair. Vervolgens kunnen de waarden van de goederen k=1 en 2 worden berekend met het model van Coleman (p.684 in ST). Zij moeten zodanig zijn, dat de optima van de jagers op hun collectieve budget-lijn samenvallen. Zie de oranje lijn in de figuur 3a. Het evenwicht van Coleman is het snijpunt van de contract kromme en de budget-lijn. Men vindt daar v1=0.07200 en v2=0.02801. Dat wil zeggen, in het maatschappelijke evenwicht is de ruilverhouding vastgelegd op v1/v2 = 2.571. Dan is de totale macht r1 van jager 1 gelijk aan 0.4, en evenzo r2=0.6.
De materiële verdeling in het evenwicht is c11=3.336, c12=5.717, c21=6.664, en c22=4.283 (p.683 in ST). Kennelijk krijgt jager 2 in het optimum inderdaad meer van goed 1, dankzij zijn intense voorkeur. Merk op, dat bovendien de jager 2 profiteert van zijn grotere macht r2, omdat hij de medewerking van jager 1 kan kopen met het goed k=2. De macht zou nog meer voordeel opleveren, wanneer de grootte N van de groep en het assortiment K van goederen toenemen. In de column over het model van Coleman wordt het belang de indirecte ruil benadrukt. Men berekent ten slotte, dat het optimale nutsevenwicht wordt gegeven door uC = (4.138, 6.100). Zie de figuur 3b. Beide jagers hebben hun positie ten opzichte van de status quo verbeterd, en jager 1 het meest, ondanks diens mindere macht. De jager 2 moet flink betalen voor zijn intense voorkeur voor het goed k=1. Wie kieskeurig is, lijdt het meest onder de maatschappelijke schaarste (10 stuks van goed 1).
Beschouw nu het arbitrage-model van Nash. Dit moet worden toegepast op de verzameling U, die wordt gegeven door de contract kromme, met als status quo ν = (4,6). Volgens Nash wordt de optimale verdeling gegeven door zijn oplossing σ. In dat punt raken de grens van U en de Nash kromme (u1−4) × (u2−6) = γ aan elkaar. Zie de figuur 3b. De Nash kromme heeft de MSV du2/du1 = -(u2−6) / (u1−4). Substitueer in het rechter lid de formules voor u1(c11) en u2(c11), en stel deze MSV van Nash gelijk aan de formule 9. Dit levert een nogal complexe uitdrukking op voor c11, die moet worden opgelost via uitproberen21. Dat levert voor het optimum van Nash op: c11=3.332, c12=5.702, c21=6.678, en c22=4.298. Deze waarden verschillen significant van die in het model van Coleman (zie de berekening van zonet). De bijbehorende oplossing is σ (= uN) = (4.123, 6.115). Zie de figuur 3b. Nash geeft minder baten aan de jager 1 dan Coleman22.
In σ heeft de MSV de waarde -0.9840. Dit is tevens de helling van de bijbehorende utilitaristische welvaartsfunctie fU. Met andere woorden, men heeft α1/α2 = 0.9840. Neem α1=1. Merk op, dat met deze keuze de hele grens van U in het huidige voorbeeld bijna samenvalt met fU = 10.34. Immers, er geldt nu
(10) fU(u) = u1 + 1.016 × u2
Dien ten gevolge wordt het belang van de jager 2 zwaarder gewogen dan dat van jager 1. Het pad van de status quo ν=(4,6) naar het optimum σ zal verlopen langs de proportionele lijn van zelf-binding, te weten u1−ν1 = 1.1016 × (u2−ν2). De jager 1 met de grootste waarde krijgt op het groeipad inderdaad meer utils erbij dan de jager 2. Volgens het model van Binmore zijn hun maatschappelijke waarden w1=1 en w2=0.9840. Aangezien bij Binmore een grote waarde het gevolg is van een grote macht, beschikt in zijn model de jager 1 over de grootste macht. De gedaante van de grens van de verzameling U van nutsmogelijkheden is in zijn voordeel. Vergelijk dit met Coleman, die koopkracht opvat als macht. Echter een sterke koopkracht kan niet verhelpen, dat iemand met intense voorkeuren aanleiding geeft tot hoge prijzen, waardoor toch diens nutsmogelijkheden beperkt blijven23.
De inleiding van deze column noemt de interpretatie, die Binmore geeft aan het arbitrage-model van Nash, aanvechtbaar. Het markt-model van Coleman komt inderdaad tot een andere optimale verdeling dan het moraal-model van Binmore. Elk model kiest zijn eigen evenwicht op de grens van de verzameling U van nutsmogelijkheden. Inhoudelijk starten de twee modellen vanuit verschillende theoretische uitgangspunten, wat een vergelijking lastig maakt. Binmore kent waarden wn toe aan individuen, op basis van de maatschappelijke moraal. Coleman kent waarden toe aan goederen, zodat bij hem de individuen enkel een waarde rn bezitten dankzij hun eigendommen. Hij vervangt de politieke keuze van Binmore door een economische24. Nochtans hebben de beide modellen in fundamenteel opzicht ook veel gemeenschappelijk. Bijvoorbeeld baseren zij op de individuele nutsfuncties, en gebruiken dus het methodologisch individualisme.
De voorgaande paragraaf heeft laten zien, dat Coleman een eigen visie heeft op de maatschappelijke moraal, de grondwet (constitutie), en normen. Hij werkt die grondig uit in zijn baanbrekende boek Foundations of social theory. Binmore beperkt zijn analyse tot het bilaterale overleg, omdat er achter de sluier geen groepsbelangen meer bestaan. Coleman ziet evenwel de maatschappij meer als een netwerk van groepen (p.330). Hij verkiest de positieve maatschappelijke (social) theorie, die de sluier van onwetendheid simpelweg in strijd met de realiteit vindt (p.345)25. De positieve theorie neemt aan, dat individuen hun eigen baten en kosten afwegen bij het overleg over normen. Er is dan geen consensus meer, maar een botsten van individuele belangen (p.345). De macht (eigendom rn van middelen) bepaalt hoe de constitutie wordt ingevuld. De constitutie is dus partijdig (p.348). Er is wel empathie, maar zij is opgenomen in de individuele nutsfunctie.
In grote anonieme groepen moeten de normen en instituties formeel worden (p.326). Er ontstaan gezagsrelaties, die tezamen de constitutie vormen. Bij Coleman omvatten zij de grondwet, maar ook allerlei informele instituties (p.327)26. De interpersoonlijke nutsvergelijking verloopt via de relatieve macht (p.352-353). De macht is een indicatie van de belangen (baten en kosten), die individuen hebben. Groepen met grote belangen zullen hun rechten "opkopen" (via ruil). Daarom is Coleman minder bezorgd dan Binmore, dat de maatschappij instabiel zal worden. Immers, het evenwicht blijft gehandhaaft dankzij de voortdurende uitwisseling van hulpbronnen (resources), waarmee de individuen hun behoeften bevredigen (p.37-40 in ST). Echter de ruil is enkel mogelijk in een maatschappij met institutionele waarborgen. Het individuele gedrag wordt alleen dan ingeperkt via collectieve normen, wanneer daarvoor rationele redenen zijn, zoals het bestaan van externaliteiten (p.325 in ST).
Lang niet altijd zullen alle groepen instemmen met de constitutie (p.352). Sommige groepen zijn te zwak om de constitutie tegen te houden (p.353-354). De constitutie heet dan opgelegd optimaal, omdat het totale saldo van baten en kosten toch positief is. Anders dan Binmore veronderstelt, zijn de groepen soms niet in staat tot een heronderhandeling over de constitutie. Overigens zal in de practijk de opgelegde constitutie vaak bepaalde individuele rechten onaantastbaar maken (p.356). Groepen kunnen een ongunstige constitutie accepteren, omdat die beter is dan niets (p.354). Sommige constituties zijn ondemocratisch, zoals een schoolreglement (p.349). Coleman vertrouwt dus meer op dwang dan Binmore, die enkel zelfbindende (self-policing) normen levensvatbaar vindt. In gevallen met dwang is evenwel de gehoorzaamheid aan de constitutie niet vanzelfsprekend.
De groepsleden moeten bij voorkeur een exit optie hebben, want dat dwingt het gezag om enigszins rekening te houden met het algemeen belang (p.357). Uiteraard zal een besluit door de meerderheid meer legitimiteit hebben dan een autoritair dictaat (359). Maatschappelijk kapitaal helpt eveneens, omdat het vertrouwen inhoudt (p.359 en verder). Voorts zal een machtenspreiding de billijkheid bevorderen (p.363). Net zoals Binmore erkent Coleman, dat individuen neigen tot overtreden van de constitutie, wanneer dat in hun voordeel is. Daarom moeten instituten worden opgericht, die de diverse normen handhaven (p.327). De toezichthouder is een uitvoerend orgaan, zodat zich het beslisser-uitvoerder (principal-agent) probleem voordoet. De handhaving veroorzaakt zelf kosten, die de realisatie van een collectieve norm kunnen blokkeren. Zie p.271 in ST en de betreffende column in de Gazet27. Al met al botsen Coleman en Binmore op vele punten.
De Amerikaanse economen J.M. Buchanan en G. Tullock introduceren al in 1962 (dus tien jaren voor Rawls) de idee van de sluier van onwetendheid. Uw columnist kent hun werk uit het boek Public choice III (afgekort PC)28. Zij doen het belangwekkende voorstel om de maatschappelijke herverdelingen van inkomens geheel te regelen in de grondwet. Vervolgens kan het parlement zich toeleggen op de behartiging van groepsbelangen. De grondwet moet de opbrengsten van alle denkbare individuele acties φ inventariseren, en vervolgens bepalen welke van deze acties moeten worden verboden of verplicht (p.616 en verder in PC). Bijvoorbeeld, stel dat er twee groepen jagers zijn, n=1 en 2, met ieder Nn leden. De actie φn van de groep n geeft haar een nut v(φn), en schept een extern effect met nut of last e(φn) voor de groep m≠n. Het maatschappelijke nut van de actie φn is dus (p.620)
(11) W(φn) = Nn × v(φn) + Nm × e(φn)
Merk op, dat deze W een utilitaristische welvaartsfunctie is29. Het groepsnut wordt gewogen met de aantallen. In het constitutionele beraad weten de individuen niet, tot welke groep zij behoren. Zij zullen acties φn met W>0 toestaan. Echter als een dergelijke actie leidt tot v(φn)<0, dan zal de groep n haar niet uitvoeren. Daarom wordt in die situatie de groep n door de grondwet verplicht tot de actie. Acties φn met W<0 zullen achterwege blijven, zolang geldt v(φn)<0. Maar als geldt v(φn)>0, dan verbiedt de grondwet die actie. Verboden en verplichtingen kunnen worden vertaald in stemregels (voting rule) (p.622 en verder). Bijvoorbeeld, een verbod kan nodig zijn in de situatie Nn/Nm < -e(φn) / v(φn). Stel dat geldt v(φn)>0, dan zullen alle leden uit groep n de actie willen uitvoeren. De leden uit groep m≠n zijn tegen. De grondwet kan de actie blokkeren door een stemming voor te schrijven, die de actie enkel toelaat bij een relatieve meerderheid van 1 / (1−v/e) of meer.
Aldus zou het parlement bij alle acties kunnen besluiten via een gekwalificeerde meerderheid. De minderheid is steeds in staat om acties tegen te houden, die het totale maatschappelijke nut W zouden aantasten. Daarom kunnen de volksvertegenwoordigers egoïstisch (self-regarding) het belang van hun achterban verdedigen, zonder rekening te houden met het algemene belang (p.616). Aangezien dit model de empathie negeert, behoort het tot dezelfde type als het model van Coleman. Binmore zou wellicht tegenwerpen, dat de groep n de stemregel niet zal accepteren30.
Als de grondwet wordt opgevat als een maatschappelijk contract, dan moet het worden goedgekeurd op basis van unanimiteit. Unanimiteit (consensus) is mogelijk bij allocatieve besluiten (p.144 in PC). Besluiten over de verdeling leiden altijd tot belangenconflicten31. Er is een nul-som probleem. In die gevallen is de unanimiteit lastig, omdat de benadeelden gebruik zullen maken van hun veto-recht. Er kan een impasse ontstaan (p.143). Zelfs als een compromis mogelijk is, dan kunnen toch de transactie-kosten hoog worden (p.138). Binmore schakelt de individuele belangen uit door ze te verbergen achter de sluier. En hij omzeilt de impasse door aan te nemen dat de gedeelde cultuur leidt tot een collectieve empathie. Het is aanvechtbaar of deze situatie achter de sluier overeenkomsten heeft met de realiteit32.
Bij Binmore overlegt het constitutionele beraad over hervormingen van de status quo. Het startpunt is de bestaande verdeling van eigendommen, die tot stand is gekomen tijdens de historische ontwikkeling. Echter de historische verdeling is allesbehalve billijk. De grondwet moet nu het recht van eigendom definiëren (p.139). Het is onwaarschijnlijk, dat de rijke individuen bereid zijn om het overleg te voeren achter de sluier van onwetendheid. Maar zonder die sluier zal geen consensus worden bereikt over het recht van eigendom. De eis van unanimiteit bestendigt dan het onrecht. Er resteert enkel het besluit bij meerderheid (p.140). Maar dan dreigt het gevaar van de dictatuur van de meerderheid, die de minderheid uitbuit (p.142)33.
In de column over de homo economicus, van ruim vier jaren terug, wordt opgemerkt, dat de Nederlandse econoom P. Frijters en anderen een individuele nutsfunctie van de gedaante un = f(vn(xn), v1, ..., vn-1, vn+1, ..., vN) hanteren. Dat wil zeggen, het nut van de individu n hangt af van zijn eigen rijkdom xn, maar ook van het nut vm van de andere N−1 leden van zijn groep. Dan is de individu n een altruïst, want hij kan zijn eigen nut vergroten door anderen gelukkiger te maken. Binmore meent eveneens, dat een individu zijn rijkdom zal willen verminderen ten gunste van een ander. Echter hij beschouwt een dergelijke actie niet als een bewuste keuze, maar als een aangeboren gedrag. Het dient om de eigen genen beter te verspreiden, en bevoordeelt daarom primair familieleden. Zie p.413 en verder in Just Playing. Bij Coleman is de individu een zuivere egoïst. Immers, in zijn model verloopt alle wisselwerking als een ruil. Zuiver altruïsme is juist eenzijdig34.
Dien ten gevolge zullen theoretici, die de mens zien als een altruïst, bezwaar maken tegen de modellen van Binmore en Coleman. De econoom H. Gintis beweert in zijn boek The bounds of reason (afgekort BR), dat de menselijke natuur wel degelijk altruïstisch is35. Dit type altruïsme is niet barmhartig, maar gericht op wederkerigheid. Er is een verlangen naar samenwerken. In die zin is er toch een ruilverhouding. Daarom spreekt Gintis van altruïstisch straffen, wanneer een individu egoïstisch gedrag bij anderen wil ontmoedigen. Individuen zijn niet enkel self-regarding, maar ook other-regarding (p.49 in BR). Gintis meent, dat bijvoorbeeld in het bekende gevangenen-spel (prisoner's dilemma) wel degelijk zal worden samengewerkt. Hij onderbouwt zijn bewering met de resultaten van psychologische experimenten, die worden uitgevoerd in laboratoria (gewoonlijk met studenten als proefpersonen). Men zou zulke studies kunnen rekenen tot de gedragseconomie.
Gintis concludeert, dat pro-sociaal en deugdzaam gedrag vaak voorkomen (p.51 in BR). Een bijkomend fenomeen is de aversie van ongelijkheid (p.51). Het ultimatum spel laat zien, dat het straffen van onrecht voldoening geeft. Daarin krijgt de ene proefpersoon een bedrag, dat hij naar believen mag delen met een andere. Hier is een 50-50 verdeling het meest voorkomende resultaat (p.61). Helaas is de betrouwbaarheid van zulke experimenten omstreden. Volgens Binmore treedt samenwerking enkel op in langdurige relaties (spellen met herhaling). De proefpersonen in het laboratorium denken ten onrechte, dat het proefspel zal worden herhaald. Bovendien worden volgens Binmore de proefpersonen onvoldoende beloond, zodat zij weinig prikkels hebben om zich in te spannen voor een goed besluit (p.30 in JP).
Gintis herinnert er ook aan, dat werknemers zich door het efficiëntie loon aangespoord voelen om harder te werken (p.62 en verder). Wederkerigheid is een breed gedeelde norm. Vaak wordt wangedrag afgestraft door omstanders, hoewel die daar niet direct baat bij hebben (p.66). Trouwens, ook Binmore meent, dat er maatschappelijke controle is (p.310 en verder in JP). In experimenten blijken de proefpersonen te straffen, ook wanneer zij daaronder zelf lijden, en niet kunnen hopen op een later profijt (p.70 in BR). Gintis is zelfs overtuigd, dat individuen hechten aan deugdzaamheid. Hij noemt de moraal een meta-voorkeur (p.78 in BR). Bijvoorbeeld liegen vele individuen enkel, wanneer de waarheid zou leiden tot hoge kosten (p.77 in BR). Des ondanks zien Binmore en Coleman voldoende aanwijzingen voor de calculerende homo economicus, Gintis juist niet
Aldus blijft het totaalbeeld van de menselijke natuur verwarrend. Met name blijft onduidelijk, of altruïsme simpelweg een welbegrepen eigenbelang is. Coleman denkt van wel. Binmore denkt dat de aangeboren zelfopoffering in families zich onbedoeld uitbreidt naar groepen (p.421-422 in JP)36. Zelfopoffering is eigenlijk bedoeld voor de verspreiding van de eigen genen. Gintis en Frijters menen, dat mensen aangeboren sociaal zijn, en geneigd tot samenwerken. Overigens erkent Gintis, dat altruïsme vaak is beperkt tot de eigen kring (p.79 en verder in BR)37. Het verschil tussen al deze denkers is dus gradueel. Maar toch kunnen de consequenties voor de inrichting van de maatschappij ingrijpend zijn. De persoonlijke ervaringen bepalen, welk model de lezer zelf zal willen aanhangen.