Verdelen volgens Nash

Plaatsing in Heterodoxe Gazet Sam de Wolff: 2 september 2018

E.A. Bakkum is blogger voor het Sociaal Consultatiekantoor. Hij denkt graag na over de arbeiders beweging.

De huidige column geeft een gedetailleerde uitleg van het axiomatische model van John Nash voor de analyse van onderhandelingen. Zowel de symmetrische als de algemene variant worden behandeld. Het model van Nash wordt gerelateerd aan het model van Rubinstein voor een onderhandeling met tijdsdruk, aan het utilitarisme, en aan de proportionele methode. Er wordt getoond, hoe Binmore hieruit een model van maatschappelijke moraal afleidt. Tenslotte worden de modellen geconfronteerd met ervaringen uit de practijk.

De economische theorie van de twintigste eeuw analyseerde vooral situaties, waarin de verdeling van de rijkdom is gegeven. In een dergelijke situatie kan het maatschappelijke optimum worden bereikt door een paarsgewijze ruil van goederen tussen individuen, die aanschouwelijk is gemodelleerd met de Edgeworth box. Echter de Gazet heeft vanaf zijn aanvang ook aandacht besteed aan de invloed van groepsmacht op de maatschappelijke verdeling. Trouwens, de macht is zelfs al relevant in de Edgeworth box, omdat zij binnen de kern van mogelijke verdelingen bepaalt welk punt op de contractkromme wordt gekozen. Her en der is in de Gazet verwezen naar het marxisme, dat de verdeling van inkomens verklaart vanuit uit de macht, die voortkomt uit het eigendom van kapitaalgoederen. Een verdeling van inkomen op basis van macht is een onderhandelingsproces.

Natuurlijk moet hier even worden verwezen naar het wetenschappelijke werk van de marxist Sam de Wolff, de naamgever van de Gazet. Met name introduceert hij een ingenieus model van onderhandelen, dat de verdeling van het nationale inkomen wil verklaren. Volgens De Wolff eisen de werkers als beloning een vast minimaal nut1. Tegenwoordig zou men dit minimum het reserveringsnut van de werkers noemen. Vervolgens mag de ondernemer de arbeidstijd bepalen. Hij kiest die zodanig, dat zijn winst maximaal wordt. Het model van de Wolff laat zien, dat het mogelijk is om onderhandelingen over de verdeling wiskundig te modelleren. Hier is de onderhandeling nog eenzijdig, omdat in het marxisme de werkers enkel de eigen reproductie kunnen afdwingen. Na de Tweede Wereldoorlog heeft de wiskundige John Nash een algemener model van onderhandelen afgeleid, en dat is het thema van de huidige column.


Het model van Nash

Diverse columns hebben het model van Nash toegepast, zonder een uitleg over de theoretische grondslagen. Een jaar terug is de algemene Nash oplossing van een bilaterale onderhandeling beschreven, voor het geval van een netwerk. Eerder al hebben diverse columns het model toegepast op de onderhandeling tussen vakbonden en ondernemers. Recent is een model gepresenteerd, waarin de staat onderhandelt met een ondernemer over subsidie. Nog recenter is de column, waarin de Nash oplossing in verband wordt gebracht met maatschappelijke welvaartsfuncties (SWF). Het is dus inderdaad tijd om de Nash oplossing nader te analyseren. Zij heeft een interpretatie, die afwijkt van de welvaartsfuncties. Namelijk, de SWF beschrijft de voorkeuren van een centraal planorgaan inzake de verdeling. De Nash oplossing geldt voor de situatie, waarin een neutrale scheidsrechter besluit over het verdelingsvraagstuk. Het conceptuele onderscheid is inderdaad marginaal2.

Nash heeft zijn model ontwikkeld voor een bilaterale transactie. Echter het is eenvoudig toe te passen op grotere groepen. Stel dat de bestudeerde groep bestaat uit N individuen. De leden van de groep zijn tezamen betrokken bij een transactie of onderneming, die waarde voortbrengt. Zij xk (k=1, ..., K) de hoeveelheden van baten k dankzij de activiteit. De groep moet overeenstemming bereiken over de verdeling van de baten xk. Baten zijn per definitie nuttig. De voorkeuren van de individu n worden beschreven door de nutsfunctie un(x1(n), ..., xK(n)), waarbij xk(n) de hoeveelheid van k is, die n ontvangt. Elke verdeling leidt tot een nutsvector u = (u1, ..., uN). Het geheel van nutsvectoren u vormt een verzameling U van nutsmogelijkheden. Met andere woorden, het overleg over de onderneming schept de verzameling U. De figuur 1a toont een dergelijke verzameling voor het geval N=2 (in rose)3.

Afbeelding van verzamelingen van nutsmogelijkheden
Figuur 1: Verzamelingen van nutsmogelijkheden:
    (a) status quo ν en oplossing σ;
    (b) symmetrische verzameling en uitbreiding

De transactie gaat enkel door, wanneer alle N individuen er mee instemmen. Als geen overeenstemming wordt bereikt, dan blijft de bestaande situatie intact. Dit nutspunt ν wordt de status-quo genoemd. Zie de figuur 1a. Trouwe lezers herkennen een analogie met de Edgeworth box, die een vergelijkbaar startpunt ξ kent, zij het van hoeveelheden van baten xk. Uiteraard heeft de verzameling van nutsmogelijkheden een grens. Immers de hoeveelheden xk zijn eveneens begrensd. Deze grens wordt weergegeven door de nuts-mogelijkheden kromme. Zij is rood weergegeven in de figuur 1a. Nash neemt aan, dat de verzameling van nuts-mogelijkheden convex is4. Vervolgens leidt hij de oplossing σ van het verdelingsprobleem af door vijf eigenschappen te bedenken, die redelijker wijze zouden kunnen gelden voor de gezochte oplossing. Dit wordt een axiomatische aanpak genoemd.

De vijf eigenschappen worden nu stuk voor stuk besproken. De eerste eigenschap is individuele rationaliteit. Dit wil zeggen, dat de individu n geen oplossing zal accepteren, die slechter is dan zijn status quo νn. In de figuur 1a is voor de beide individuen deze eigenschap weergegeven door middel van de stippellijnen. De oplossing mag niet onder of links van de stippellijn liggen. Een individu zou inderdaad dwaas zijn om mee te werken aan een transactie, die hem enkel lasten brengt. Kennelijk is νn de reserveringswaarde van n. Bij een eenmalige transactie is ν het dreigings- of breekpunt. Bij een voortgaande (zich continu herhalende) transactie is ν het punt van de impasse of patstelling (deadlock)5.

De tweede eigenschap is de Pareto efficiëntie. De individu zal enkel oplossingen accepteren, die liggen op de nutsmogelijkheden kromme. Immers, zolang dit niet het geval is, kan hij zijn nut verbeteren, zonder het nut van de andere individuen te schaden. Merk op, dat de Pareto eigenschap vereist, dat alle individuen beschikken over een volledige informatie inzake de transactie. Immers, alleen dan kennen zij hun maximaal haalbare nut. Stel de overeenstemming is een (vectorieel) contract σ. Ter illustratie toont de figuur 1a dit contract σ, liggend op de kromme van nutsmogelijkheden. Merk op, dat de eigenschappen van individuele rationaliteit en Pareto efficiëntie ook relevant zijn voor de Edgeworth box. Zij definiëren er de zogenaamde kern6.

De derde eigenschap is symmetrie, ook wel anonimiteit genoemd. Zij geldt voor symmetrische verzamelingen U, zoals is weergegeven in het rose gebied van de figuur 1b. Een dergelijke verzameling blijft exact gelijk, wanneer zij wordt gespiegeld in de 45o lijn vanuit de oorsprong (gestippeld in de figuur 1b). De spiegeling is feitelijk een permutatie van de individuen 1 en 2. De symmetrie eigenschap stelt nu, dat voor de symmetrische verzameling alle σn gelijk zijn. In twee dimensies ligt σ op de 45o lijn, met σ12. De interpretatie is, dat gelijke individuen een zelfde nut halen uit de transactie. Niemand wordt gediscrimineerd.

De vierde eigenschap is de onafhankelijkheid van irrelevante alternatieven. Stel dat tijdens het overleg over het contract σ een gebeurtenis optreedt, die irrelevant is voor het contract. De status quo ν wijzigt niet. Wel veroorzaakt de gebeurtenis een uitbreiding van de verzameling U, bijvoorbeeld met de licht-groene delen in de figuur 1b. De eigenschap eist nu, dat een dergelijke irrelevante uitbreiding geen wijziging aanbrengt in het optimale contract σ. De eis lijkt triviaal7. Men kan de eigenschap ook omgekeerd voorstellen. Stel oorspronkelijk geldt de groene kromme van nutsmogelijkheden. Het optimale contract is σ. De mogelijkheden uit het groene gebied zijn irrelevant voor het contract σ. Nu worden die mogelijkheden geschrapt. Dan zal in de nieuwe situatie het contract nog steeds σ zijn.

Afbeelding van verzamelingen van nutsmogelijkheden
Figuur 2: Verzamelingen van nutsmogelijkheden:
    (a) translatie van het nutsveld (u1, u2);
    (b) relatieve schaling met factoren (β1, β2)

De vijfde en laatste eigenschap is de onafhankelijkheid van lineaire nuts-transformaties. Een dergelijke transformatie heeft de gedaante u'n = αn×un + βn, waarbij αn en βn constanten zijn. De transformatie varieert dus per individu n. De uitleg wint aan duidelijkheid door de translatie α en de relatieve schaling β afzonderlijk te beschouwen. De figuur 2a toont de translatie. Het hele nutsveld wordt simpelweg verschoven ten opzichte van het assenkruis. De nieuwe status quo wordt μ. Aangezien het nut links van ν1 en beneden ν2 geen betekenis heeft wegens de individuele rationaliteit, is de situatie niet wezenlijk veranderd. De nieuwe Nash oplossing schuift gewoon mee, en is τ. De onafhankelijkheid van translatie is handig, omdat men ν naar de oorsprong kan schuiven. Dat maakt de probleemstelling wat overzichtelijker.

Nash veronderstelde een onafhankelijkheid van de relatieve schaling β, omdat hij interpersoonlijke nutsvergelijkingen wilde vermijden. Immers, het nut un wordt uitgedrukt in de utils (nutseenheden) van n. Wanneer het contract σ zou afhangen van βn, dan zou het nut van de individuen n en m kunnen worden vergeleken via de verhouding βmn. Traditioneel zijn economen daarin terughoudend, omdat er dan feitelijk een morele afweging zou worden gemaakt tussen de belangen van de individuen n en m. Concreet betekent de onafhankelijkheid voor relatieve schaling β, dat de schaling het contract σ verandert in τ, met elementen τn = βn×σn. Zie de figuur 2b. Dat wil zeggen, het oude contract schaalt simpelweg mee met het nutsveld. Of meer formeel: zij B de schaling. Dan is het contract voor B(U) met status quo B(ν) gelijk aan B(σ).

Aan de hand van deze vijf eigenschappen kan nu de Nash oplossing voor een onderhandeling worden gedefinieerd. Zij is een recept om de vector σ(U, ν) te berekenen, die de overeenstemming tussen de N groepsleden representeert. Met andere woorden, σ wordt bepaald door de verzameling U van nutsmogelijkheden, de status quo ν, en het recept. Dat recept luidt:

(1)     maximaliseer voor de vectoren u in U:  Πn=1N (un − νn)

In de formule 1 is Π het wiskundige symbool voor vermenigvuldiging van de N termen. Nash ontdekte, dat deze oplossing voldoet aan de vijf genoemde eigenschappen. Bovendien kan worden bewezen, dat het recept van de formule 1 de enige (unieke) oplossing is8.

De volgende kanttekeningen bij de formule 1 zijn de moeite waard. De vijf eigenschappen passen eigenlijk beter bij een arbitrage (beslechting van een geschil) dan bij een onderhandeling. Dit is al opgemerkt in de inleiding. Er wordt verondersteld, dat de N individuen samenwerken. In het bijzonder wordt genegeerd, dat zij onderling coalities zouden kunnen vormen om voor zichzelf een beter resultaat te realiseren dan de Nash oplossing. Overigens speelde dat bij Nash zelf geen rol, omdat die N=2 beschouwde. Voorts is de Nash oplossing in zoverre niet billijk, dat de status quo ν wordt geaccepteerd als een gegeven. En de status quo kan uiterst onrechtvaardig zijn. Het onrecht in de startpositie treft men ook aan bij het verwante model van de Edgeworth box. In het bijzonder is het model van Nash niet een recept om de maatschappelijke welvaart maximaal te maken9.

De lezer dient zich bewust te zijn, dat de onafhankelijkheid van lineaire nutstransformaties ingrijpende gevolgen heeft. Bijvoorbeeld maakt zij mogelijk, dat de status quo ν onzichtbaar wordt gemaakt door een translatie naar ν'= 0. Inderdaad beschouwt de Nash methode enkel de verschillen un − νn. Bovendien kunnen de maximaal haalbare un voor alle individuen n gelijk worden gemaakt via de relatieve schaling, bijvoorbeeld tot unmax = 1. Het verschil tussen de individuen n wordt dan uitsluitend bepaald door de vorm van de grens van de verzameling U. Intuïtief ligt het voor de hand, dat een (qua nut) rijke individu n met een riante status quo ν in staat zal zijn om voor zichzelf een aanzienlijk deel van de opbrengst van de transactie af te dwingen. Immers nut hangt vaak samen met geld, en geldt vertegenwoordigt macht. De grens van U zal dan in zijn voordeel worden vervormd. Merkwaardiger wijze wordt dit aspect niet besproken in de geraadpleegde bronnen10.


De algemene oplossing van onderhandelen

In practische gevallen is het vaak nodig om afstand te doen van de derde eigenschap, de symmetrie of anonimiteit. Er wordt dan een parameter γn≥0 toegevoegd aan het model, waarmee de individu n wordt gekarakteriseerd. Deze modellering wordt een algemene Nash onderhandeling genoemd. Het algemene recept om de Nash oplossing te vinden luidt:11

(2)     maximaliseer voor de vectoren u in U:  Πn=1N (un − νn)γ(n)

Trouwe lezers zullen een gelijkenis zien tussen de formule 2 en de individuele nutsfunctie in de rationele keuze leer, die de gedaante u = Πm=1M cmγ(m) heeft. In de nutsfunctie drukt γm het gewicht uit, dat de individu toekent aan zijn behoefte om een hoeveelheid cm van het goed m te bezitten. Evenzo drukt γn in de formule 2 het gewicht uit, dat de arbiter of scheidsrechter toekent aan de belangen en behoeften van de individu n, maar nu in vergelijking met de andere individuen j≠n van de groep.

Ter illustratie van de algemene oplossing kan een bijzonder geval worden beschouwd, te weten een transactie met N=2, waarbij de verzameling U van nutsmogelijkheden wordt gegeven door u1 + u2 ≤ π 12. Dat wil zeggen, dankzij de transactie is een hoeveelheid nut π te verdelen. Men kan aantonen, dat in dit geval het meest redelijke contract in de geest van Nash wordt gegeven door13

(3)     σn = νn + (π − ν1 − ν2) × γn / (γ1 + γ2)

Hier is n=1 of 2. Aangezien de oplossing onafhankelijk is van translaties, mag men ν=0 nemen. Dan krijgt kennelijk de individu n een fractie γn / (γ1 + γ2) van het beschikbare nut π. Om deze reden wordt γn wel geïnterpreteerd als de onderhandelings-macht van n. Dat zou dan de macht zijn, die de arbiter toekent aan de individu n. Bij een gelijke macht wordt er eerlijk gedeeld: σn=π/N.


Het model van Rubinstein

Het vermelden waard is het model van Rubinstein, dat de algemene Nash oplossing afleidt op een totaal andere manier14. Dit model behoort tot de speltheorie, en wordt het spel van de afwisselende biedingen genoemd. De transactie betreft een groep van twee deelnemers (N=2), en levert een totaal nut van π op15. De twee individuen doen afwisselend biedingen over de verdeling van π. Merk op, dat zij allebei egoïstisch zijn, en dien ten gevolge niet streven naar een billijke oplossing, zoals de arbiter. Daarom wordt dit een transactie zonder samenwerking genoemd (al moeten de individuen natuurlijk wel tezamen de onderneming voltooien). Telkens nadat een bod is uitgebracht door een individu, trekt de ander zich terug gedurende een periode Δt om het bod te overwegen. De onderhandeling kent een zekere tijdsdruk, omdat de individuen liefst zo snel mogelijk profiteren van hun nut. Daarom wordt het nut afgewaardeerd in de tijd, met een disconto-factor van δn per periode Δt.

Stel dat de individu n aan de beurt is om een bod te doen. Elk verworpen bod reduceert de waarde van de transactie, omdat daarna een tijd Δt zal verstrijken. Daarom wil n (=1 of 2) een bod doen, dat aanneembaar is voor de andere individu m≠n. De individu n rekent uit, dat het voor m optimaal is om aan n een fractie xn van de totale waarde aan te bieden. Dan krijgt m zelf een fractie xm = 1 − xn. Echter aangezien m zijn bod later zal doen, is de waarde van de transactie al weer δm verminderd ten opzichte van het heden. De individu n kan handig gebruik maken van deze ontwaarding. Namelijk, hij biedt aan m een fractie δm×xm aan. Dit aanbod is precies even veel waard als het bod, dat m zelf een periode Δt later zal doen. Dat wil zeggen, m is indifferent ten opzichte van deze twee boden. Daarom zal m akkoord gaan met het huidige bod. En n krijgt een fractie xn = 1 − δm×xm.

Stel dat n door overmoed of laksheid een te laag bod doet. Dan is m aan de beurt om zijn beste bod te doen. De redenatie van zonet is ook toepasbaar voor m. Dat wil zeggen, zijn beste bod is δn×xn. Een rationele n gaat akkoord, zodat m een fractie xm = 1 − δn×xn krijgt. Substitueer deze formule in de zonet gevonden uitdrukking voor xn, dan is het resultaat16

(4)     xn = (1 − δm) / (1 − δn×δm)

Hier is natuurlijk δn×δm1×δ2. De formule 4 baseert op de aanname, dat n als eerste een bod mag doen. Dat geeft hem een voordeel. Stel gemakshalve even, dat geldt δ12=δ. Dan wordt de formule 4 gelijk aan xn = 1/(1+δ). Dien ten gevolge krijgt m een fractie xm = 1 − xn = δ/(1+δ), dus een factor δ minder dan n.

De disconto-factor δn en de disconto-voet dn zijn gerelateerd via δn = 1/(1+ dn). Zij rn de disconto-voet, die de continue ontwaarding aangeeft, te weten de ontwaarding voor extreem kleine tijdsintervallen. Men kan nu bewijzen, dat geldt δn = exp(-rn × Δt) 17. Substitueer deze relatie in de formule 4. Men kan met de aldus gevonden formule aantonen, dat in de limiet Δt→0 geldt xn = rm / (r1 + r2) 18. Hier is natuurlijk n=1 of 2, n≠m, net zoals voorheen. Deze verdeling xn treedt dus op bij biedingen met zeer kleine tussenliggende perioden. Nauwkeuriger gezegd, men kan niet meer waarnemen, welke individu het eerste bod doet. De verdeling is altijd hetzelfde, ongeacht wie begint19. Voor de vergelijking van de oplossing van Rubinstein met de Nash oplossing is de volgende vorm handiger:

(5)     xn = (1/rn) / ((1/r1) + (1/r2))

Een vergelijking met de formule 3 toont aan, dat de verdeling xn uit de speltheorie gelijk is aan de oplossing σn van de algemene Nash onderhandeling, onder de voorwaarde dat geldt 1/rn = γn! Naarmate de individu n een kleinere continue disconto-voet rn heeft, wint hij aan macht in de algemene Nash onderhandeling. Hierin zit enige logica, want een individu met een kleine rn is traag in het afwaarderen van de waarde π van de transactie. Een dergelijke individu is geduldig. Kennelijk leidt geduld tot macht20. Merk voorts op, dat een langdurige impasse tot gevolg zou hebben, dat de transactie al haar waarde verliest, wegens de disconto-factoren. De impasse kan hier worden opgevat als de status quo. Het breekpunt bestaat uit de externe alternatieven van de individuen. Die zijn hier irrelevant, omdat het model van Rubinstein een zekere oplossing aanreikt21.


Modellen met alternatieve axioma's

In de paragraaf over de Nash oplossing is de aanpak axiomatisch genoemd. De axioma's leiden tot de Nash functie fN(U, ν) in de formule 1 22. Hoewel de vijf axioma's van Nash redelijk zijn, kan men ook andere axioma's bedenken. Alternatieve axioma's leiden tot een andere functie f(U, ν). Zeker wanneer men fN wil opvatten als de nutsfunctie van de arbiter, ligt het voor de hand om alternatieve functies te zoeken, die tevens maatschappelijke welvaartsfuncties zijn23. Het utilitarisme en het proportionele beginsel leveren bekende welvaartsfuncties, te weten

(6a)     fU(U, ν) = Σn=1N αn × (un − νn)
(6b)     fP(U, ν) = minimum van αn × (un − νn) voor n=1, ..., N

Gewoonlijk laat men in de formule 6a de term -Σn=1N αn × νn achterwege, omdat zij een constante is. Welvaart is altijd relatief. Maar in het huidige betoog blijkt de schrijfwijze van de formule 6a handig te zijn. Het is in een oogopslag duidelijk, dat de utilitaristische en proportionele aanpak geen van beiden voldoen aan de onafhankelijkheid van lineaire nutstransformaties. Evenmin voldoen ze aan de eigenschap van symmetrie (anonimiteit). In tegendeel, de weegfactoren αn discrimineren tussen individuen, en in de formule 6b discrimineert bovendien νn. Daarom zijn noch fU noch fP redelijke functies om onderhandelingen te modelleren. Des al niettemin zijn zij van belang voor de huidige column, omdat zij een bijzondere relatie hebben met het model van Nash.

Namelijk, gewoonlijk leidt de maximalisatie van fU(U, ν) en fP(U, ν) tot twee verschillende optima op de nutsmogelijkheden kromme van U. Echter, beschouw het bijzondere geval, dat de beide functies hetzelfde optimum σ opleveren voor de welvaart. Stel de waarde van de functie fU(σ, ν) in het punt σ voor door Wσ. Per definitie geldt in het proportionele optimum, dat alle αn × (σn − νn) dezelfde waarde hebben. Aldus vindt men, dat het gedeelde punt σ moet voldoen aan

(7)     σn = νn + Wσ / (N × αn)

Afbeelding van model van Nash
Figuur 3: Model van Nash:
    functies voor de oplossingen van
    Nash, het utilitarisme,
    en de proportionele methode

Ter illustratie toont de figuur 3 het samenvallen van de twee optima voor het geval N=2. Het lijkt sterk op de figuur uit een andere recente column, over de welvaarts-economie. De groene lijn stelt de functie fU voor, en de blauwe lijn toont het verband tussen u1 en u2 volgens fP. De hellingen van de lijnen hebben dezelfde absolute waarde, te weten α12, maar bij fU is zij negatief. Het kruispunt van de twee lijnen is natuurlijk het punt σ, gelegen op de grens van U. Merk op, dat de lijn fU door σ ook het punt u = [ν1, ν2 + Wσ2] bevat. In dit punt is dus u2 − ν2 juist twee keer zo groot als σ2 − ν2, dat wil zeggen, u2 − σ2 = σ2 − ν2 24.

Bijzonder aan het geval van een gedeeld welvaarts-optimum σ bij utilitarisme en de proportionele methode is, dat σ tevens de oplossing van de symmetrische Nash onderhandeling is (dus bij γn=1 in de formule 2)! Dit kan als volgt worden aangetoond25. Merk allereerst op, dat de Nash functie fN(U, ν) in de formule 1 kan worden herschreven tot

(8)     gN(U, ν) = Σn=1N ln(un − νn)

Immers, gN = ln(fN) is maximaal bij dezelfde u als fN zelf. Merk vervolgens op, dat de formule 7 kan worden herschreven tot αn = (N / Wσ) / (un − νn), berekend in het punt u=σ. Dat wil zeggen, αn = (N / Wσ) × ∂(ln(un − νn))/∂un, in u=σ. Blijkens de formule 8 is dit hetzelfde als αn = (N / Wσ) × ∂gN/∂un, in u=σ. Nu is enerzijds de vector α de normaal op het hypervlak, gedefinieerd door fU=Wσ 26. Anderzijds is de vectoriële gradiënt ∂gN/∂un de normaal op het (N-1)-dimensionale oppervlak (verzameling, zo men wil) gN(u, ν) = V, waarin V een constante is. 27. Dien ten gevolge moet het oppervlak gN(u, ν) = Vσ, dat het punt σ bevat, raken aan het hypervlak fU=Wσ, waarbij σ het enige gedeelde punt is. Maar dan raakt gN(u, ν) = Vσ in σ aan de verzameling U. Kennelijk is σ inderdaad het punt van U, dat gN en fN maximaal maakt. Wegens de formule 1 is σ dan de Nash oplossing van de transactie. De oranje kromme in de figuur 3 toont fN(u, ν) = exp(Vσ) voor N=2.

De koppeling van de Nash oplossing aan de utilitaristische en proportionele oplossingen met gelijke weegfactoren α heeft een merkwaardige consequentie, die niet duidelijk wordt vermeld in de door uw columnist geraadpleegde bronnen. Namelijk, de Nash oplossing gaat uit van de eigenschap van symmetrie (anonimiteit). Echter de utilitaristische en proportionele oplossingen voldoen nadrukkelijk niet aan die eigenschap. Kennelijk verwijdert de restrictie van een proportionele verdeling de interpersoonlijke vergelijking uit de utilitaristische welvaart, en omgekeerd. Des al niettemin laat dit zien, dat men de Nash oplossing wel degelijk kan zien als een resultaat, dat is bereikt via morele afwegingen op basis van interpersoonlijke vergelijkingen28.


De moraal volgens Binmore

Een belangrijke prikkel om het transactie-model van Nash te analyseren is het verwerven van meer inzicht in het maatschappij-model van Ken Binmore, dat geheel is gebaseerd op het Nash-model. Een half jaar terug is in een column uitgelegd, dat Binmore de ontwikkeling van de moraal toeschrijft aan het constitutionele beraad in de zin van de filosoof J. Rawls. Het maatschappelijk contract wordt vastgelegd in een beraad van alle burgers, dat wordt gevoerd achter een sluier van onwetendheid. Binmore stelt, dat de sluier de maatschappelijke positie van elke burger wegfiltert uit diens geheugen. Echter de transparantie van de sluier is voldoende groot om de status quo ν van de maatschappij te ontwaren. Het beraad kan worden gemodelleerd met het model van Nash. De burgers streven hun eigenbelang na, maar zijn daarnaast in staat tot empathie. Zij kunnen zich wederzijds inleven. Dat is essentieel om te kunnen samenleven.

In een column van een maand terug wordt uitgelegd, dat Binmore in zijn maatschappij-model handig gebruik maakt van het samenvallen van de oplossingen van Nash, het utilitarisme, en de proportionele methode (die een variant is van het maximin beginsel). Alledaagse onderhandelingen en het constitutionele beraad verlopen allebei volgens het recept van Nash. Tijdens het beraad is er anonimiteit (symmetrie), waardoor een morele afweging van belangen achterwege dreigt te blijven. Echter dit gebrek wordt verholpen door de Nash-oplossing σ te koppelen aan het utilitarisme en de proportionele methode. Immers de weegfactoren αn zijn een moreel oordeel over de manier, waarop de opbrengsten moeten worden verdeeld over de individuen. Dankzij de empathie en de sluier bereikt het beraad overeenstemming over de optimale waarden van αn. Binmore noemt de αn de empathische voorkeuren met betrekking tot de diverse maatschappelijke posities n.

Afbeelding van verzamelingen van nutsmogelijkheden
Figuur 4: Verzamelingen van nutsmogelijkheden:
    (a) proportionele groei; (b) disproportionele groei

Aangezien het beraad over het maatschappelijk contract zelden plaats vindt, zijn op de korte termijn de αn-waarden onveranderlijk29. Klaarblijkelijk zijn de waarden van αn dan in evenwicht. Zij worden bijgesteld op de middellange termijn, tijdens de diverse constitutionele beraden. Op die manier kan men rekening houden met de maatschappelijke veranderingen. De interpersoonlijke nutsvergelijking αnm met n≠m wordt dan aangepast aan de nieuwe status quo. De diverse nutseenheden (utils) krijgen een andere ruilwaarde. De evenwichtige moraal evolueert dus pad-afhankelijk. Tijdens het beraad wordt de moraal gebaseerd op de utilitaristische welvaartsfunctie (formule 6a)30. Immers, men verlangt naar een hoge en toenemende welvaart. De utilitaristische oplossing is een uiting van de collectieve empathie. Het beraad moet tenslotte leiden tot consensus over een toekomstige maatschappij σ, en een een plan (overeenkomst) om haar te realiseren.

Dat maatschappelijke contract heeft enkel zin, wanneer het groeipad van ν naar σ uitvoerbaar is. De voltooiing van de groei vergt een zekere tijd. Dit is het alledaagse leven op de korte termijn, waarin de individuen zijn gericht op hun eigenbelang. Daarom eisen zij de toepassing van de proportionele oplossing. Maar dan moet de groei naar σ verlopen via de lijn door ν en σ, met in elk punt dezelfde αn × (un − νn) voor alle N. Zie de figuur 4a. Met andere woorden, de economische groei zal per definitie de status quo ν verschuiven. Als die verschuiving niet verloopt over de zonet genoemde lijn, dan zouden de burgers een andere Nash-oplossing σ eisen. Zij zouden willen heronderhandelen over het contract. Zie de figuur 4b31. Daarom is evenredigheid essentieel. Aldus legt de uitvoerbaarheid een restrictie op aan de utilitaristische maximalisatie. Dat garandeert, dat het maatschappelijk contract zelf-afdwingend (verinnerlijkt) wordt (self-enforcing of self-policing).

Aldus lijkt de wetenschappelijke verdienste van Binmore vooral te zijn, dat hij een maatschappelijke betekenis geeft aan bestaande wiskundige modellen. Het ideologische uitgangspunt is de mensbeeld van de empathische egoïst. In de status quo sluiten de individuen tezamen een maatschappelijk contract (constitutie) af, dat een weerslag is van de collectieve moraal. De individuele empathische voorkeuren zijn voldoende gelijk om tot een collectief compromis te komen. Het resultaat is de Nash oplossing, een compromis tussen de welvaart en de billijkheid, hier in de zin van wederkerigheid. Binmore plaatst de interpersoonlijke nutsvergelijking centraal als het fundament voor de subjectieve ethiek32. De proportionele aanpak krijgt dan de betekenis van de individuele zelf-verplichting aan het contract. Op die manier reikt Binmore een interessant abstract denkkader aan. Uw columnist kent echter geen practische toepassingen van het model van Binmore33.


Onderhandelingen in de practijk

Uiteraard is het belangwekkend om te weten of het model van Nash overeenkomt met de practische ervaringen in de reële wereld. De gedragseconomie heeft onderhandelingen onderzocht in laboratorium studies. Bij zulke experimenten is gebleken, dat de individuen de beschikbare informatie interpreteren op een vooringenomen manier (self-serving bias)34. Dat is natuurlijk niet rationeel. In zulke situaties kan een arbiter correcties aanbrengen op de visie van de betrokkenen. Ook het model van Rubinstein is nagebootst in experimenten. Het blijkt dat bij herhaalde spellen sommige individuen inderdaad leren om de formule 4 toe te passen. Het leerproces kan echter traag verlopen35. Kennelijk is althans in zulke experimenten de aanname van rationeel handelende individuen twijfelachtig.

Het symmetrische model van Nash negeert de invloed van individuele macht. Maar vaak zal macht juist een doorslag gevende factor zijn voor de verdeling. In de rationele keuze leer wordt de macht gelijk gesteld aan de totale waarde van de hulpbronnen, waarover een individu beschikt. In een eerdere column over deze leer is gesteld, dat rijke individuen tijdens een transactie hun positie kunnen versterken door ondersteuning te "kopen". Zij hebben veel te bieden aan de individuen in hun netwerk. Ook buiten de rationele keuze leer geven economische theorieën een prominente plaats aan de macht, zoals de modellen van rente zoeken. De rol van macht in het model van Binmore is lastig te doorzien. Men vraagt zich af, waarom een machtige individu zijn positie zou willen vergeten tijdens het beraad achter de sluier36. Anderzijds zit wellicht de macht indirect verwerkt in het model van Nash, via de vorm van de grens van de verzameling U.

Voorts is er een enorme hoeveelheid handleidingen, die adviezen geven over de strategie van onderhandelen. Een speciale vermelding verdient het boek Excellent onderhandelen (afgekort EO), dat voortkomt uit het Harvard Negotiation Project, en dus een wetenschappelijke achtergrond heeft37. De auteurs benadrukken het belang van het beste alternatief zonder overeenkomst (afgekort BAZO, in het Engels BATNA of best alternative to a negotiated agreement). Aangezien het BAZO simpelweg de status quo νn is, wordt aldus het model van Nash bevestigd. Bijvoorbeeld kan νn de nutswaarde zijn, die de individu n in handen zou krijgen, wanneer een externe arbiter of rechtbank zou beslissen over de verdeling van de opbrengst. In EO wordt benadrukt, dat de deelnemers van het overleg over de transactie moeten proberen om hun status quo (breekpunt, zekerheidsniveau, reserveringsnut) te verbeteren, zodat νn feitelijk dynamisch is.

Een ander advies van EO is het onderzoeken van de wederzijdse belangen, omdat daardoor waarschijnlijk de te verdelen opbrengst van de transactie kan worden vergroot. Dan expandeert de verzameling U. Men noemt dit ook wel de win-win strategie. Het tonen van empathie is een wenselijke eigenschap. In dit opzicht sluit EO zich aan bij de visie van Binmore. Ook wordt aangeraden om het overleg te baseren op objectieve criteria (kosten, normen, conventies, wetenschappelijke opvattingen, en dergelijke). Dat vergroot de kans op een rationeel resultaat. En de gekozen oplossing moet niet worden beïnvloed door irrelevante bijkomstigheden. In het bijzonder wijst EO er op, dat de goede verstandhouding tussen de individuen moet worden gescheiden van de overeenkomst. Aldus worden een aantal eigenschappen van de Nash oplossing aangeprezen in EO.

Afbeelding van DGB plakbiljet
Figuur 5: DGB plakbiljet

Maar er zijn ook verschillen tussen EO en het model van Nash. Met name veronderstelt EO absoluut geen symmetrie of anonimiteit bij de diverse participanten aan het overleg over de transactie. Een vaardige onderhandelaar behaalt betere resultaten dan emotionele of starre individuen. De individuele macht, zoals het beschikken over een aantrekkelijk BAZO, bepaalt mede de verdeling van de opbrengsten. Deze kritiek op het model van Nash geldt natuurlijk evenzeer voor het model van Rubinstein. Anderzijds moet worden erkend, dat een asymmetrische situatie vermoedelijk weinig zal voorkomen bij de institutionele onderhandelingen, zoals die tussen belangenorganisaties.

In de Nederlands-talige publicaties heeft het boek Onderhandelen (afgekort OH) enig aanzien verworven38. Er wordt betoogd, dat onderhandelen vraagt om een gedrag, dat ligt tussen samenwerken en vechten39. De arbiter in het model van Nash, die alle belangen zorgvuldig afweegt, suggereert juist, dat samenwerking wenselijk is. In OH wordt de onderhandeling voorgesteld als een bij uitstek dynamisch proces, waarin elke individu invloed uitoefent op de machtsbalans, de procedures, de sfeer en de eigen achterban. Er is duidelijk geen sprake van individuele anonimiteit. Volgens OH moet de onderhandelaar weliswaar bereid zijn tot compromissen, maar toch de eigen belangen (un) verdedigen. Dat vereist een gedrag, liggend tussen exploreren en star blijven. De uitwisseling van informatie is zelden volledig, omdat zij tactisch wordt ingezet. Daarom is de verzameling U van alternatieven nooit volkomen bekend.

De conclusie van het model van Rubinstein wordt algemeen onderschreven door de deskundigen. Immers, het belang van geduld wordt vermeld in alle handleidingen over onderhandelen40. Deze literatuur bevestigt, dat de beschikbare informatie nooit compleet is41. Het gedrag tijdens de onderhandeling kan irrationeel zijn42. Soms wordt de win-win strategie aanbevolen43. Hoewel het belang van de BAZO (ν) wordt erkend, is toch de algemene opvatting, dat men steeds moet proberen om impasses te doorbreken44. Impasses zijn simpelweg een natuurlijk onderdeel van de onderhandeling.

Merkwaardiger wijze is er weinig aandacht voor de daadwerkelijke uitvoering van de overeenkomst45. Immers, Binmore wijst er terecht op, dat een contract fragiel is, wanneer het onvoldoende tegemoet komt aan de belangen van de betrokken individuen. Een goede overeenkomst moet aanzetten tot zelf-verplichting. De betrokken groep als geheel moet zich inzetten voor de naleving. En tenslotte maakt vooral de populaire literatuur weinig onderscheid tussen politiek-institutionele en alledaagse onderhandelingen46. Dus het is logisch dat zij enigszins verschilt van de modellen in deze column, die vermoedelijk vooral zijn bedoeld voor institutionele processen.

  1. Zie p.368 en 449 van Het Economisch Getij (1929, J. Emmering) door S. de Wolff. (terug)
  2. Zie p.838 van Microeconomic theory (1995, Oxford University Press) van A. Mas-Colell, M.D. Whinston en J.R. Green, of p.123 in The economics of the trade union (1996, Cambridge University Press) van A.L. Booth. Op p.209 in Rational-Choice-Theorie (2011, Juventa Verlag) van N. Braun en T. Gautschi wordt daadwerkelijk verondersteld, dat de Nash oplossing de welvaart van de betrokken groep maximaal maakt. Voor uw columnist gaat die bewering net een stap te ver. (terug)
  3. Sommige leerboeken, waaronder die van de econoom K. Binmore, behandelen het model van Nash niet met de nutsverzameling U, maar met de verzameling X van mogelijke opbrengsten x (pay-off). Uw columnist heeft zelf (nog) geen voorkeur voor de methode met U of X. Hij volgt de conventie in Microeconomic theory, die baseert op U, omdat dit boek indruk maakt door zijn nauwgezette argumenten. De verzameling U heeft een variabele omvang, zodat kennelijk U niet uniek bepaald is door de transactie. Allereerst mag U ook situaties omvatten, waarin leden zichzelf benadelen door uitsluitend lasten op zich te nemen. Zelfs een negatief nut is denkbaar. Daarnaast kan U ook het nut omvatten, dat niet logisch voortkomt uit de transactie. Zulk irrelevant nut heeft geen invloed op de optimale verdeling volgens Nash. Zie verderop in de column de onafhankelijkheid van irrelevante alternatieven. (terug)
  4. Volgens p.44 en 946 in Microeconomic theory is een verzameling U convex, wanneer bij twee punten u1 en u2 van U ook alle punten op het verbindende lijnstuk in U liggen. Ook een functie f(x) kan convex zijn (p.931). Dit is het geval, wanneer voor alle x in het interval [x1, x2] geldt, dat het lijnstuk tussen f(x1) en f(x2) boven f(x) ligt. Bij een differentieerbare f komt dit overeen met ∂²f/∂x² > 0. Met andere woorden, f stijgt steeds sneller of daalt steeds minder, bij een toenemende x. Het begrip concaaf is omgekeerd aan convex. Bij een concave verzameling ligt het verbindende lijnstuk buiten de verzameling. Bij een concave functie is ∂²f/∂x² < 0. Aldus doet zich de verwarrende situatie voor, dat de convexe verzameling U van de hoofdtekst een nuts-mogelijkheden kromme (grens) heeft, die kan worden voorgesteld door een concave functie. U is convex, omdat de nutsfunctie un(xk) concaaf is (p.930). Namelijk, naarmate de individu n meer krijgt van xk, neemt het grensnut ∂un/∂xk af. Als tevens de individu m minder krijgt van xk, dan neemt het grensnut ∂um/∂xk toe. In die situatie wordt de marginale substitutie-verhouding dum/dun steeds negatiever. Dat maakt in de figuur 1a inderdaad aannemelijk, dat de nuts-mogelijkheden kromme een concave functie is. Merk op, dat de aanwezigheid van deze grens van U betekent, dat U een gesloten verzameling is (p.943-944).
    Deze definities kunnen ook worden gehanteerd bij ruimtes met N dimensies (RN). Het equivalent van de nutsmogelijkheden kromme is in dat geval de verzameling met N-1 dimensies, die de grens vormt van U. Gewoonlijk is het geen hypervlak. Uw columnist zou dit een (N-1)-oppervlak willen noemen. (terug)
  5. Zie p.66 in Just playing (1998, The MIT Press) van K.G. Binmore. De opmerking over de impasse als ν wordt ook gemaakt op p.389 van Labor economics (2004, The MIT Press) van P. Cahuc en A. Zylberberg. Op p.473 in Game theory and political theory (1993, Cambridge University Press) van P.C. Ordeshook wordt νn het zekerheidsniveau genoemd, in de context van speltheorie. (terug)
  6. Deze opmerking wordt gemaakt op p.470 in Game theory and political theory. (terug)
  7. Het is moeilijk voorstelbaar, hoe de oplossing afhankelijk kan zijn van irrelevante alternatieven. Op p.471 in Game theory and political theory (1993, Cambridge University Press) wordt het volgende voorbeeld gegeven. Een gast bestelt soep in een restaurant. Het menu geeft de keuze uit groentesoep en tomatensoep. De gast bestelt groentesoep bij de bediende. De bediende deelt nu mee, dat er ook kippesoep verkrijgbaar is. De gast begrijpt dat deze nieuwe informatie zijn keuzeruimte vergroot, en dat is nuttig. Echter hij heeft een hekel aan kippesoep. Daarop besluit hij om zijn bestelling te veranderen van groentesoep in tomatensoep. (terug)
  8. De uniciteit van de Nash oplossing σ wordt bewezen op p.843-844 in Microeconomic theory. Het argument gaat als volgt. Voer gemaks halve de translatie naar ν=0 uit (eigenschappen 1 en 5). Zij σ de Nash oplossing uit de formule 1, op basis van de maximalisatie van fNash(U) = Πn=1N un, waarbij de verzameling U willekeurig is. Stel er is een tweede recept voor de oplossing, naast de formule 1, nu op basis van een functie g(U). Noem die oplossing τ. Via twee hulp-verzamelingen E en V zal worden bewezen, dat dit recept op basis van g(U) moet leiden tot de Nash oplossing σ. Beschouw eerst de verzameling E, die is gedefinieerd door Σn=1N u'n ≤ N. De verzameling E is symmetrisch, zodat de oplossing τ van g(E) moet leiden tot een gelijke verdeling van u'n (eigenschap 3). Dat betekent τn=1 voor alle n. Wegens de onafhankelijkheid voor relatieve schaling heeft men de vrijheid om τ te schalen volgens un = βm×u'n, met βn = σn (eigenschap 5). Dat verandert de verzameling E in de verzameling V, die wordt gedefinieerd door Σn=1N unn ≤ N. Merk op, dat τ dankzij de relatieve schaling verandert in σ. Wegens Pareto efficiëntie ligt de oplossing σ op de grens van V (eigenschap 2). De grens van V wordt gevormd door een hypervlak, net zoals trouwens die van E (p.64). Kennelijk delen de verzamelingen U en V het punt σ. Nu kan worden aangetoond, dat U wordt omvat door V. Aangezien σ een oplossing is voor beide verzamelingen, zijn kennelijk de extra alternatieven in V irrelevant. De oplossing is onafhankelijk van die alternatieven (eigenschap 4). Maar dat wil zeggen, dat ook de oplossing τ van g(V) wordt gedeeld door U en V. Aangezien τ en σ samenvallen in V, is dat evenzo het geval in U. Met andere woorden, g en fNash zijn identiek, hetgeen was te bewijzen. Rest nog het aantonen, dat U wordt omvat door V. Men kan dit wiskundig als volgt zien. De functie in de formule 1 met ν=0 kan worden herschreven in de gedaante fNash(U) = Σn=1N ln(un). Kennelijk is de normaal van het lichaam fNash = constant gelijk aan ∂fNash/∂un, dus aan (1/u1, ..., 1/uN) (p.934). Per definitie is fNash maximaal in σ. Daar is de normaal (1/σ1, ..., 1/σN). Dat is tevens de normaal op het hypervlak, dat de grens is van V. Kennelijk delen U en V niet enkel het punt σ, maar is dit zelfs hun raakpunt. Aangezien bovendien V een hypervlak is, wordt U omvat door V. Terzijde zij vermeld, dat uw columnist deze geometrische theorie ruim veertig jaren terug heeft geleerd als onderdeel van een studie natuurkunde. Dit is echt materie voor gevorderden. Zelfs bij uw columnist, die nadien de kennis nooit meer heeft gebruikt, is het inzicht wat roestig geworden, en zou in een ideale wereld moeten worden opgefrist. (terug)
  9. De mogelijkheid van een onbillijke ν wordt geopperd op.577 in Public choice III (2009, Cambridge University Press) van D.C. Mueller. De theorie van de vorming van coalities maakt vaak gebruik van de zogenaamde Shapley waarde. Op p.472-473 in Game theory and political theory wordt gewezen op situaties, waarin de individuen invloed kunnen uitoefenen op de status quo ν. Dat is bijvoorbeeld het geval, wanneer het model van Nash wordt toegepast in de speltheorie. De transactie wordt dan opgevat als een bepaalde combinatie van strategieën sn van de deelnemers n aan het spel. En de status quo wordt dan bepaald door een strategie s met een slechte opbrengst. Als de individu n beschikt over een strategie sn, waarmee hij de andere deelnemer(s) schade kan berokkenen, dan kan hij die gebruiken als een dreigement om daarmee zijn eigen opbrengst te vergroten. Er is dan sprake van vechtgedrag. Zelfs een onafhankelijke arbiter zal zulk gedrag niet kunnen negeren. Ordeshook laat zien, dat vechtgedrag op basis van ongelijke strategieën zelfs mogelijk is in een situatie, die symmetrisch (anoniem) is in de betekenis van het model van Nash. Elke deelnemer n probeert om ν zodanig te beïnvloeden, dat zijn nut σn maximaal wordt. De status quo is dan endogeen. Natuurlijk kan men tegenwerpen, dat het model van Nash niet is bedoeld voor zulke situaties. (terug)
  10. Op p.290-296 en verder in Playing fair (1994, The MIT Press) voert K. Binmore inderdaad een lineaire transformatie uit, die de nutswaarden beperkt tot het interval [0, 1]. (terug)
  11. Zie p.150 in The economics of the trade union of p.207 en verder in Rational-Choice-Theorie. (terug)
  12. Zie p.150 in The economics of the trade union, of p.209 in Rational-Choice-Theorie. (terug)
  13. De oplossing wordt gevonden met de bekende methode van Lagrange. Neem de logaritme van de formule 2. Dan wordt de Lagrangiaan L = Σn=12n × ln(un − νn) + λ × (π/2 − un)), waarin λ de multiplicator van Lagrange is. De eerste-orde voorwaarden leiden tot γn / (un − νn) = λ en π = u1 + u2. Deze relaties bepalen u=σ. Invullen en enig herschrijven geeft σn = νn + (π − ν1 − ν2) × γn / (γ1 + γ2), hetgeen was te bewijzen. Zie p.150 in The economics of the trade union. (terug)
  14. Zie p. 151-152 in The economics of the trade union, of p.123-126 in Just playing. (terug)
  15. Wellicht spreken sommigen liever van opbrengst (payoff) dan van nut, omdat de verdeling van nut π een interpersoonlijke nutsvergelijking vereist. Een ander voordeel van de payoff is, dat kan worden bestudeerd hoe een verschillende risico mijding bij de betrokken individuen de verdeling beïnvloedt. Zie p.69-70 in Just playing.
    Op p.383-388 in Labor economics wordt verondersteld, dat na het bereiken van een overeenkomst over de verdeling van π de transactie in alle navolgende perioden (tot in alle eeuwigheid) zal worden herhaald, met de afgesproken verdeling. Uw columnist ziet niet in, wat voor nuttigs deze veronderstelling toevoegt aan het betoog. (terug)
  16. Het is vaak wenselijk om te beschikken over meerdere naslagwerken, omdat de uitleg soms onduidelijk is. Bijvoorbeeld stelt p.152 van The economics of the trade union, dat het onderzochte probleem stationair is. Inderdaad is de formule 4 niet tijdgebonden. Maar het maakt uit wie het eerste bod doet, en het totale nut π verliest aan waarde met het verstrijken van de tijd. Dan is het woord stationair nogal verwarrend. En op p.125 in Just playing wordt uiteen gezet, dat de individu n niet lager mag bieden dan de xn van de formule 4, omdat het spel slechts één (uniek) deelspel-volkomen evenwicht mag hebben. Uw columnist meent, dat het concept van het deelspel-volkomen evenwicht onbesproken kan blijven. Op p.431-432 in Labor economics wordt eveneens aangetoond, dat de hoogte van het bod uniek is. (terug)
  17. Hier wordt p.73 in Just playing geraadpleegd. Eerst moet worden overgestapt van de discrete perioden Δt naar een continue tijdsvariabele t. Definieer t = τ×Δt. Dan is de disconto-factor voor t gelijk aan δnτ. Noem de bijbehorende disconto-voet d(t). Nu is de voet voor continue afwaardering rn = limt→0 d(t)/t = limτ→0 (-1 + 1/δnτ) / (τ×Δt). Herschrijven geeft -rn×Δt = limτ→0 (1 − 1/δnτ) / τ = limτ→0 (1 − exp(-τ × ln(δn))/τ. Voor de voltooiing van het bewijs is de regel van l'Hôpital handig. Uw columnist heeft die regel ruim veertig jaren geleden geleerd tijdens de natuurkunde studie. Zie bijvoorbeeld p.531 in Introduction to the theory of statistics (1974, McGraw-Hill) van A.M. Mood, F.A. Graybill en D.C. Boes. De regel is: stel er zijn functies f(τ) en g(τ), waarvoor geldt limτ→a f(τ) = limτ→a g(τ) = 0. Dan is limτ→a f(τ) / g(τ) = limτ→a (∂f/∂τ) / (∂g/∂τ). Dus neem f(τ) = 1 − exp(-τ × ln(δn)) en g(τ) = τ dan volgt uit de regel dat -rn×Δt = ln(δn). Met andere woorden, δn = exp(-rn×Δt), hetgeen was te bewijzen. (terug)
  18. De substitutie leidt tot xn = (1 − exp(-rm×Δt)) / (1 − exp(-(r1+r2) × Δt)). Neem de limiet Δt→0, en pas de regel van l'Hôpital toe (zie voorgaande voetnoot). Kies hiertoe f(Δt) = 1 − exp(-rm×Δt) en g(Δt) = 1 − exp(-(r1+r2) × Δt). Het resultaat is xn = rm / (r1+r2), hetgeen was te bewijzen. Zie p.153 in The economics of the trade union of p.126 in Just playing. (terug)
  19. Op p.128 in Just playing tekent Binmore het model van Rubinstein in een nutsveld, zoals de figuur 1a van de column. Zolang nog geldt dat Δt>0, liggen er twee oplossingen op de nuts-mogelijkheden kromme, voor de gevallen dat individu 1 of individu 2 het eerste bod doet. De twee oplossingen versmelten voor Δt→0. (terug)
  20. Zie p.129 in Just playing. (terug)
  21. Zie p.129-130 in Just playing. Op p.171 wordt de situatie beschouwd, waarin de impasse leidt tot kosten cn per tijdseenheid τ = t/Δt. Dan wordt de impasse een last, en de status quo schuift naar negatieve waarden. (terug)
  22. Misschien is deze formulering wat slordig of verwarrend. Op p.839 in Microeconomic theory wordt gesproken van een vector-functie σ = f(U, ν), die de oplossing σ geeft bij U en ν. Deze functie wordt ook aangeduid als een regel om de oplossing te vinden. Uw columnist bedoelt hier in de hoofdtekst een echte functie, te weten de scalar-functie, die maximaal moet worden gemaakt om het unieke punt σ op de grens van U te vinden. (terug)
  23. Zie p.841 in Microeconomic theory. (terug)
  24. Zie p.842 in Microeconomic theory. (terug)
  25. De argumentatie is ontleend aan p.842-843 in Microeconomic theory. Op p.86 in Just playing wordt de argumentatie in een andere volgorde gehouden. Bovendien is zij beperkt tot het geval N=2. Het startpunt in Just playing is de raaklijn aan U met de Nash oplossing σ als raakpunt. Binmore stelt op p.79-80, dat de relatie u2 − σ2 = σ2 − ν2 geldt, waarbij u2 het punt op de raaklijn is met u11. Hij bewijst dat niet, maar verwijst naar één van zijn andere boeken. Op p.86 constateert Binmore, dat de raaklijn aan U in σ tevens de functie fU van de utilitaristische oplossing definieert. Dus σ is de ook de utilitaristische oplossing. De helling van de raaklijn is -α12. Vanwege de zonet genoemde gelijkheid van afstanden moet dan de vector σν een helling van α12 hebben. Dat wil zeggen, als men de oplossing bepaalt met de proportionele methode, dan garandeert de keuze van de weegfactoren α1 en α2, dat σ ook de proportionele oplossing is. Kennelijk vallen dan de oplossingen van Nash, utilitarisme, en de proportionele methode samen, hetgeen was te bewijzen. De lezer zij gewaarschuwd, dat op p.88 in Playing fair het samenvallen van de drie oplossingen simpelweg wordt aangenomen, zonder bewijs. Omgekeerd verwijst Just playing regelmatig naar Playing fair. (terug)
  26. Immers, men heeft fU = α · (uν). Neem twee willekeurige punten v en w op het hypervlak fU = Wσ, dan is α · (vw) = 0. Kennelijk is α de normaal op het hypervlak. (terug)
  27. Deze constatering heeft uw columnist veertig jaren terug ooit eens geleerd tijdens de natuurkunde studie. Op p.115 en 121 in Infinitesimaalrekening (1969, Uitgeverij Het Spectrum N.V.) van F. van der Blij en J. van Tiel wordt dit aangetoond voor respectievelijk de gevallen N=2 en N=3. Een algemene redenatie moet ongeveer als volgt gaan. Zij gN(u, ν) = Vσ het (N-1)-dimensionale oppervlak, dat σ bevat. Beschouw een punt σ + Δu, dat eveneens ligt in het oppervlak. Dan is gN(σ, ν) = gN(σu, ν). Wegens de formule 8 is dan Σn=1N ln(1 + Δun / (σn - νn)) = 0. Ontwikkel de formule in een Taylerreeks (p.29 in Infinitesimaalrekening). Dan is ln(1 + Δun / (σn - νn)) = Δun / (σn - νn) + O(Δun²), waarin O(Δun²) een term van orde Δun² is. Er volgt Σn=1N (Δun / (σn - νn) + O(Δun²)) = 0. Kennelijk is Δu · grad(gN) = 0 in σ, op een term Σn=1N O(Δun²) na. Neem aan, dat de vector Δu een infinitesimaal kleine lengte heeft, zodat die term verwaarloosbaar is. Wegens de infinitesimale lengte van Δu liggen alle punten op die vector in het beschouwde oppervlak gN=Vσ. Dan staat grad(gN) loodrecht op het oppervlak, hetgeen was aan te tonen.
    Op p.843 in Microeconomic theory wordt een andere argumentatie gehouden, die wellicht eleganter is. Daarbij wordt echter gebruik gemaakt van het feit, dat gN een concave functie is, waardoor het betoog abstract wordt (p.930-934). Uw columnist vindt, dat zijn eigen argumentatie beter appelleert aan intuïtie. (terug)
  28. De maatschappelijke theorie van Binmore, die zal worden uitgelegd in de volgende paragraaf, is gebaseerd op deze constatering. Men vraagt zich af, of Nash zelf zich al bewust was van deze intrigerende interpretatie van zijn axioma's. (terug)
  29. Zie p.87-88 in Playing fair of p.226 en 436 in Just playing. (terug)
  30. Zie p.88 in Playing fair. Op p.253-258 in Just playing worden de voordelen van utilitarisme nog eens beschreven. Echter het utilitarisme loopt vast, omdat de individuen zich niet zullen houden aan zo een maatschappelijk contract. In hun werkelijke positie zullen zij willen heronderhandelen over de αn, die achter de sluier zo billijk leken. Zie de rest van de tekst. (terug)
  31. Zie p.67 in Playing fair, en p.352-354 en 436-437 in Just playing. In de figuur 4b ontstaat na de disproportionele groei een nieuwe status-quo, die duidelijk een andere σ vereist dan die in het contract. De individu 1 (of de groep van individuen 1) heeft zijn situatie intussen sterk verbeterd. Als het beraad achter de sluier opnieuw zou bijeen komen, dan zou het kiezen voor andere een andere moraal-vector α. Contracten kunnen niet centraal worden afgedwongen. Het contract blijft enkel uitvoerbaar, zolang het verenigbaar is met het eigenbelang. Dat garandeert de zelf-verplichting. Een andere opmerking: op p.89 in Playing fair wordt gesuggereerd, dat het proportionele groeipad zelfs (voorlopig) behouden zal blijven, wanneer ten gevolge van de technische vooruitgang de verzameling U expandeert. Maar de expansie verandert natuurlijk de Nash oplossing. En dan zou het groeipad zou niet meer leiden naar de utilitaristische oplossing. De proportionele moraal zou een rem worden op de welvaart. Op p.258 en verder in Just playing worden de nadelen van het utilitarisme uitgelegd. Er zou een filosoof-koning nodig zijn om de utilitaristische moraal af te dwingen bij de burgers (p.156). De filosoof-koning is een ideale waarnemer (representatieve persoon, ideal observer, p.152), die bovendien luistert naar de wil van het volk. Maar in de moderne democratie wordt een dergelijke absolutistische heerser niet meer geaccepteerd. Nu zorgt de proportionele oplossing dat de burgers geen behoefte voelen aan een heronderhandeling. (terug)
  32. Mueller stelt op p.580 in Public choice III, dat het maatschappelijke contract in belangrijke mate berust op een intrapersoonlijke vergelijking. Immers, alle individuen stemmen tijdens het constitutionele beraad in met het contract, en vinden het kennelijk billijk. (terug)
  33. De stelling van Binmore, dat nut interpersoonlijk vergelijkbaar is, wordt nog steeds afgekeurd door vele (traditionele) economen. De boeken van Binmore geven een nauwkeurige uitleg van zijn maatschappelijke model. Helaas heeft hij de gewoonte om regelmatig vooruit of terug te springen in zijn betoog. Ook behandelt hij allerlei kleinere modellen, waarbij niet onmiddellijk de gevolgen voor zijn overkoepelende maatschappij-model duidelijk zijn. Uw columnist kan slechts hopen, dat deze column de essentie goed weergeeft. Vermoedelijk moet het inzicht geleidelijk groeien door het model toe te passen, en te combineren en vergelijken met soortgelijke modellen. Voorts besteedt Binmore in Just playing veel aandacht aan het wiskundige formalisme voor de Nash onderhandeling achter de sluier. In hun positie achter de sluier van onwetendheid moeten de individuen rekening houden met alle mogelijke maatschappelijke posities, die zij wellicht in realiteit zullen innemen. Die wiskundige beschouwingen blijven buiten beeld in de huidige column. (terug)
  34. Zie p.295 in An introduction to behavioral economics (2008, Palgrave MacMillan) van N. Wilkinson. (terug)
  35. Zie p.297 in An introduction to behavioral economics. (terug)
  36. Misschien doet deze opmerking geen recht aan Binmore, die de hele paragraaf 4.7 (p.454-470) in Just playing wijdt aan de betekenis van macht. Dit verdient nog een nadere analyse. Het kan zijn, dat machtige individuen worden gekenmerkt door uitzonderlijke empathische voorkeuren. De individuele empathie blijft wel behouden, ook achter de sluier. (terug)
  37. Zie Excellent onderhandelen (1993, Uitgeverij Contact) van R. Fisher, W. Ury en B. Patton. Al weer 23 jaren terug verslond uw columnist boeken over onderhandelen, daartoe aangespoord door een interne bedrijfsopleiding. Het was en is een fascinerende materie, maar excellent onderhandelen leert men natuurlijk niet uit een boek. Voor zover deze boeken Amerikaans zijn (en dat zijn er veel), zijn zij gekocht bij de American Book Center in Amsterdam. Uw columnist moet toegeven, dat hij enkele van deze onderhandelings-experts niet graag in zijn kennissenkring zou hebben. (terug)
  38. Zie Onderhandelen (1993, Uitgeverij Het Spectrum B.V.) van W.F.G. Mastenbroek. In grote lijnen geeft Mastenbroek vergelijkbare adviezen als Excellent onderhandelen. Maar de nuance is afwijkend. Bijvoorbeeld adviseert Mastenbroek op p.108 om 25% van de voorbereidingstijd te besteden aan het zoeken naar alternatieven (BAZO). (terug)
  39. De meeste handboeken over onderhandelen maken deze opmerking. Zie ook p.23-25 in Effective negotiating (1995, Kogan Page Limited) van C. Robinson, en p.24-26 in Smart negotiating (1993, Simon & Schuster Ltd) van J.C. Freund. Op p.18 in Everything is negotiable (1993, Arrow Books Limited) van G. Kennedy leest men: "Negotiators expect to negotiate. They feel cheated if somebody does not recognize this". Zelfs meent hij (p.116): "Briefly, toughness pays!" H. Cohen stelt in You can negotiate anything (1982, Bantam Books), dat een onderhandeling bestaat uit het gebruik van macht, informatie en tijd, met het doel om een bepaald gedrag af te dwingen. Op p.19 in The art of negotiating (1984, Simon & Schuster Inc.) van G.I. Nierenberg staat: "Negotiation isn't always neat. And it is often not nice". Verderop (p.29): "Think of negotiation as a cooperative enterprise". (terug)
  40. Op p.59 in Effective negotiating leest men: "The key requirement is patience". Op p.45 in Smart negotiating: "Time pressure cuts across all other negotiating considerations". Op p.81 in Don't be a chump! (1995, The Princeton Review Publishing Co., Ltd.) van N.R. Schaffzin: "Pressing the other side by using timing can be tremendously effective". Op p.18 van Never take no for an answer (1995, Kogan Page Limited) van S. Le Poole: "Patience is an absolute requirement for a negotiator". Op p.64 in The negotiating game (1994, HarperCollins Publishers, Inc.) van C.L. Karrass: "Time and patience are power". Op p.98 in You can negotiate anything: "As a general rule, patience pays". (terug)
  41. Op p.48 in Effective negotiating leest men: "Perhaps you have not revealed all or the other team has jumped to an unjustified conclusion of the facts available". Op p.37 in Smart negotiating: "The information we glean in negotiations is often fragmentary and incomplete", en p.60: "Protect sensitive information". Op p.102 in You can negotiate anything: "During the actual negotiating event it is often common strategy for one or both sides to conceal their true interest, needs and priorities". (terug)
  42. Op p.72 in The negotiating game leest men: "It sometimes pays to be unreasonable and irrational in negotiation". Hoofdstuk 3 van The art of negotiating betoogt, dat gedrag vaak rationeel is, indien men maar de achtergronden kent. (terug)
  43. Het win-win concept wordt expliciet aanbevolen in hoofdstuk 4 van Effective negotiating, en in hoofdstuk 9 van You can negotiate anything. (terug)
  44. Op p.58 van Never take no for an answer leest men: "The relative power of the negotiating parties depends on a large extent on how (un)attractive the option of not reaching agreement is to them". (terug)
  45. Het belang van zelf-verplichting leest men in p.79 van Succesvol onderhandelen ("[Na de afsluiting] moet de overeenkomst uitgevoerd worden en er moeten bepalingen gemaakt worden om de naleving te controleren, te rapporteren en te corrigeren"). (terug)
  46. In hoofdstuk 4 van Succesvol onderhandelen wordt de rakettencrisis in 1962 in Cuba bestudeerd. Anderzijds geeft The total negotiator (1994, Avon Books) van S.M. Pollan en M. Levine adviezen on een huis te huren, een verkeersboete te ontlopen, of een familielid te overtuigen. (terug)