De huidige column geeft een gedetailleerde uitleg van het axiomatische model van John Nash voor de analyse van onderhandelingen. Zowel de symmetrische als de algemene variant worden behandeld. Het model van Nash wordt gerelateerd aan het model van Rubinstein voor een onderhandeling met tijdsdruk, aan het utilitarisme, en aan de proportionele methode. Er wordt getoond, hoe Binmore hieruit een model van maatschappelijke moraal afleidt. Tenslotte worden de modellen geconfronteerd met ervaringen uit de practijk.
De economische theorie van de twintigste eeuw analyseerde vooral situaties, waarin de verdeling van de rijkdom is gegeven. In een dergelijke situatie kan het maatschappelijke optimum worden bereikt door een paarsgewijze ruil van goederen tussen individuen, die aanschouwelijk is gemodelleerd met de Edgeworth box. Echter de Gazet heeft vanaf zijn aanvang ook aandacht besteed aan de invloed van groepsmacht op de maatschappelijke verdeling. Trouwens, de macht is zelfs al relevant in de Edgeworth box, omdat zij binnen de kern van mogelijke verdelingen bepaalt welk punt op de contractkromme wordt gekozen. Her en der is in de Gazet verwezen naar het marxisme, dat de verdeling van inkomens verklaart vanuit uit de macht, die voortkomt uit het eigendom van kapitaalgoederen. Een verdeling van inkomen op basis van macht is een onderhandelingsproces.
Natuurlijk moet hier even worden verwezen naar het wetenschappelijke werk van de marxist Sam de Wolff, de naamgever van de Gazet. Met name introduceert hij een ingenieus model van onderhandelen, dat de verdeling van het nationale inkomen wil verklaren. Volgens De Wolff eisen de werkers als beloning een vast minimaal nut1. Tegenwoordig zou men dit minimum het reserveringsnut van de werkers noemen. Vervolgens mag de ondernemer de arbeidstijd bepalen. Hij kiest die zodanig, dat zijn winst maximaal wordt. Het model van de Wolff laat zien, dat het mogelijk is om onderhandelingen over de verdeling wiskundig te modelleren. Hier is de onderhandeling nog eenzijdig, omdat in het marxisme de werkers enkel de eigen reproductie kunnen afdwingen. Na de Tweede Wereldoorlog heeft de wiskundige John Nash een algemener model van onderhandelen afgeleid, en dat is het thema van de huidige column.
Diverse columns hebben het model van Nash toegepast, zonder een uitleg over de theoretische grondslagen. Een jaar terug is de algemene Nash oplossing van een bilaterale onderhandeling beschreven, voor het geval van een netwerk. Eerder al hebben diverse columns het model toegepast op de onderhandeling tussen vakbonden en ondernemers. Recent is een model gepresenteerd, waarin de staat onderhandelt met een ondernemer over subsidie. Nog recenter is de column, waarin de Nash oplossing in verband wordt gebracht met maatschappelijke welvaartsfuncties (SWF). Het is dus inderdaad tijd om de Nash oplossing nader te analyseren. Zij heeft een interpretatie, die afwijkt van de welvaartsfuncties. Namelijk, de SWF beschrijft de voorkeuren van een centraal planorgaan inzake de verdeling. De Nash oplossing geldt voor de situatie, waarin een neutrale scheidsrechter besluit over het verdelingsvraagstuk. Het conceptuele onderscheid is inderdaad marginaal2.
Nash heeft zijn model ontwikkeld voor een bilaterale transactie. Echter het is eenvoudig toe te passen op grotere groepen. Stel dat de bestudeerde groep bestaat uit N individuen. De leden van de groep zijn tezamen betrokken bij een transactie of onderneming, die waarde voortbrengt. Zij xk (k=1, ..., K) de hoeveelheden van baten k dankzij de activiteit. De groep moet overeenstemming bereiken over de verdeling van de baten xk. Baten zijn per definitie nuttig. De voorkeuren van de individu n worden beschreven door de nutsfunctie un(x1(n), ..., xK(n)), waarbij xk(n) de hoeveelheid van k is, die n ontvangt. Elke verdeling leidt tot een nutsvector u = (u1, ..., uN). Het geheel van nutsvectoren u vormt een verzameling U van nutsmogelijkheden. Met andere woorden, het overleg over de onderneming schept de verzameling U. De figuur 1a toont een dergelijke verzameling voor het geval N=2 (in rose)3.
De transactie gaat enkel door, wanneer alle N individuen er mee instemmen. Als geen overeenstemming wordt bereikt, dan blijft de bestaande situatie intact. Dit nutspunt ν wordt de status-quo genoemd. Zie de figuur 1a. Trouwe lezers herkennen een analogie met de Edgeworth box, die een vergelijkbaar startpunt ξ kent, zij het van hoeveelheden van baten xk. Uiteraard heeft de verzameling van nutsmogelijkheden een grens. Immers de hoeveelheden xk zijn eveneens begrensd. Deze grens wordt weergegeven door de nuts-mogelijkheden kromme. Zij is rood weergegeven in de figuur 1a. Nash neemt aan, dat de verzameling van nuts-mogelijkheden convex is4. Vervolgens leidt hij de oplossing σ van het verdelingsprobleem af door vijf eigenschappen te bedenken, die redelijker wijze zouden kunnen gelden voor de gezochte oplossing. Dit wordt een axiomatische aanpak genoemd.
De vijf eigenschappen worden nu stuk voor stuk besproken. De eerste eigenschap is individuele rationaliteit. Dit wil zeggen, dat de individu n geen oplossing zal accepteren, die slechter is dan zijn status quo νn. In de figuur 1a is voor de beide individuen deze eigenschap weergegeven door middel van de stippellijnen. De oplossing mag niet onder of links van de stippellijn liggen. Een individu zou inderdaad dwaas zijn om mee te werken aan een transactie, die hem enkel lasten brengt. Kennelijk is νn de reserveringswaarde van n. Bij een eenmalige transactie is ν het dreigings- of breekpunt. Bij een voortgaande (zich continu herhalende) transactie is ν het punt van de impasse of patstelling (deadlock)5.
De tweede eigenschap is de Pareto efficiëntie. De individu zal enkel oplossingen accepteren, die liggen op de nutsmogelijkheden kromme. Immers, zolang dit niet het geval is, kan hij zijn nut verbeteren, zonder het nut van de andere individuen te schaden. Merk op, dat de Pareto eigenschap vereist, dat alle individuen beschikken over een volledige informatie inzake de transactie. Immers, alleen dan kennen zij hun maximaal haalbare nut. Stel de overeenstemming is een (vectorieel) contract σ. Ter illustratie toont de figuur 1a dit contract σ, liggend op de kromme van nutsmogelijkheden. Merk op, dat de eigenschappen van individuele rationaliteit en Pareto efficiëntie ook relevant zijn voor de Edgeworth box. Zij definiëren er de zogenaamde kern6.
De derde eigenschap is symmetrie, ook wel anonimiteit genoemd. Zij geldt voor symmetrische verzamelingen U, zoals is weergegeven in het rose gebied van de figuur 1b. Een dergelijke verzameling blijft exact gelijk, wanneer zij wordt gespiegeld in de 45o lijn vanuit de oorsprong (gestippeld in de figuur 1b). De spiegeling is feitelijk een permutatie van de individuen 1 en 2. De symmetrie eigenschap stelt nu, dat voor de symmetrische verzameling alle σn gelijk zijn. In twee dimensies ligt σ op de 45o lijn, met σ1=σ2. De interpretatie is, dat gelijke individuen een zelfde nut halen uit de transactie. Niemand wordt gediscrimineerd.
De vierde eigenschap is de onafhankelijkheid van irrelevante alternatieven. Stel dat tijdens het overleg over het contract σ een gebeurtenis optreedt, die irrelevant is voor het contract. De status quo ν wijzigt niet. Wel veroorzaakt de gebeurtenis een uitbreiding van de verzameling U, bijvoorbeeld met de licht-groene delen in de figuur 1b. De eigenschap eist nu, dat een dergelijke irrelevante uitbreiding geen wijziging aanbrengt in het optimale contract σ. De eis lijkt triviaal7. Men kan de eigenschap ook omgekeerd voorstellen. Stel oorspronkelijk geldt de groene kromme van nutsmogelijkheden. Het optimale contract is σ. De mogelijkheden uit het groene gebied zijn irrelevant voor het contract σ. Nu worden die mogelijkheden geschrapt. Dan zal in de nieuwe situatie het contract nog steeds σ zijn.
De vijfde en laatste eigenschap is de onafhankelijkheid van lineaire nuts-transformaties. Een dergelijke transformatie heeft de gedaante u'n = αn×un + βn, waarbij αn en βn constanten zijn. De transformatie varieert dus per individu n. De uitleg wint aan duidelijkheid door de translatie α en de relatieve schaling β afzonderlijk te beschouwen. De figuur 2a toont de translatie. Het hele nutsveld wordt simpelweg verschoven ten opzichte van het assenkruis. De nieuwe status quo wordt μ. Aangezien het nut links van ν1 en beneden ν2 geen betekenis heeft wegens de individuele rationaliteit, is de situatie niet wezenlijk veranderd. De nieuwe Nash oplossing schuift gewoon mee, en is τ. De onafhankelijkheid van translatie is handig, omdat men ν naar de oorsprong kan schuiven. Dat maakt de probleemstelling wat overzichtelijker.
Nash veronderstelde een onafhankelijkheid van de relatieve schaling β, omdat hij interpersoonlijke nutsvergelijkingen wilde vermijden. Immers, het nut un wordt uitgedrukt in de utils (nutseenheden) van n. Wanneer het contract σ zou afhangen van βn, dan zou het nut van de individuen n en m kunnen worden vergeleken via de verhouding βm/βn. Traditioneel zijn economen daarin terughoudend, omdat er dan feitelijk een morele afweging zou worden gemaakt tussen de belangen van de individuen n en m. Concreet betekent de onafhankelijkheid voor relatieve schaling β, dat de schaling het contract σ verandert in τ, met elementen τn = βn×σn. Zie de figuur 2b. Dat wil zeggen, het oude contract schaalt simpelweg mee met het nutsveld. Of meer formeel: zij B de schaling. Dan is het contract voor B(U) met status quo B(ν) gelijk aan B(σ).
Aan de hand van deze vijf eigenschappen kan nu de Nash oplossing voor een onderhandeling worden gedefinieerd. Zij is een recept om de vector σ(U, ν) te berekenen, die de overeenstemming tussen de N groepsleden representeert. Met andere woorden, σ wordt bepaald door de verzameling U van nutsmogelijkheden, de status quo ν, en het recept. Dat recept luidt:
(1) maximaliseer voor de vectoren u in U: Πn=1N (un − νn)
In de formule 1 is Π het wiskundige symbool voor vermenigvuldiging van de N termen. Nash ontdekte, dat deze oplossing voldoet aan de vijf genoemde eigenschappen. Bovendien kan worden bewezen, dat het recept van de formule 1 de enige (unieke) oplossing is8.
De volgende kanttekeningen bij de formule 1 zijn de moeite waard. De vijf eigenschappen passen eigenlijk beter bij een arbitrage (beslechting van een geschil) dan bij een onderhandeling. Dit is al opgemerkt in de inleiding. Er wordt verondersteld, dat de N individuen samenwerken. In het bijzonder wordt genegeerd, dat zij onderling coalities zouden kunnen vormen om voor zichzelf een beter resultaat te realiseren dan de Nash oplossing. Overigens speelde dat bij Nash zelf geen rol, omdat die N=2 beschouwde. Voorts is de Nash oplossing in zoverre niet billijk, dat de status quo ν wordt geaccepteerd als een gegeven. En de status quo kan uiterst onrechtvaardig zijn. Het onrecht in de startpositie treft men ook aan bij het verwante model van de Edgeworth box. In het bijzonder is het model van Nash niet een recept om de maatschappelijke welvaart maximaal te maken9.
De lezer dient zich bewust te zijn, dat de onafhankelijkheid van lineaire nutstransformaties ingrijpende gevolgen heeft. Bijvoorbeeld maakt zij mogelijk, dat de status quo ν onzichtbaar wordt gemaakt door een translatie naar ν'= 0. Inderdaad beschouwt de Nash methode enkel de verschillen un − νn. Bovendien kunnen de maximaal haalbare un voor alle individuen n gelijk worden gemaakt via de relatieve schaling, bijvoorbeeld tot unmax = 1. Het verschil tussen de individuen n wordt dan uitsluitend bepaald door de vorm van de grens van de verzameling U. Intuïtief ligt het voor de hand, dat een (qua nut) rijke individu n met een riante status quo ν in staat zal zijn om voor zichzelf een aanzienlijk deel van de opbrengst van de transactie af te dwingen. Immers nut hangt vaak samen met geld, en geldt vertegenwoordigt macht. De grens van U zal dan in zijn voordeel worden vervormd. Merkwaardiger wijze wordt dit aspect niet besproken in de geraadpleegde bronnen10.
In practische gevallen is het vaak nodig om afstand te doen van de derde eigenschap, de symmetrie of anonimiteit. Er wordt dan een parameter γn≥0 toegevoegd aan het model, waarmee de individu n wordt gekarakteriseerd. Deze modellering wordt een algemene Nash onderhandeling genoemd. Het algemene recept om de Nash oplossing te vinden luidt:11
(2) maximaliseer voor de vectoren u in U: Πn=1N (un − νn)γ(n)
Trouwe lezers zullen een gelijkenis zien tussen de formule 2 en de individuele nutsfunctie in de rationele keuze leer, die de gedaante u = Πm=1M cmγ(m) heeft. In de nutsfunctie drukt γm het gewicht uit, dat de individu toekent aan zijn behoefte om een hoeveelheid cm van het goed m te bezitten. Evenzo drukt γn in de formule 2 het gewicht uit, dat de arbiter of scheidsrechter toekent aan de belangen en behoeften van de individu n, maar nu in vergelijking met de andere individuen j≠n van de groep.
Ter illustratie van de algemene oplossing kan een bijzonder geval worden beschouwd, te weten een transactie met N=2, waarbij de verzameling U van nutsmogelijkheden wordt gegeven door u1 + u2 ≤ π 12. Dat wil zeggen, dankzij de transactie is een hoeveelheid nut π te verdelen. Men kan aantonen, dat in dit geval het meest redelijke contract in de geest van Nash wordt gegeven door13
(3) σn = νn + (π − ν1 − ν2) × γn / (γ1 + γ2)
Hier is n=1 of 2. Aangezien de oplossing onafhankelijk is van translaties, mag men ν=0 nemen. Dan krijgt kennelijk de individu n een fractie γn / (γ1 + γ2) van het beschikbare nut π. Om deze reden wordt γn wel geïnterpreteerd als de onderhandelings-macht van n. Dat zou dan de macht zijn, die de arbiter toekent aan de individu n. Bij een gelijke macht wordt er eerlijk gedeeld: σn=π/N.
Het vermelden waard is het model van Rubinstein, dat de algemene Nash oplossing afleidt op een totaal andere manier14. Dit model behoort tot de speltheorie, en wordt het spel van de afwisselende biedingen genoemd. De transactie betreft een groep van twee deelnemers (N=2), en levert een totaal nut van π op15. De twee individuen doen afwisselend biedingen over de verdeling van π. Merk op, dat zij allebei egoïstisch zijn, en dien ten gevolge niet streven naar een billijke oplossing, zoals de arbiter. Daarom wordt dit een transactie zonder samenwerking genoemd (al moeten de individuen natuurlijk wel tezamen de onderneming voltooien). Telkens nadat een bod is uitgebracht door een individu, trekt de ander zich terug gedurende een periode Δt om het bod te overwegen. De onderhandeling kent een zekere tijdsdruk, omdat de individuen liefst zo snel mogelijk profiteren van hun nut. Daarom wordt het nut afgewaardeerd in de tijd, met een disconto-factor van δn per periode Δt.
Stel dat de individu n aan de beurt is om een bod te doen. Elk verworpen bod reduceert de waarde van de transactie, omdat daarna een tijd Δt zal verstrijken. Daarom wil n (=1 of 2) een bod doen, dat aanneembaar is voor de andere individu m≠n. De individu n rekent uit, dat het voor m optimaal is om aan n een fractie xn van de totale waarde aan te bieden. Dan krijgt m zelf een fractie xm = 1 − xn. Echter aangezien m zijn bod later zal doen, is de waarde van de transactie al weer δm verminderd ten opzichte van het heden. De individu n kan handig gebruik maken van deze ontwaarding. Namelijk, hij biedt aan m een fractie δm×xm aan. Dit aanbod is precies even veel waard als het bod, dat m zelf een periode Δt later zal doen. Dat wil zeggen, m is indifferent ten opzichte van deze twee boden. Daarom zal m akkoord gaan met het huidige bod. En n krijgt een fractie xn = 1 − δm×xm.
Stel dat n door overmoed of laksheid een te laag bod doet. Dan is m aan de beurt om zijn beste bod te doen. De redenatie van zonet is ook toepasbaar voor m. Dat wil zeggen, zijn beste bod is δn×xn. Een rationele n gaat akkoord, zodat m een fractie xm = 1 − δn×xn krijgt. Substitueer deze formule in de zonet gevonden uitdrukking voor xn, dan is het resultaat16
(4) xn = (1 − δm) / (1 − δn×δm)
Hier is natuurlijk δn×δm=δ1×δ2. De formule 4 baseert op de aanname, dat n als eerste een bod mag doen. Dat geeft hem een voordeel. Stel gemakshalve even, dat geldt δ1=δ2=δ. Dan wordt de formule 4 gelijk aan xn = 1/(1+δ). Dien ten gevolge krijgt m een fractie xm = 1 − xn = δ/(1+δ), dus een factor δ minder dan n.
De disconto-factor δn en de disconto-voet dn zijn gerelateerd via δn = 1/(1+ dn). Zij rn de disconto-voet, die de continue ontwaarding aangeeft, te weten de ontwaarding voor extreem kleine tijdsintervallen. Men kan nu bewijzen, dat geldt δn = exp(-rn × Δt) 17. Substitueer deze relatie in de formule 4. Men kan met de aldus gevonden formule aantonen, dat in de limiet Δt→0 geldt xn = rm / (r1 + r2) 18. Hier is natuurlijk n=1 of 2, n≠m, net zoals voorheen. Deze verdeling xn treedt dus op bij biedingen met zeer kleine tussenliggende perioden. Nauwkeuriger gezegd, men kan niet meer waarnemen, welke individu het eerste bod doet. De verdeling is altijd hetzelfde, ongeacht wie begint19. Voor de vergelijking van de oplossing van Rubinstein met de Nash oplossing is de volgende vorm handiger:
(5) xn = (1/rn) / ((1/r1) + (1/r2))
Een vergelijking met de formule 3 toont aan, dat de verdeling xn uit de speltheorie gelijk is aan de oplossing σn van de algemene Nash onderhandeling, onder de voorwaarde dat geldt 1/rn = γn! Naarmate de individu n een kleinere continue disconto-voet rn heeft, wint hij aan macht in de algemene Nash onderhandeling. Hierin zit enige logica, want een individu met een kleine rn is traag in het afwaarderen van de waarde π van de transactie. Een dergelijke individu is geduldig. Kennelijk leidt geduld tot macht20. Merk voorts op, dat een langdurige impasse tot gevolg zou hebben, dat de transactie al haar waarde verliest, wegens de disconto-factoren. De impasse kan hier worden opgevat als de status quo. Het breekpunt bestaat uit de externe alternatieven van de individuen. Die zijn hier irrelevant, omdat het model van Rubinstein een zekere oplossing aanreikt21.
In de paragraaf over de Nash oplossing is de aanpak axiomatisch genoemd. De axioma's leiden tot de Nash functie fN(U, ν) in de formule 1 22. Hoewel de vijf axioma's van Nash redelijk zijn, kan men ook andere axioma's bedenken. Alternatieve axioma's leiden tot een andere functie f(U, ν). Zeker wanneer men fN wil opvatten als de nutsfunctie van de arbiter, ligt het voor de hand om alternatieve functies te zoeken, die tevens maatschappelijke welvaartsfuncties zijn23. Het utilitarisme en het proportionele beginsel leveren bekende welvaartsfuncties, te weten
(6a) fU(U, ν) = Σn=1N αn × (un − νn)
(6b) fP(U, ν) = minimum van αn × (un − νn) voor n=1, ..., N
Gewoonlijk laat men in de formule 6a de term -Σn=1N αn × νn achterwege, omdat zij een constante is. Welvaart is altijd relatief. Maar in het huidige betoog blijkt de schrijfwijze van de formule 6a handig te zijn. Het is in een oogopslag duidelijk, dat de utilitaristische en proportionele aanpak geen van beiden voldoen aan de onafhankelijkheid van lineaire nutstransformaties. Evenmin voldoen ze aan de eigenschap van symmetrie (anonimiteit). In tegendeel, de weegfactoren αn discrimineren tussen individuen, en in de formule 6b discrimineert bovendien νn. Daarom zijn noch fU noch fP redelijke functies om onderhandelingen te modelleren. Des al niettemin zijn zij van belang voor de huidige column, omdat zij een bijzondere relatie hebben met het model van Nash.
Namelijk, gewoonlijk leidt de maximalisatie van fU(U, ν) en fP(U, ν) tot twee verschillende optima op de nutsmogelijkheden kromme van U. Echter, beschouw het bijzondere geval, dat de beide functies hetzelfde optimum σ opleveren voor de welvaart. Stel de waarde van de functie fU(σ, ν) in het punt σ voor door Wσ. Per definitie geldt in het proportionele optimum, dat alle αn × (σn − νn) dezelfde waarde hebben. Aldus vindt men, dat het gedeelde punt σ moet voldoen aan
(7) σn = νn + Wσ / (N × αn)
Ter illustratie toont de figuur 3 het samenvallen van de twee optima voor het geval N=2. Het lijkt sterk op de figuur uit een andere recente column, over de welvaarts-economie. De groene lijn stelt de functie fU voor, en de blauwe lijn toont het verband tussen u1 en u2 volgens fP. De hellingen van de lijnen hebben dezelfde absolute waarde, te weten α1/α2, maar bij fU is zij negatief. Het kruispunt van de twee lijnen is natuurlijk het punt σ, gelegen op de grens van U. Merk op, dat de lijn fU door σ ook het punt u = [ν1, ν2 + Wσ/α2] bevat. In dit punt is dus u2 − ν2 juist twee keer zo groot als σ2 − ν2, dat wil zeggen, u2 − σ2 = σ2 − ν2 24.
Bijzonder aan het geval van een gedeeld welvaarts-optimum σ bij utilitarisme en de proportionele methode is, dat σ tevens de oplossing van de symmetrische Nash onderhandeling is (dus bij γn=1 in de formule 2)! Dit kan als volgt worden aangetoond25. Merk allereerst op, dat de Nash functie fN(U, ν) in de formule 1 kan worden herschreven tot
(8) gN(U, ν) = Σn=1N ln(un − νn)
Immers, gN = ln(fN) is maximaal bij dezelfde u als fN zelf. Merk vervolgens op, dat de formule 7 kan worden herschreven tot αn = (N / Wσ) / (un − νn), berekend in het punt u=σ. Dat wil zeggen, αn = (N / Wσ) × ∂(ln(un − νn))/∂un, in u=σ. Blijkens de formule 8 is dit hetzelfde als αn = (N / Wσ) × ∂gN/∂un, in u=σ. Nu is enerzijds de vector α de normaal op het hypervlak, gedefinieerd door fU=Wσ 26. Anderzijds is de vectoriële gradiënt ∂gN/∂un de normaal op het (N-1)-dimensionale oppervlak (verzameling, zo men wil) gN(u, ν) = V, waarin V een constante is. 27. Dien ten gevolge moet het oppervlak gN(u, ν) = Vσ, dat het punt σ bevat, raken aan het hypervlak fU=Wσ, waarbij σ het enige gedeelde punt is. Maar dan raakt gN(u, ν) = Vσ in σ aan de verzameling U. Kennelijk is σ inderdaad het punt van U, dat gN en fN maximaal maakt. Wegens de formule 1 is σ dan de Nash oplossing van de transactie. De oranje kromme in de figuur 3 toont fN(u, ν) = exp(Vσ) voor N=2.
De koppeling van de Nash oplossing aan de utilitaristische en proportionele oplossingen met gelijke weegfactoren α heeft een merkwaardige consequentie, die niet duidelijk wordt vermeld in de door uw columnist geraadpleegde bronnen. Namelijk, de Nash oplossing gaat uit van de eigenschap van symmetrie (anonimiteit). Echter de utilitaristische en proportionele oplossingen voldoen nadrukkelijk niet aan die eigenschap. Kennelijk verwijdert de restrictie van een proportionele verdeling de interpersoonlijke vergelijking uit de utilitaristische welvaart, en omgekeerd. Des al niettemin laat dit zien, dat men de Nash oplossing wel degelijk kan zien als een resultaat, dat is bereikt via morele afwegingen op basis van interpersoonlijke vergelijkingen28.
Een belangrijke prikkel om het transactie-model van Nash te analyseren is het verwerven van meer inzicht in het maatschappij-model van Ken Binmore, dat geheel is gebaseerd op het Nash-model. Een half jaar terug is in een column uitgelegd, dat Binmore de ontwikkeling van de moraal toeschrijft aan het constitutionele beraad in de zin van de filosoof J. Rawls. Het maatschappelijk contract wordt vastgelegd in een beraad van alle burgers, dat wordt gevoerd achter een sluier van onwetendheid. Binmore stelt, dat de sluier de maatschappelijke positie van elke burger wegfiltert uit diens geheugen. Echter de transparantie van de sluier is voldoende groot om de status quo ν van de maatschappij te ontwaren. Het beraad kan worden gemodelleerd met het model van Nash. De burgers streven hun eigenbelang na, maar zijn daarnaast in staat tot empathie. Zij kunnen zich wederzijds inleven. Dat is essentieel om te kunnen samenleven.
In een column van een maand terug wordt uitgelegd, dat Binmore in zijn maatschappij-model handig gebruik maakt van het samenvallen van de oplossingen van Nash, het utilitarisme, en de proportionele methode (die een variant is van het maximin beginsel). Alledaagse onderhandelingen en het constitutionele beraad verlopen allebei volgens het recept van Nash. Tijdens het beraad is er anonimiteit (symmetrie), waardoor een morele afweging van belangen achterwege dreigt te blijven. Echter dit gebrek wordt verholpen door de Nash-oplossing σ te koppelen aan het utilitarisme en de proportionele methode. Immers de weegfactoren αn zijn een moreel oordeel over de manier, waarop de opbrengsten moeten worden verdeeld over de individuen. Dankzij de empathie en de sluier bereikt het beraad overeenstemming over de optimale waarden van αn. Binmore noemt de αn de empathische voorkeuren met betrekking tot de diverse maatschappelijke posities n.
Aangezien het beraad over het maatschappelijk contract zelden plaats vindt, zijn op de korte termijn de αn-waarden onveranderlijk29. Klaarblijkelijk zijn de waarden van αn dan in evenwicht. Zij worden bijgesteld op de middellange termijn, tijdens de diverse constitutionele beraden. Op die manier kan men rekening houden met de maatschappelijke veranderingen. De interpersoonlijke nutsvergelijking αn/αm met n≠m wordt dan aangepast aan de nieuwe status quo. De diverse nutseenheden (utils) krijgen een andere ruilwaarde. De evenwichtige moraal evolueert dus pad-afhankelijk. Tijdens het beraad wordt de moraal gebaseerd op de utilitaristische welvaartsfunctie (formule 6a)30. Immers, men verlangt naar een hoge en toenemende welvaart. De utilitaristische oplossing is een uiting van de collectieve empathie. Het beraad moet tenslotte leiden tot consensus over een toekomstige maatschappij σ, en een een plan (overeenkomst) om haar te realiseren.
Dat maatschappelijke contract heeft enkel zin, wanneer het groeipad van ν naar σ uitvoerbaar is. De voltooiing van de groei vergt een zekere tijd. Dit is het alledaagse leven op de korte termijn, waarin de individuen zijn gericht op hun eigenbelang. Daarom eisen zij de toepassing van de proportionele oplossing. Maar dan moet de groei naar σ verlopen via de lijn door ν en σ, met in elk punt dezelfde αn × (un − νn) voor alle N. Zie de figuur 4a. Met andere woorden, de economische groei zal per definitie de status quo ν verschuiven. Als die verschuiving niet verloopt over de zonet genoemde lijn, dan zouden de burgers een andere Nash-oplossing σ eisen. Zij zouden willen heronderhandelen over het contract. Zie de figuur 4b31. Daarom is evenredigheid essentieel. Aldus legt de uitvoerbaarheid een restrictie op aan de utilitaristische maximalisatie. Dat garandeert, dat het maatschappelijk contract zelf-afdwingend (verinnerlijkt) wordt (self-enforcing of self-policing).
Aldus lijkt de wetenschappelijke verdienste van Binmore vooral te zijn, dat hij een maatschappelijke betekenis geeft aan bestaande wiskundige modellen. Het ideologische uitgangspunt is de mensbeeld van de empathische egoïst. In de status quo sluiten de individuen tezamen een maatschappelijk contract (constitutie) af, dat een weerslag is van de collectieve moraal. De individuele empathische voorkeuren zijn voldoende gelijk om tot een collectief compromis te komen. Het resultaat is de Nash oplossing, een compromis tussen de welvaart en de billijkheid, hier in de zin van wederkerigheid. Binmore plaatst de interpersoonlijke nutsvergelijking centraal als het fundament voor de subjectieve ethiek32. De proportionele aanpak krijgt dan de betekenis van de individuele zelf-verplichting aan het contract. Op die manier reikt Binmore een interessant abstract denkkader aan. Uw columnist kent echter geen practische toepassingen van het model van Binmore33.
Uiteraard is het belangwekkend om te weten of het model van Nash overeenkomt met de practische ervaringen in de reële wereld. De gedragseconomie heeft onderhandelingen onderzocht in laboratorium studies. Bij zulke experimenten is gebleken, dat de individuen de beschikbare informatie interpreteren op een vooringenomen manier (self-serving bias)34. Dat is natuurlijk niet rationeel. In zulke situaties kan een arbiter correcties aanbrengen op de visie van de betrokkenen. Ook het model van Rubinstein is nagebootst in experimenten. Het blijkt dat bij herhaalde spellen sommige individuen inderdaad leren om de formule 4 toe te passen. Het leerproces kan echter traag verlopen35. Kennelijk is althans in zulke experimenten de aanname van rationeel handelende individuen twijfelachtig.
Het symmetrische model van Nash negeert de invloed van individuele macht. Maar vaak zal macht juist een doorslag gevende factor zijn voor de verdeling. In de rationele keuze leer wordt de macht gelijk gesteld aan de totale waarde van de hulpbronnen, waarover een individu beschikt. In een eerdere column over deze leer is gesteld, dat rijke individuen tijdens een transactie hun positie kunnen versterken door ondersteuning te "kopen". Zij hebben veel te bieden aan de individuen in hun netwerk. Ook buiten de rationele keuze leer geven economische theorieën een prominente plaats aan de macht, zoals de modellen van rente zoeken. De rol van macht in het model van Binmore is lastig te doorzien. Men vraagt zich af, waarom een machtige individu zijn positie zou willen vergeten tijdens het beraad achter de sluier36. Anderzijds zit wellicht de macht indirect verwerkt in het model van Nash, via de vorm van de grens van de verzameling U.
Voorts is er een enorme hoeveelheid handleidingen, die adviezen geven over de strategie van onderhandelen. Een speciale vermelding verdient het boek Excellent onderhandelen (afgekort EO), dat voortkomt uit het Harvard Negotiation Project, en dus een wetenschappelijke achtergrond heeft37. De auteurs benadrukken het belang van het beste alternatief zonder overeenkomst (afgekort BAZO, in het Engels BATNA of best alternative to a negotiated agreement). Aangezien het BAZO simpelweg de status quo νn is, wordt aldus het model van Nash bevestigd. Bijvoorbeeld kan νn de nutswaarde zijn, die de individu n in handen zou krijgen, wanneer een externe arbiter of rechtbank zou beslissen over de verdeling van de opbrengst. In EO wordt benadrukt, dat de deelnemers van het overleg over de transactie moeten proberen om hun status quo (breekpunt, zekerheidsniveau, reserveringsnut) te verbeteren, zodat νn feitelijk dynamisch is.
Een ander advies van EO is het onderzoeken van de wederzijdse belangen, omdat daardoor waarschijnlijk de te verdelen opbrengst van de transactie kan worden vergroot. Dan expandeert de verzameling U. Men noemt dit ook wel de win-win strategie. Het tonen van empathie is een wenselijke eigenschap. In dit opzicht sluit EO zich aan bij de visie van Binmore. Ook wordt aangeraden om het overleg te baseren op objectieve criteria (kosten, normen, conventies, wetenschappelijke opvattingen, en dergelijke). Dat vergroot de kans op een rationeel resultaat. En de gekozen oplossing moet niet worden beïnvloed door irrelevante bijkomstigheden. In het bijzonder wijst EO er op, dat de goede verstandhouding tussen de individuen moet worden gescheiden van de overeenkomst. Aldus worden een aantal eigenschappen van de Nash oplossing aangeprezen in EO.
Maar er zijn ook verschillen tussen EO en het model van Nash. Met name veronderstelt EO absoluut geen symmetrie of anonimiteit bij de diverse participanten aan het overleg over de transactie. Een vaardige onderhandelaar behaalt betere resultaten dan emotionele of starre individuen. De individuele macht, zoals het beschikken over een aantrekkelijk BAZO, bepaalt mede de verdeling van de opbrengsten. Deze kritiek op het model van Nash geldt natuurlijk evenzeer voor het model van Rubinstein. Anderzijds moet worden erkend, dat een asymmetrische situatie vermoedelijk weinig zal voorkomen bij de institutionele onderhandelingen, zoals die tussen belangenorganisaties.
In de Nederlands-talige publicaties heeft het boek Onderhandelen (afgekort OH) enig aanzien verworven38. Er wordt betoogd, dat onderhandelen vraagt om een gedrag, dat ligt tussen samenwerken en vechten39. De arbiter in het model van Nash, die alle belangen zorgvuldig afweegt, suggereert juist, dat samenwerking wenselijk is. In OH wordt de onderhandeling voorgesteld als een bij uitstek dynamisch proces, waarin elke individu invloed uitoefent op de machtsbalans, de procedures, de sfeer en de eigen achterban. Er is duidelijk geen sprake van individuele anonimiteit. Volgens OH moet de onderhandelaar weliswaar bereid zijn tot compromissen, maar toch de eigen belangen (un) verdedigen. Dat vereist een gedrag, liggend tussen exploreren en star blijven. De uitwisseling van informatie is zelden volledig, omdat zij tactisch wordt ingezet. Daarom is de verzameling U van alternatieven nooit volkomen bekend.
De conclusie van het model van Rubinstein wordt algemeen onderschreven door de deskundigen. Immers, het belang van geduld wordt vermeld in alle handleidingen over onderhandelen40. Deze literatuur bevestigt, dat de beschikbare informatie nooit compleet is41. Het gedrag tijdens de onderhandeling kan irrationeel zijn42. Soms wordt de win-win strategie aanbevolen43. Hoewel het belang van de BAZO (ν) wordt erkend, is toch de algemene opvatting, dat men steeds moet proberen om impasses te doorbreken44. Impasses zijn simpelweg een natuurlijk onderdeel van de onderhandeling.
Merkwaardiger wijze is er weinig aandacht voor de daadwerkelijke uitvoering van de overeenkomst45. Immers, Binmore wijst er terecht op, dat een contract fragiel is, wanneer het onvoldoende tegemoet komt aan de belangen van de betrokken individuen. Een goede overeenkomst moet aanzetten tot zelf-verplichting. De betrokken groep als geheel moet zich inzetten voor de naleving. En tenslotte maakt vooral de populaire literatuur weinig onderscheid tussen politiek-institutionele en alledaagse onderhandelingen46. Dus het is logisch dat zij enigszins verschilt van de modellen in deze column, die vermoedelijk vooral zijn bedoeld voor institutionele processen.