De gedragseconomie

Plaatsing in Heterodoxe Gazet Sam de Wolff: 26 januari 2015

E.A. Bakkum is eindredacteur van de periodiek Sociaal Vooruit, en een betrokken PvdA lid. Hij is beroepsmatig werkzaam bij het Socialistisch Centrum, waar hij de functie van zaakwaarnemer vervult.

De gedragseconomie biedt een nuttige aanvulling op de gelukseconomie, die op deze portaal een prominente plaats heeft gekregen. Deze column behandelt de gedragseconomie aan de hand van het boek An introduction to behavioral economics van N. Wilkinson. Allereerst wordt het verschijnsel van de begrensde rationaliteit uitgelegd. Vervolgens worden een aantal speciale thema's nader beschouwd, te weten het portfolio beheer, irrationele voorkeursfuncties, altruïsme en wrok, en de verdiscontering van tijdsvoorkeuren. De conclusie is dat de homo economicus uit de gangbare economische theorie onverenigbaar is met de psychologische inzichten.

Op deze portaal is vele malen uitgewijd over de gelukseconomie, het meest recent nog in de column over de empirische resultaten, die deze discipline heeft opgeleverd. De gelukseconomie maakt gebruik van tevredenheidsmetingen ten einde het welzijn van individuen te bepalen. Dit type onderzoek heeft laten zien, dat maatschappelijke factoren wezenlijk zijn voor het individuele welzijn. Mensen hechten aan hun gezin, aan hun kennissen, en aan zingeving. Uiteraard hebben deze bevindingen een practische waarde, maar ze hebben ook theoretische gevolgen. Met name ondermijnen zij de gangbare neoklassieke theorie, die de mens voorstelt als een homo economicus. De homo economicus is een rationeel denkende individu, die volledig is geïnformeerd, en steeds egoïstisch uit is op het maximaliseren van zijn eigen nut (eigenbelang).

Net zoals de gelukseconomie stelt ook de gedragseconomie zich ten doel om het gangbare beeld van de homo economicus te nuanceren en corrigeren. Echter de methoden van deze twee disciplines zijn verschillend. De gelukseconomie maakt bij haar studies gebruik van vraaggesprekken met een grote groep mensen. Zij stelt zich ten doel om het gemiddelde nut te meten, dat de diverse groepen ervaren in allerlei domeinen van het leven. Aldus worden de menselijke voorkeuren statistisch vastgesteld. Anderzijds voert de gedragseconomie experimenten uit met proefpersonen onder laboratorium-omstandigheden. In die experimenten wordt gekeken hoe de personen reageren in een bepaalde situatie. Enkel het gedrag is zichtbaar, en de mening van de personen blijft dus onbekend. De gedragseconomie probeert nu om uit het waargenomen gedrag alsnog de meningen, houdingen en gevoelens van de proefpersonen af te leiden.

Het moge duidelijk zijn, dat de gedragseconomie zich hier een gigantische taak stelt. Immers de motieven achter een bepaald soort gedrag kunnen van allerlei aard zijn. Des ondanks slaagt de gedragseconomie er in om overtuigende theorieën te ontwikkelen. Het blijkt dat de mens een uitermate complex wezen is, dat mechanisch reageert op de gebeurtenissen, die hij ervaart. Kennelijk is de homo economicus een abstractie, die per saldo weinig realiteitsgehalte bevat. Hieraan moet direct worden toegevoegd, dat ook diens altruïstische tegenhanger de homo politicus weinig meer is dan een fictie. Zowel de neoklassieke leer als de Leninistische leer hanteren een onbruikbaar mensbeeld. Inderdaad stelt de gedragseconomie zich ten doel om modellen te ontwerpen, die psychologisch aannemelijk zijn. Daarom is zij multidisciplinair, met inbreng uit de economie, psychologie en neurobiologie.

Uiteraard is het niet zo, dat de theorieën van de gedragseconomie in staat zijn om de keuzen van de individu perfect te voorspellen. Elk mens is uniek, en reageert op een eigen wijze in de situaties, die zich voordoen. Er is een enorme spreiding in gedragspatronen. Maar net zoals de gelukseconomie slaagt de gedragseconomie er in om statistische gemiddelden van de menselijke houding te meten, waarin de voorkeuren van de menselijke natuur tot uiting komen. Vaak zijn die voorkeuren slechts zwak aanwezig, bijvoorbeeld wanneer een zeker gedragspatroon wordt gekozen door 60% van de proefpersonen, terwijl dan kennelijk 40% opteert voor één of meer alternatieven. Nochtans, zolang het gemeten gemiddelde statistisch significant is, heeft men toch iets wezenlijks in de menselijke natuur blootgelegd.

De toegenomen populariteit van de gedragseconomie is vooral te danken aan de inspanningen van de Nobelprijs winnaar Daniel Kahneman. De huidige column presenteert een aantal saillante resultaten van de gedragseconomie, die worden beschreven in het boek An introduction to behavioral economics van de Engelse econoom Nick Wilkinson1.


Wilkinson over de gelukseconomie

Het voorgaande maakt duidelijk, dat de gelukseconomie en de gedragseconomie elkaar aanvullen. De eerstgenoemde meet de menselijke behoeften, en de tweede registreert de menselijke gedragingen. Geheel in de traditie van de Nederlandse econoom en marxist Sam de Wolff onderzoeken allebei de disciplines de gevoelens van lust en onlust. Toch zet Wilkinson enkele kanttekeningen bij de gelukseconomie, die de moeite waard zijn om hier te noemen. Allereerst is hij van mening, dat onlust niet simpelweg een negatieve lust is. Met andere woorden, hij beweert (in tegenstelling met De Wolff) dat zij niet zomaar kunnen worden gesommeerd. Lust en onlust (ook wel: plezier en pijn, of: nut en onnut, of: geluk en onvrede) verschillen, omdat zij worden geregistreerd in afzonderlijke delen van het brein. Wel erkent Wilkinson, dat de meest intense van de beide gevoelens zijn tegenhanger kan verzwakken. Zij werken in op elkaar2.

Als een individu lust en onlust vergelijkt, dan zou men kunnen spreken van een intrapersoonlijke vergelijking. Volgens Wilkinson is niet zeker of zo een vergelijking kwantitatief kan zijn (cardinaliteit). Des al niettemin accepteert hij de cardinale methode, aangezien in het politieke beleid zulke afwegingen onmisbaar zijn, en zij daadwerkelijk worden gemaakt. Bovendien constateert hij op p.66, dat blijkens studies ook de interpersoonlijke vergelijking mogelijk is, van de intensiteit van (on)lust bij verschillende individuen. Daarom verwerpt hij het standpunt van de gangbare economie, die zowel de intrapersoonlijke als de interpersoonlijke vergelijking van (on)lust afwijst.

Wilkinson waarschuwt, dat de gelukseconomen bij hun vraaggesprekken het zogenaamde ankereffect moeten vermijden. Op p.53 (en nogmaals op p.426) geeft hij hiervan een aardige illustratie: stel eerst wordt gevraagd of iemand een vriend(in) heeft. Vervolgens wordt gevraagd of iemand gelukkig is. De ondervraagde zal dan zijn geluksinschatting laten afhangen van het al of niet hebben van een vriend(in). De eerste vraag verankert de tweede. Daarom moet idealiter de volgorde van deze twee vragen worden omgewisseld. Hopelijk begrijpt de lezer nu beter wat er zonet is bedoeld met de mechanische aard van menselijke gedragingen3.

Ook de inkadering van de vraag beïnvloedt de antwoorden. Dit verschijnsel is tegenwoordig algemeen bekend onder de Engelse aanduiding framing effect. Een positieve vraagstelling verleidt mensen tot een positief antwoord. Op p.74 noemt Wilkinson de twee vragen "Moet aan ouders worden verboden om hun kinderen te slaan?" en "Moeten kinderen net zoals volwassenen worden beschermd tegen geweld?" De meerderheid beantwoordt de eerste vraag ontkennend, en de tweede bevestigend4. De anker- en inkaderings-effecten tonen aan, dat het formuleren van vragenlijsten moet gebeuren met de grootst mogelijke zorg en precisie. De meet-indicatoren moeten objectief en betrouwbaar zijn.

Tenslotte vraagt Wilkinson zich op p.425 en verder af of het eigenlijk wel zinvol is om het individuele en maatschappelijke welzijn te berekenen met behulp van nut. Immers wie echt bewust gaat nadenken over zijn geluk, loopt al snel het gevaar om allerlei kleine gebreken te ontdekken. Wilkinson noemt als voorbeeld de ogenschijnlijk uiterst komische grap, die bij nader inzien tamelijk flauw blijkt te zijn. Het is jammer, dat Wilkinson dit argument niet verder uitwerkt, want het verdient aandacht. Inderdaad zien mensen nogal eens gemak aan voor geluk. Er is veel voor te zeggen, dat een werkelijk en duurzaam geluk enkel kan bestaan bij een zekere uitdaging en onvrede. Aldus vindt de Leninistische socioloog Stollberg de actieve verhouding tot de arbeid een nuttigere index voor het werkgeluk dan de passieve arbeidsvreugde5.

Evenzo geeft de Nederlandse econoom Graafland het voorbeeld van de leerplichtwet, die jongeren dwingt om zich te scholen, en zo hun latere geluk te vergroten. Hij noemt dit het regel-utilitarisme. Hedonisme mag niet ontaarden in grenzeloos genieten. Het toekomstige geluk moet worden meegewogen. Overigens erkent ook Wilkinson dit als een feit, en hij besteedt zelfs een groot deel van zijn boek aan de intertemporele keuzen. Daarom is het vreemd, dat hij tevens veronderstelt, dat het hedonistisch najagen van het maximale welzijn een zelfdestructief streven zou zijn. Overigens is hij onzeker over de causaliteit: wellicht jagen juist ongelukkige mensen naar meer geluk. Dat laatste lijkt uw columnist plausibel en verstandig. Al deze controverses illustreren hoe complex en veelzijdig de gedragseconomie is. Alles overziend lijkt Wilkinson toch wel waardering te kunnen opbrengen voor de gelukseconomie.


De begrensde rationaliteit

Het begrijp rationaliteit is al vele malen behandeld op deze portaal, omdat zij als een belangrijke aanname ten grondslag ligt aan de gangbare neoklassieke economie. Zo verwijst een column naar de opvattingen van de Nederlandse econoom P. Hennipman in zijn hoofdwerk Economisch motief en economisch principe6. Hennipman houdt vast aan de neoklassieke leer, maar stelt dat de individu zelf (subjectief) kiest wat hem of haar bevredigt. Subjectieve behoeften hebben niet persé een ratio of redelijkheid. In een andere column wordt een dergelijk gedrag begrensd rationeel genoemd, of ook irrationeel rationeel. Natuurlijk heeft een dergelijke benadering enkel een practische betekenis, indien men toch enige regelmaat weet te ontwaren in dat irrationele menselijke gedrag. Dit is precies de opgave, die de gedragseconomie (en Wilkinson) zichzelf oplegt.

Wilkinson gaat uitgebreid in op de irrationaliteit, en besteedt er zelfs het afzonderlijke hoofdstuk 9 aan. Hij identificeert maar liefst zeven oorzaken van irrationeel gedrag. Uw columnist beschouwt alleen de meest tot de verbeelding sprekende oorzaken uit deze lijst. Een belangrijke factor is impulsiviteit, dat wil zeggen het gebrek aan zelfbeheersing. Mensen geven zich over aan korte-termijn genoegens, en moeten daardoor afstand doen van lange-termijn geluk. In de visie van Hennipman is dit een respectabele keuze. Echter Wilkinson vindt het (terecht) onwenselijk, wanneer iemand door "bijziend" gedrag het totale gedurende een leven haalbare geluk aantast. Een andere oorzaak is dat mensen het aantal besluiten willen beperken, en daarom "gewoontedieren" zijn. De transactiekosten van een besluit lijken te hoog. Denk aan het jaarlijks wisselen van energiebedrijf of van zorgverzekeraar (deze voorbeelden komen van uw columnist). Echter gewoontes kunnen al snel irrationeel worden.

Verwant aan deze luiheid is de onwil van mensen om hun normen en waarden in overeenstemming te brengen met hun practische ervaringen. Liever houdt men vast aan de achterhaalde norm, ook al leidt dat tot het opgeven van geluk. Wilkinson duidt dit aan als cognitieve dissonantie. Iets soortgelijks gebeurt, wanneer mensen zich bij het maken van hun keuzen laten leiden door simpele vuistregels (met een moeilijk woord heuristiek)7. Een vierde oorzaak van irrationaliteit zijn de emoties, zoals woede. Overigens is de invloed van woede tweesnijdend (zie p.410), want weliswaar benadeelt men zichzelf, maar men straft tevens de boosdoener af. Emotionele mensen krijgen de reputatie, dat zij niet laten sollen met zich. De lezer zij eraan herinnerd, dat de neoklassieke homo economicus geen emoties kent.

Wilkinson vindt ook het falende geheugen een aparte oorzaak. In feite betreft dit het verschijnsel van de wegdrijvende preferentie, die reeds ter sprake kwam in een eerdere column. Dit wil zeggen dat mensen een te hoog geluk of nut verwachten van het eigendom van een bepaald goed. Zodra men het begeerde goed heeft ontvangen, gaat men het eigendom ervan normaal vinden. Wilkinson duidt deze kleinering aan als de ordinisatie. Mensen kunnen niet langdurig euforisch zijn. Dit verschijnsel treedt ook op bij onlust, zoals bij het ontslag of het verlies van een partner. In feite ontstaat irrationaliteit hier uit bijziendheid, net zoals bij impulsiviteit. Bijvoorbeeld koopt men een televisie, die bij nader inzien teleurstelt. Of omgekeerd, men denkt te kunnen genieten van een overdadige alcoholconsumptie, omdat men de ellende van de voorgaande kater even is vergeten.

Al deze oorzaken laten zien, dat de mens niet een rationeel wezen is, dat er voortdurend naar streeft om zijn geluk maximaal te maken. Wilkinson constateert op p.387, dat in feite mensen zich vooral inspannen om een voldoende niveau van geluk in stand te houden. Men wil niet zakken beneden een bepaalde minimale grens. Het gebruik van simpele vuistregels en van vaste normen en waarden is in het algemeen goed geschikt om zo een voldoende niveau van geluk te garanderen. Deze zijn gebaseerd op ervaringen uit het verleden. Uiteraard dwingt dit mensen wèl om steeds de actuele situatie te vergelijken met eerdere situaties. Aangezien twee situaties zelden gelijk zijn, is deze strategie enigszins riskant8.


Irrationaliteit in het portfolio beheer

Wilkinson beschrijft in zijn boek een enorme hoeveelheid modellen en theorieën. De gedragseconomie kent in dit opzicht daadwerkelijk een wildgroei, die nog wordt verergerd, doordat de modellen ad hoc zijn en dus slechts beperkt toepasbaar. Wilkinson erkent dat op p.442, maar hij wijdt dat aan de aanloopfase. Hij verwacht dat de ondeugdelijke modellen zullen worden uitgewied, naarmate de gedragseconomie volwassen wordt. Uiteraard is dat allerminst zeker, zodat Wilkinson hier verdwaalt in wensdenken. Des al niettemin heeft de gedragseconomie onmiskenbaar baanbrekende ontdekkingen gedaan. Uw columnist heeft enkele van de ontdekkingen geselecteerd, die hem het meest hebben beïndrukt. Zij zullen worden beschreven in de navolgende paragrafen.

Foto van Concordia kwartetkaart
Figuur 1: Concordia kwartet

De eerste ontdekking betreft het beheer van een portfolio van geldbeleggingen. Dit thema is beschreven in een voorgaande column op basis van de gangbare economische theorie. Mensen kunnen hun kapitaal bewaren in allerlei vormen: geld, spaarrekeningen, obligaties, aandelen, onroerend goed, edelmetalen, waardevolle voorwerpen enzovoort. Voor een homo economicus zijn al die beleggingen perfect uitwisselbaar, zodat de portfolio beheerder simpelweg het rendement zal maximaliseren. Echter Wilkinson toont op p.161 en verder aan, dat de realiteit anders is. Bijvoorbeeld ervaren mensen een geldschenking meer als een welvaartstoename dan een even grote waardestijging van hun aandelenpakket (papieren winst, zie p.162). En mensen worden kooplustiger, wanneer zij betalen met een creditcard in plaats van met contant geld.

De creditcard is een verleidelijk betaalmiddel. Mensen lenen met behulp van hun creditcard, ook indien zij beschikken over spaartegoeden elders (p.162). Soms is de reden, dat de spaartegoeden een vaste bestemming hebben, zoals een toekomstig studiegeld voor de kinderen. Overigens vervallen ook professionele investeerders in irrationaliteit. Het blijkt dat zij gewoonlijk de onderdelen van hun portfolio (obligaties, aandelen enzovoort) beheren als afzonderlijke portefeuilles, waartussen geen uitwisseling mogelijk is. Dit wordt wellicht veroorzaakt door het verschillende risico-karakter van de diverse onderdelen. Des ondanks neigen de beheerders er instinctief naar om hun portfoilio divers te maken (p.177). Voorts blijken beleggers onwillig om verliezen op hun waardepapieren te incasseren. Liever wachten zij in de hoop op een toekomstige koersstijging (p.168). Ook ondernemingen zijn onwillig om hun verliezen toe te geven, en proberen ze heimelijk door te schuiven naar de toekomst.

Men vindt zulk gedrag in allerlei omstandigheden. Bijvoorbeeld ruilen mensen graag hun gebruikte wagen in, wanneer zij een nieuwe kopen (p.170). En iemand die zijn theaterkaart verliest, zal onwillig zijn om een nieuwe te kopen. Omgekeerd wordt de winst uit speculaties vaak gebruikt voor nieuwe speculaties (p.172). In het algemeen zijn beleggers enigszins "bijziend" in hun afkeer van verliezen (p.174). Met andere woorden, zij hebben moeite om vast te houden aan waardepapieren, die op de lange termijn hoog renderen, maar op de korte termijn hevig in waarde schommelen. Dit is deels toe te schrijven aan de omstandigheid, dat de beheerders jaarlijks moeten rapporteren aan hun geldschieters. Interessant is hier nog, dat mensen en groepen geneigd zijn om hun eigen kwaliteiten te overschatten (zelf-dienstige vooringenomenheid, zie p.400). Dit verklaart het graaigedrag van portfoliobeheerders.


Irrationele voorkeursfuncties

In feite lijkt de speculatie veel op een loterij, want de opbrengst is onzeker. Elk onderdeel van de portfolio heeft een vooraf onbekende opbrengst. Aldus wordt het verwachte nut (ook wel de voorkeursfunctie genoemd) van het onderdeel beschreven door de formule

(1)     W(p, x) = Σj=1N pj × u(xi)

Grafiek van Markowitz nutsfunctie
Figuur 2: Markowitz nutsfunctie

De formule 1 beschrijft een loterij met N mogelijke uitkomsten. De mogelijkheid j (j=1, ..., N) heeft een kans pj om op te treden, en leidt dan tot een uitkomst xj. Het nut van de uitkomst xj bedraagt u(xj). Gemaks halve kunnen pj en xj worden voorgesteld door vectoren p en x, ieder met N componenten. Merk op, dat de loterij al is behandeld in een eerdere column. Men zou denken, dat dankzij de formule 1 mensen makkelijk kunnen uitrekenen wat de meest gunstige loterij is. Wilkinson toont aan, dat dat in de practijk blijkt tegen te vallen9.

Uiteraard wil men graag de gedaante van de nutsfunctie u(xj) kennen. In de zonet genoemde column wordt verondersteld, dat mensen een risico-mijdend (risico-foob) gedrag vertonen. De bijbehorende nutsfunctie is concaaf. Sommige experimenten wekken echter de indruk, dat deze voorstelling te simpel is. Aldus heeft H. Markowitz de nutsfunctie geconstrueerd, die is weergegeven in de figuur 2 (zie p.109-110). Merk op, dat de Markowitz nutsfunctie negatieve waarden van xi toelaat, dat wil zeggen het verlies als mogelijke uitkomst. Men ziet dat nu de nutsfunctie convex is voor kleine positieve en negatieve waarden van xj. De lezer zij nogmaals herinnerd aan de zonet genoemde column, waar de Nederlandse econoom Bernard van Praag een zelfde nutsfunctie hanteert als Markowitz (zonder het verlies-deel).

De nutsfunctie van Markowitz vindt enige bevestiging in de resultaten van experimenten. De convexiteit bij kleine positieve waarden impliceert een risicozoekend gedrag, dat men inderdaad aantreft in de menselijke neiging om "een gokje te wagen". De convexiteit bij kleine verliezen impliceert, dat mensen in zo een geval veel onlust voelen. Zij reageren hier risico-mijdend, zoals blijkt uit het afsluiten van verzekeringen. Echter als de verliezen zeer groot worden, dan krijgt de nutsfunctie een concaaf verloop. Dit betekent dat in geval van een groot verlies mensen enigzins afstompen. Dan wordt een verdere toename van het verlies gelaten en apathisch geïncasseerd. Hier worden de mensen weer risico-zoekend. Men wil alles riskeren om het verlies te verminderen.

Grafiek van weegfunctie
Figuur 3: Weegfunctie

Echter met de Markowitz nutsfunctie alleen kan men de verwachte opbrengst van een loterij nog niet beschrijven. Dit geldt met name wanneer de kansen pj niet precies bekend zijn. Namelijk, het blijkt dat mensen systematische fouten maken bij het inschatten van de kansen pj. Met andere woorden, mensen geven een eigen weegfactor mee aan de geschatte kans pj, en veranderen hem daardoor in π(pj) (zie p.95). Bijvoorbeeld onderschatten mensen de kans om te overlijden aan een veel voorkomende doodsoorzaak (hartfalen, kanker) en ze overschatten de kans op een onwaarschijnlijk ongeluk, zoals een neerstortend vliegtuig. Dit betekent dat het besluitgewicht π(pj) de gedaante aanneemt, die is weergegeven in de figuur 3. Diverse modellen komen tot deze conclusie, zoals de rang-afhankelijke verwachte nutstheorie (p.96 en verder) en de vooruitzicht (prospect) theorie van Kahneman en Tversky (p.115 en verder).

De combinatie van de Markowitz nutsfunctie en de weegfactoren leiden tot een geavanceerd model van menselijke voorkeuren. Immers het model onderscheidt nu enerzijds de risicomijding en het risicozoeken, en anderzijds de mogelijkheden met een kleine waarschijnlijkheid en met een hoge waarschijnlijkheid. Bovendien blijkt dit model een redelijke beschrijving te geven van de experimenten, in ieder geval beter dan de gangbare theorie van het verwachte nut (zie weer de eerder genoemde column). Op p.123 en verder laat Wilkinson zien, hoe Tversky en Kahneman een experimenteel bewijs leveren voor hun weegfunctie π(p). Aardig is dat men de menselijke hang naar "het wagen van een gokje" nu ook kan verklaren uit de weegfunctie. Immers mensen hebben de neiging om de kleine kans in het gokspel systematisch te overschatten.

Voorts noemt Wilkinson ter onderbouwing van het model het gegeven, dat staatsloterijen juist in grote landen populair zijn. Hij schrijft dat toe aan het grote prijzengeld. Uiteraard is in een groot land tevens de individuele kans om de hoofdprijs te winnen kleiner, maar de mensen overzien dat gegeven. En bij de paardenraces wordt buitensporig veel gewed op outsiders, die weinig kans hebben om te winnen. Dit effect wordt nog versterkt door de voorkeur voor risicozoeken bij kleine geldsommen. Al met al is dit geavanceerde model één van de aardigste vondsten van de gedragseconomie.


Altruïsme en wrok

In een eerdere column is betoogd, dat mensen hechten aan maatschappelijke fenomenen, zoals samenwerking en rechtvaardigheid. Wilkinson draagt daarvoor op p.327 en verder talloze voorbeelden aan. Uw columnist zal ze hier niet herhalen, omdat dan de omvang van deze column buiten alle proporties zou raken. Het is goed om in herinnering te roepen dat de homo economicus, die figureert in de gangbare economische theorie, verstoken is van zulke gevoelens van altruïsme en wrok. Daardoor kan de gangbare theorie veel menselijk gedrag niet verklaren, en is zij strijdig met de psychologische wetenschap.

Op p.333 geeft Wilkinson een interessant voorbeeld van wrok, dat voorkomt in de zogenaamde ultimatum onderhandelings spellen. In dit spel met twee spelers A en B mag de speler A een bepaald geldbedrag G onderling verdelen. Echter als de speler B het aanbod van A weigert, dan krijgen A en B allebei niks. Uiteraard zal de homo economicus elk bod aannemen, omdat hij daarmee rijker wordt. In de practijk blijkt echter de helft van de B-spelers een bod van 0.2×G te weigeren, omdat zij dit onrechtvaardig vinden. Hun weigering functioneert hier als een afstraffing van het hebzuchtige gedrag van de A-spelers. Overigens voorvoelen de meeste A-spelers dit onheil, en doet tussen de 60% en 80% van hen een aanbieding aan B van 0.4×G of zelfs 0.5×G. De bereidheid tot samenwerking neemt toe, indien de twee spelers elkaar persoonlijk kennen (zie p.341 en verder). Ook groeit de bereidheid tot samenwerking, indien het spel vaker wordt gespeeld. Er is dan ruimte voor een leerproces.

In de gedragseconomie zijn diverse modellen ontwikkeld om altruïsme en wrok te kunnen beschrijven. Zij zijn gegrondvest hetzij op de aanname dat mensen een afkeer hebben van ongelijkheid, hetzij op de aanname dat mensen een gedrag van wederkerigheid ontwikkelen (zie p.354 en verder). Hoewel al deze modellen de moeite van het bestuderen waard zijn, zal uw columnist zich hier beperken tot het wederkerigheidsmodel van Rabin (zie p.359 en verder)10. Dit model analyseert de maatschappelijke voorkeur van een individu A, wanneer die een transactie aangaat met een individu B. De persoon A zal een gedragslijn (strategie) SA volgen, en hij verwacht van de persoon B een strategie SB. Aldus verwacht A dat de transactie een opbrengst XA(SA, SB) zal opleveren. Echter het verwachte nut UA is niet simpelweg gelijk aan XA, omdat de transactie zelf een immateriële lust of onlust kan veroorzaken.

Foto van Nivon bordje
Figuur 4: Nivon bordje

Omgekeerd zal de persoon B aan de transactie een opbrengst XB(SA, SB) overhouden, zo verwacht de persoon A. Stel dat de altruïsmefunctie van A wordt gegeven door f(SA, SB) = f(XB). Deze functie f heeft een hogere waarde, naarmate XB groter is. Immers dan gedraagt A zich altruïstischer. Echter de individu A moet zich ook afvragen welke strategie S'A de individu B zal verwachten van A. Als B verwacht dat persoon A een altruïistische strategie gaat hanteren, dan zal B waarschijnlijk wederkerig reageren. Met andere woorden, de opbrengst XA hangt af van S'A, en uiteraard van SB. Aldus wordt de door A verwachte altruïsmefunctie van B gegeven door g(SB, S'A) = g(XA). De functie g heeft een hogere waarden, naarmate XA groter is. Dan gedraagt B zich altruïstischer. Als de functies f en/of g een negatieve waarde hebben, dan voorziet de persoon A dat hij en/of B egoïstisch zullen handelen.

Op basis van deze redenatie komt Rabin tot de volgende nutsfunctie voor de maatschappelijke voorkeuren van A:

(2)     U(SA, SB, S'A) = XA(SA, SB) + α × g(SB, S'A) × (1 + f(SA, SB))

In de formule 2 is α een parameter, die de sterkte van de maatschappelijke voorkeur uitdrukt. Als α=0, dan beschikt A niet over voorkeuren. Uiteraard voelt A zich gelukkiger, naarmate g groter is en dus A meer altruïsme verwacht van B. Dat gevoel wordt nog versterkt, wanneer A zich eveneens altruïstisch heeft gedragen (wederkerigheid). Wellicht zal A tot de conclusie komen, dat B zich egoïstisch gaat gedragen. Dan is g negatief. In dat geval kan A zijn nut vergroten door eveneens zelf egoïstisch te handelen, en daarmee f negatief te maken. Ook dat is wederkerigheid11.


De verdiscontering van tijdsvoorkeuren

Vooral in het begin van deze column is vaak gewezen op de conflicten tussen het nut op de korte termijn en het nut op de lange termijn. De zelfbeheersing van mensen is beperkt, met als gevolg dat zij vatbaar zijn voor kortstondige verleidingen. Wilkinson vermoedt, dat het impulsieve gedrag ooit behulpzaam was bij de menselijke evolutie. Echter onze moderne samenleving verlangt toenemend, dat individuen hun driften kunnen beteugelen ten bate van een betere toekomst. Dit blijkt onder andere uit de bereidheid van banken om rente te betalen over de tegoeden van hun spaarders. Naarmate de spaarder zijn tegoed langer vastzet, zal hij zelfs rente op rente ontvangen. De bekende econoom P.A. Samuelson heeft deze gedachte toegepast op de verdiscontering van het nut van consumptie. Hij stelt zich de vraag wat het samengestelde nut U is van de consumptie c(t) op tijdstippen t=0, ... , T. Anders geformuleerd, hoe moet de individu zijn consumptie verdelen om er een optimaal nut mee te realiseren?

Samuelson stelt de volgende formule voor met betrekking tot het samengestelde nut (zie p.193)

(3)     U = Σt=0T u(c(t)) / (1 + ρ)t

In de formule 3 is u(c(t)) het nut van de consumptie op het tijdstip t. De factor ρ is de verdisconteringsvoet, die de individu hanteert bij het nut van consumptie. Aangezien ρ positief is, ervaart de individu de consumptie als minder nuttig, naarmate zij verder in de toekomst ligt. De individu zal enkel zijn huidige consumptie c(0) willen beteugelen, indien daardoor het nut van de toekomstige consumptie u(c(n)) navenant groter wordt. Hierin is n het aantal stappen voorwaarts in de tijd.

De gedragseconomie heeft ontdekt, dat mensen geen constante verdisconteringsvoet ρ hanteren. Met name blijkt ρ groter te zijn op de korte termijn dan op de lange termijn (zie p.227). Daardoor wijkt het besluitnut in het hier en nu af van het verwachte nut, dat reëel tot stand komt volgens de rationele formule 3 (zie p.54). Met andere woorden, ρ is zelf een functie van t. Men zou bijvoorbeeld kunnen aannemen, dat er geldt ρ(t) = t1/t − 1, voor alle t>0. Deze manier van verdisconteren wordt hyperbolisch genoemd. Echter in de practijk heeft men betere resultaten geboekt met de quasi-hyperbolische verdiscontering. Deze veronderstelt dat er geldt:

(4)     ρ(t) = -1 + 1 / (δ × β1/t)

De formule 4 geldt enkel voor t>0. Voor t=0 neemt men eenvoudigheids halve ρ=1. De parameter δ moet voldoen aan δ<1. Kies nu ook β zodanig, dat β<1. Dan zal β1/t naderen naar de waarde 1, naarmate t groter wordt. In de limiet van grote t-waarden zal gelden dat ρ = -1 + 1/δ, en dus δ = 1 / (1 + ρ). Men keert dan terug naar de formule van Samuelson. Strikt genomen is er geen rationele reden waarom men de verdisconteringsvoet zou veranderen met de tijd. Het betreft hier enkel een experimentele constatering, die opnieuw de irrationaliteit van de menselijke houding tot uitdrukking brengt. Als mensen zich bewust worden van de irrationaliteit, dan kunnen zij zichzelf kunstmatige beperkingen opleggen, waarmee zij weerstand kunnen bieden aan de impulsieve verleiding.

Psychologisch gezien is het conflict tussen het korte- en lange-termijn geluk de botsing van zwakte en deugd. Er is een meervoudige zelf (p.232). Bewustwording is de herinnering aan de spijt over voorgaande momenten van zwakte. Men kan zichzelf verplichten door doelbewust de eigen keuzen te reduceren. Een triviaal geval is het besluit om de wekker buiten handbereik te plaatsen, en aldus doorslapen te belemmeren. Men kan spilzucht bestrijden door een levensverzekering af te sluiten. Dit zou ook kunnen verklaren, waarom mensen er prijs op stellen dat hun salaris stijgt gedurende hun loopbaan. Overigens is een alternatieve verklaring, dat mensen onwillig zijn om hun consumptie te verminderen. Experimenten laten zien, dat mensen een dalend loon afwijzen, zelfs als daarmee hun totale verdienste gedurende de loopbaan zou toenemen (zie p.208)!


Evaluatie

Uw columnist is onvoldoende bekend met de gedragseconomie om een diepgaand oordeel te geven. Wel is direct duidelijk, dat de modellen uit de gedragseconomie niet geschikt zijn om een alomvattende economische theorie te ontwikkelen. Daarvoor zijn de onzekerheden te groot, en zijn de modellen te divers. Voorlopig ligt de waarde van de gedragseconomie vooral in het aanwijzen, waar de gangbare economie moet falen. De conclusie is onverbiddelijk: de homo economicus bestaat niet. In tegendeel, kennelijk is de mens een mechanisch wezen, dat steeds weer vervalt in de meest absurde keuzen en gedragingen. En dat is een ontnuchterende constatering, die dwingt tot bescheidenheid. De gedragseconomie is vooral beschrijvend, en niet normatief ("gij zult sparen"). Toch kunnen individuen, ondernemingen en de staat ervan leren, en moeten zij rekening houden met de consequenties. Beleidsmakers moeten de inzichten van de gedragseconomie toepassen. Dat doen zij inderdaad, onder het mom van "gezond verstand".

  1. Zie An introduction to behavioral economics (2008, Palgrave MacMillan) van N. Wilkinson (terug)
  2. Zie p.63 in An introduction to behavioral economics. Op p.388 vindt men hetzelfde argument, want Wilkinson houdt van herhalingen. Daar maakt hij de vergelijking van een wielrenner bij de finish, wiens gezicht zowel pijn als vreugde uitstraalt. Echter de Engelse econoom R. Layard beweert op p.21 in Happiness (2005, The Penguin Press) dat gevoelens van geluk en ongeluk niet gelijktijdig kunnen optreden. De ene blokkeert de andere (zoals ook Wilkinson suggereert). Aldus vormen zij toch één dimensie, ondanks dat men de twee gevoelens niet zomaar kan optellen. Inderdaad vindt uw columnist het plausibel, dat de zojuist genoemde wielrenner enkel de vreugde van de overwinning bewust zal voelen. (terug)
  3. Op p.395 in An introduction to behavioral economics staat een ander voorbeeld. Studenten moeten eerst een getal van twee cijfers kiezen. Daarna moeten zij de vraag beantwoorden of zij dat bedrag willen betalen voor een bepaalde fles wijn. Vervolgens moeten zij zeggen welke prijs zij redelijk vinden voor de fles wijn. Studenten die aan het begin een hoog getal hebben gekozen, blijken (gemiddeld) bereid te zijn om een hogere prijs te betalen voor de wijn! (terug)
  4. Op p.134 in An introduction to behavioral economics geeft Wilkinson een ander voorbeeld. Stel 600 passagiers dreigen te verdrinken op een zinkend schip. Er wordt een reddingsactie bedacht. Mensen verkiezen de actie "Er worden 200 passagiers gered" boven de actie "Er zullen 400 passagiers verdrinken", hoewel uiteraard het resultaat in beide gevallen gelijk is. (terug)
  5. De Belgische zanger Wannes van de Velde prijst de uitdaging in Café zonder naam: Maar ne zeeman oud van jaren / kwam eens binnen met de wind, / om wa' moed te gaan vergaren / bij een borrel en een pint, / en hij las er de gedachten, / de verveling van lege nachten, / in het uitgestorven oog / van de mensen aan den toog. / 'Scheidt toch uit met u te plagen, / gaat toch mee met heel de ploeg, / onder zeil één van deez' dagen, / op mijn schip is plaats genoeg'. / En het is zover gekomen / dat 'm z' allemaal heeft meegenomen; / het caféke zonder naam / is verlaten blijven staan. (terug)
  6. Zie Economisch motief en economisch principe (1945, N.V. Noord-Hollandsche Uitgevers Maatschappij) van P. Hennipman. (terug)
  7. Op p.393 in An introduction to behavioral economics geeft Wilkinson het simpele voorbeeld van de zogenaamde gokkers-vergissing. Mensen passen de wet van de grote aantallen ook toe op een korte serie kansspellen. Als vijf keer een geldstuk wordt opgegooid, en telkens na landing de muntzijde boven ligt, dan achten velen de kans groot, dat bij de volgende worp de kruiszijde boven zal liggen.
    Robert Long zegt het met zijn lied Boodschappenlijst van de Hollandse maagd: 1 blik gemakzucht en 1 doos gewoonte / 1 grote voorraadpot 'Ik heb gelijk' / 1 rol gezinsverband / 'n handjevol vaderland / en de verjaardagskalender met foto's van lui uit Soestdijk. / 2 liter achterdocht, 1 pak 'ze moesten' / 1 zak melange gezeur en geklaag / 'n ½ onsje zuinigheid / 1 stuk gezelligheid / en de verjaardagskalender met foto's van lui uit Soestdijk en Den Haag. (terug)
  8. Op p.387 in An introduction to behavioral economics noemt Wilkinson het voorbeeld van iemand die in winkels de kleine bedragen altijd afrekent met contant geld, zelfs als hij een creditcard bij zich heeft. Dit kan irrationaal gedrag zijn, omdat contant geld geen rente opbrengt, en het gebruik ervan dus beter kan worden vermeden. Als uw columnist het goed begrijpt, dan valt de toepassing van vuistregels onder de zogenaamde representativiteits heuristiek (zie p. 47 en p.393). Mensen denken in termen van prototypes, en beoordelen de actuele situatie op basis van de herinneringen aan vroegere prototypes. Overigens benadrukt ook Graafland in een eerdere column het belang van vuistregels.
    Vermelding verdient de suggestie van Wilkinson op p.419, dat zowel de schuldgevoelens als het plezier van plichtsbetrachting een genetische oorzaak hebben. Deze idee is afkomstig uit de evolutionaire psychologie, die tamelijk speculatief is. Feitelijk keert Wilkinson hiermee op verrassende wijze terug naar de vroege ideeën van de sociaaldemocratische socioloog Karl Kautsky. (terug)
  9. Dit experiment verdient het om te worden genoemd. Op p.138 in An introduction to behavioral economics wordt een experiment van Tversky en Kahneman beschreven. De proefpersonen moeten kiezen tussen twee loterijen A en B. Loterij A heeft p = (0.9, 0.06, 0.01, 0.01, 0.01) met als bijbehorende opbrengsten u = u(xj) = (0, 45, 30, -15, -15). Loterij B heeft dezelfde kansverdeling, maar met als bijbehorende opbrengsten u = u(xj) = (0, 45, 45, -10, -15). Uiteraard zal iedereen kiezen voor de loterij B, wegens de mogelijkheden 3 en 4. Echter de proefpersonen moesten kiezen uit de loterijen C en D. Loterij C heeft p = (0.9, 0.06, 0.01, 0.03) met als bijbehorende opbrengsten u = u(xj) = (0, 45, 30, -15). Loterij D heeft p = (0.9, 0.07, 0.01, 0.02) met als bijbehorende opbrengsten u = u(xj) = (0, 45, -10, -15). De loterij C is feitelijk gelijk aan de loterij A (met mogelijkheden 4 en 5 samengevoegd), en de loterij D is feitelijk gelijk aan de loterij B (met mogelijkheden 2 en 3 samengevoegd). Toch blijkt 58% van de proefpersonen de voorkeur te geven aan loterij C. Dit is een voorbeeld van inkadering (framing). Het verlies (-10) bij mogelijkheid 3 van loterij D werkt afschrikwekkend, en de proefpersonen overzien daarbij de iets grotere kans (op 45) bij mogelijkheid 2, en de iets kleinere kans (op -15) bij mogelijkheid 4! (terug)
  10. De ongelijkheids-afkeer modellen zijn aardig genoeg om er een voetnoot aan te wijden. Op p.355 beschrijft Wilkinson het Fehr-Schmidt model, waarin een uitbetaling x = (x1, ..., xN) moet worden gedaan aan N individuen. Uiteraard hangt het geluk van de individu j af van zijn uitbetaling xj. Stel dat de individu j bovendien een afkeer (wrok) αj heeft van een lage uitbetaling, en een afkeer (schuldgevoel) βj van een hoge uitbetaling (in verhouding tot de gemiddelde uitbetaling). Dan is een mogelijke nutsfunctie Uj = xj − αj × Σk=1N max(xk − xj, 0) / (N − 1) − βj × Σk=1N max(xj − xk, 0) / (N − 1). Dit model is met enig succes toegepast om experimenten te analyseren. Men noemt αj wel de naijver-coëfficiënt, en βj de schuld-coëfficiënt. Een homo economicus kent naijver noch schuld, en heeft α=β=0. Het Fehr-Schmidt model is niet echt een universeel model, en illustreert nogmaals het ad hoc karakter van de gedragseconomie. (terug)
  11. De column over de homo economicus bevat twee nutsfuncties, die het altruïstische gedrag modelleren op een eenvoudige manier. Graafland stelt het altruïsme van de individu A voor door een constante factor r. Zijn model baseert noch op een afkeer van ongelijkheid, noch op wederkerigheid. Het model van Frijters wordt gekenmerkt door de aanname, dat dankzij de keuze voor een altruïstische transactie de individu A zijn eigen nutsfunctie zal wijzigen. Kennelijk geeft het model van Frijters de nutsfunctie na afloop van de transactie. Toewijding ontstaat voor hem uit een vooraf niet voorziene karakterwijziging. (terug)