Het disconto voor intertemporele afwegingen

Plaatsing in Heterodoxe Gazet Sam de Wolff: 20 mei 2016

E.A. Bakkum is beroepsmatig werkzaam bij het Sociaal Consultatiekantoor, waar hij de functie van zaakwaarnemer vervult. Hij denkt graag na over de arbeiders beweging.

Besluiten kunnen verstrekkende gevolgen hebben voor de toekomst. Daarom heeft de economische wetenschap modellen bedacht, waarmee de consequenties van besluiten kunnen worden doorgerekend. Zij voorzien nutsfuncties van een intertemporele discontering. De huidige column breidt het Walrasiaanse model uit met een intertemporeel nut. Vervolgens wordt het toegepast in het overlappende generatie (OLG) model. Hierna wordt enige kritiek vanuit de gedragseconomie vermeld. Tenslotte wordt uitgelegd hoe Van Praag herinneringen en verwachtingen disconteert in het nuts oordeel.

Economische beslissingen worden nooit genomen in een statische situatie. Het leven is dynamisch. De individu en de maatschappij zijn onderworpen aan voortdurende veranderingen. Enerzijds zal elk besluit in het heden het toekomstige welzijn beïnvloeden, en anderzijds zal men wellicht zijn toekomstige besluiten moeten aanpassen bij de verwachte ontwikkelingen. Een bekend voorbeeld van de invloed van tijd is het toekennen van waarde aan toekomstige geld-inkomsten. Stel de handelaar k heeft recht op uitbetaling van een som geld, die heden (zeg op tijdstip t=0) een waarde p0 heeft. Als de betaling wordt uitgesteld met een tijdsperiode Δt, en de grootte van de rentevoet voor die periode bedraagt r, dan loopt k rente inkomsten ter grootte van r×p0 mis. Uiteraard wil k worden gecompenseerd voor zijn verlies (disconto), zodat hij op tijd t=Δt een som geld p0 × (1+r) verlangt.

Dit argument kan worden uitgebreid naar een willekeurig lange perioden. Stel bijvoorbeeld dat het uitstel tn = n×Δt bedraagt, waarin n een natuurlijk getal is. In dat geval zal ter compensatie op dat tijdstip een som geld p0 × (1+r)n moeten worden betaald aan k. Noem gemaks halve dat bedrag pn, dan geldt er kennelijk1

(1)     p0 = pn / (1 + r)n

Met andere woorden, als het bedrag pn pas wordt uitbetaald op tn, dan is de huidige waarde (in de Engelse taal present value) lager dan pn. De economische reden is natuurlijk, dat het bedrag p0 productief kan worden ingezet gedurende de n perioden. Het is potentieel een investering, die winst oplevert. Een tweede argument waarom de handelaar k rente eist is dat gedurende de n perioden het bedrag niet beschikbaar is voor zijn consumptie. Hij moet kariger leven, en dat is onprettig. Het is een last, die moet worden gecompenseerd.

Dit laatste argument kan worden gegeneraliseerd. Individuen blijken gewoonlijk liever een direct genot te hebben dan de genotservaring uit te stellen. Stel het nut (of genot, of plezier, of lust) van een bepaalde consumptie c0 op het tijdstip t=0 wordt gegeven door de functie u(c0). Als nu de consumptie moet worden uitgesteld met een periode Δt, dan wil de handelaar k voor dat ongemak worden gecompenseerd met een extra nut d × u(c0). De grootheid d wordt de disconto voet genoemd. Meer algemeen zal het uitstel van consumptie met een tijd tn betekenen, dat het dan ervaren nut un een afwaardering ondergaat. In het heden levert die toekomstige consumptie slechts een nut ter grootte van un / (1+d)n op. Hoewel r en d allebei een tijdsvoorkeur uitdrukken, zijn zij niet gelijk. Immers gewoonlijk veronderstelt men dat het nut u van een consumptie c zich logaritmisch gedraagt (u = ln(c)). Er is geen lineaire samenhang tussen u en c.

Stel nu dat de handelaar k verwacht dat zijn consumptie pad vanaf t=0 zal bestaan uit c(0), c(Δt), c(2 × Δt), .... enzovoort. Dan kan k voor elke tijd tn = n×Δt inschatten, wat het nut u is op het moment van consumeren. Vervolgens kan hij via de disconto voet berekenen, hoeveel nut dat toekomstige genot hem oplevert in het heden. Neem tenslotte nog aan, dat al die hedendaagse nutten simpelweg mogen worden opgeteld tot een totaal hedendaags nut U. Definieer gemaks halve de disconto factor door δ = 1/(1+d). Dan wordt dat totale nut U gegeven door de formule

(2)     U = Σn=0N δn × u(c(n × Δt))

In de formule 2 is tN de verste periode, die de handelaar k nog meeweegt in zijn evaluatie. Men noemt D(n) = δn de disconto functie. Stel dat de handelaar k invloed heeft op zijn consumptie pad. Dan staat hij voor de opgave om zijn totale nut U maximaal te maken. Dat wordt bereikt door de consumptie op een geschikte manier te verdelen over alle N+1 perioden.

Afbeelding van kwartetkaart Raiffeisenbank
Figuur 1: Kwartetkaart
   Raiffeisenbank

De formule 2 is handig om een economisch systeem van volkomen mededinging te modelleren. Dit punt wordt nu nader uitgewerkt. In een eerdere column is uitgelegd, dat in zo een systeem een Walrasiaans evenwicht kan ontstaan, mits is voldaan aan bepaalde voorwaarden. In feite betreft het een model, waarin de voorwaarden enigszins onrealistische abstracties zijn. Echter dankzij de aannames wordt het mogelijk om het systeem wiskundig door te rekenen, en dat is wat waard. In de oudste versie heeft het model van Walras alleen maar consumptieve markten. Er zijn H huishoudens, die de beschikbare goederen ruilen op de markten om hun eigen nut maximaal te maken. Trouwe lezers herinneren zich, dat een dergelijke handel grafisch kan worden afgebeeld in een Edgeworth box. Dankzij de ruil consumeert elk huishouden h uiteindelijk ch(n × Δt) in de periode n, of in verkorte notatie ch(n).

Het huidige betoog over consumptie verschilt van de voorgaande columns, doordat de ruil plaats vindt in een rij perioden n = 0, ..., N. Immers het ligt voor de hand, dat beslissingen van ruil in de periode n consequenties hebben voor de mogelijkheden van ruil in de navolgende perioden. Bijvoorbeeld zou een huishouden kunnen besluiten tot sparen. Of de huishoudens besluiten om te gaan werken, waardoor er nieuwe eigendommen op de markten komen. Juist om deze reden loopt de sommatie in de formule 2 over alle perioden. Want de huishoudens moeten rekening houden met hun toekomst, en een intertemporele nuts afweging maken. Ze moeten de U van de formule 2 uitrekenen voor allerlei consumptie scenario's. Het is inderdaad een gewaagde aanname, dat mensen hiertoe in staat zijn! Voorts onthult deze uitleg een zwakte van dit oude Walrasiaanse model. Immers in deze versie van het model is nog onduidelijk, hoe al die consumptieve goederen beschikbaar zijn gekomen.

Daarom heeft men later het model aangevuld met een productie theorie, die de ondernemingsgewijze productie beschrijft. Men kan in de Gazet deze productie theorie terugvinden in diverse gedaanten, bijvoorbeeld in de column over verzamelingen. Zij heeft het uitgangspunt, dat ondernemingen slechts één doel kennen, te weten de maximalisatie van hun winst. Zij maken winst door de productie factoren arbeid en kapitaal in te huren, en hen productief aan het werk te zetten in een productie proces. Vervolgens wordt het eindproduct verkocht tegen een zodanige prijs, dat de opbrengst groter is dan de productie kosten. Dit impliceert dat de productie theorie extra markten toevoegt aan het evenwichts model, namelijk die voor arbeid en kapitaal. De huishoudens krijgen een dubbelrol, enerzijds als consumenten, en anderzijds als aanbieders van arbeid en kapitaal.

Dit moderne model van het Walrasiaanse evenwicht wordt gedefinieerd door drie vergelijkingen2:

(3a)     Σh=1H ch(n) = ζ(n) + Σh=1H wh(n) voor alle n=0, ..., N
(3b)     maxη(n) π(n) = p(n) × η(n) voor alle n
(3c)     maxch(n) Uh onder de voorwaarde Σn=0N p(n) × ch(n) ≤ Σn=0Nh(n) × π(n) + p(n) × wh(n)), voor alle h

Merk op dat de grootheid n hier optreedt als een discrete tijds-variabele. In de formule 3a stelt de grootheid wh(n) de eigendommen voor van het huishouden h, die het vanzelf beschikbaar heeft tijdens de periode n. De grootheid ζ(n) is datgene wat er overblijft van het totale product uit de voorgaande periode n−1, na aftrek van alle productie factoren die nodig zijn voor de periode n. De aftrekpost is nodig om te kunnen voorzien in de bruto investeringen. dat wil zeggen, de vervanging van verbruikte productie factoren, alsmede eventueel de uitbreiding ervan. Aldus garandeert de formule 3a, dat gedurende elke periode n de huishoudens tezamen precies consumeren wat resteert aan eindproducten, vermeerderd met hun momentane eigendommen. Dat wil zeggen, alle markten worden geruimd. Merk op dat strikt genomen de formule 3a een vector vergelijking is. Immers gewoonlijk is er een hele rij van consumptie goederen beschikbaar3.

De formule 3b modelleert de productie sfeer. Hier is de voorstelling sterk versimpeld, omdat de formule niet direct van belang is voor het disconto probleem. Daarom wordt gemaks halve per periode n niet de winst van de afzonderlijke ondernemingen maximaal gemaakt, maar enkel de totale winst π(n) van het bedrijfsleven als geheel. De winst wordt berekend door het netto product η(n) te vermenigvuldigen met de prijs p(n) ervan. Strikt genomen zijn η en p vectoren, zodat er sprake is van een inproduct η·p. De maximalisatie betekent een geschikte keuze van de productie structuur, en dus van η. Het zal duidelijk zijn, dat gewoonlijk ζ(n) en η(n) verschillen. Immers ζ(n) toont juist de dynamiek van de productie, wanneer wordt overgegaan van de periode n−1 naar n. En η(n) voltrekt zich binnen de periode n. Zij zijn enkel gelijk, indien het economische systeem statisch is, en zichzelf reproduceert4.

De formule 3c laat zien, hoe elk huishouden zijn consumptieve voorkeuren tot uiting brengt, via een intertemporele afweging. De keuze alternatieven worden ingeperkt door de intertemporele begrotings vergelijking. Immers het huishouden kan in totaal niet meer consumeren dan het eigen inkomen toelaat. In die zin is de beperking in de formule 3c het monetaire equivalent van de formule 3a. Echter een afzonderlijk huishouden kan sparen, en het inkomen deels overhevelen naar een volgende periode. Men ziet hoe de winst terugkeert naar de huishoudens, waarbij θh(n) het winstdeel van het huishouden h is in de periode n. Strikt genomen zijn de prijs-gerelateerde termen in de formule 3c weer inproducten5.

Dit voltooit de beknopte uitleg van het Walrasiaanse evenwicht. Dat wil zeggen, feitelijk is er sprake van consumptie paden ch(0), ch(1), ... en van productie paden ζ(0), ζ(1), ... in de tijd. Het stelsel 3a-c garandeert dat het systeem in evenwicht is langs het hele tijdspad. Interessant is ook, dat men het begrip huishouden in deze theorie een brede betekenis kan geven. Bijvoorbeeld kan men aannemen, dat het huishouden een dynastie is van elkaar opvolgende generaties. Dit vereist wel, dat elke generatie in de dynastie steeds het nut van het nageslacht meeweegt, als ware het haar eigen nut. Dat introduceert altruïsme in het model. Modellen met opeenvolgende generaties zijn belangrijk voor de monetaire theorie, en voor de theorie van staatsbestedingen6.


Het overlappende generatie model

Nadat in de tekst van zonet de algemene evenwichts theorie is behandeld, wordt nu in de rest van de column het disconto bij intertemporele afwegingen van consumptie nader geanalyseerd7. Deze analyse vindt plaats met behulp van het overlappende generatie model (afgekort OLG model). Dit is een rigoreuze versimpeling van het gepresenteerde Walrasiaanse model. Namelijk, allereerst wordt aangenomen, dat er slechts één consumptief goed is. Dan bevat het stelsel 3a-c daadwerkelijk vermenigvuldigingen, en geen inproducten. Voorts wordt de productie sfeer verder genegeerd. De inkomsten uit de productie worden geheel ondergebracht in de term wh(n). Dien ten gevolge speelt de formule 3b geen rol meer8. Verder worden ch(n) en wh(n) uitgedrukt in hun monetaire waarde. Dat wil zeggen, de formule 3c heeft p(n)=1.

Een volgende aanname is dat het leven van elk huishouden is beperkt tot twee perioden. In de eerste periode bestaat het betreffende huishouden uit werkers, maar die veranderen in de tweede periode in pensioen trekkers. Uiteraard is de bedoeling van deze opzet om te onderzoeken, in hoeverre het nog jonge huishouden gaat sparen ten behoeve van het toekomstige pensioen. Beschouw nu een zekere periode n. Dan is het aantal werkende huishoudens Hw(n), en het aantal gepensioneerde huishoudens is Hp(n). Er moet gelden Hp(n+1) = Hw(n). Het consumptie pad van huishouden h wordt vrij simpel, namelijk ch(n) = [cwh(n), cph(n+1)]. Het is een vector met slechts twee dimensies.

Dankzij de beperking tot de twee categorieën werkers en pensioen trekkers wordt met name de begrotings beperking in de formule 3c aanmerkelijk eenvoudiger. Er wordt aangenomen, dat alleen de werkers sparen. Dat wil zeggen, zij swh(n) het spaartegoed van het huishouden h in periode n, dan is diens consumptie

(4)     cwh(n) = wwh(n) − swh(n) voor alle n

De formule 4 laat nog de mogelijkheid open, dat sommige werkende huishoudens een lening afsluiten. Voor hen is het spaartegoed negatief. De rentevoet bedraagt r(n). Definieer gemaks halve de huidige waarde factor voor een opbrengst na één periode door ρ(n) = (1 + r(n))-1. Dan wordt de consumptie van het huishouden h in zijn pensioen periode gegeven door

(5)     cph(n+1) = wph(n+1) + swh(n) / ρ(n) voor alle n

Afbeelding van spaar-effect in isonuts veld
Figuur 2: Spaar-effect op nut

De formules 4 en 5 zijn de begrotings beperkingen van het huishouden h in de perioden n en n+1. Strikt genomen zou de consumptie lager kunnen zijn, maar dan bevindt het huishouden zich niet in zijn optimum. Men vindt een formule van de gedaante 3c door het spaar tegoed te elimineren uit de formules 4 en 5. Het resultaat is

(6)     cwh(n) + cph(n+1) × ρ(n) = wwh(n) + wph(n+1) × ρ(n)

De formule 6 is een rechte lijn in het [cwh(n), cph(n+1)] vlak, met een helling -1/ρ. Zij is ingetekend in de figuur 2. Men ziet hoe het huishouden elk punt op deze lijn kan bereiken, simpelweg door de geschikte spaar keuze te maken.

Bij afwezigheid van sparen bevindt het huishouden h zich in het punt [wwh(n), wph(n+1)]. Aangezien dit een punt is zonder enige ruil, noemt men dit een autarkie9. Het nut bedraagt er Uh(wwh(n), wph(n+1)). De betekenis van het sparen wordt duidelijk, wanneer men de isonuts curven van Uh = Uh(cwh(n), cph(n+1)) beschouwt, en ook die tekent in de figuur 2. Het is duidelijk dat het huishouden h zijn intertemporele nut kan vergroten door langs de intertemporele begrotingslijn te bewegen, totdat die juist raakt aan een isonuts curve. In dat optimale punt voldoet de intertemporele marginale substitutie verhouding van cwh(n) en cph(n+1) aan10:

(7)     MSV = dcph(n+1) / dcwh(n) = -(∂Uh(n) / ∂cwh(n)) / (∂Uh(n) / ∂cph(n+1)) = -1/ρ(n)

Interessant aan de figuur 2 is ook, dat men het effect kan nagaan van veranderingen in de rentevoet r(n). Immers die werken door in ρ(n), en dus in de helling van de begrotings lijn (formule 6). Het ligt voor de hand dat bij een stijgende r(n) de huishoudens meer gaan sparen, omdat dankzij de hogere rente hun consumptie als pensioen trekker zal toenemen. Het pad dat wordt afgelegd in het [cwh(n), cph(n+1)] vlak bij een stijgende rentevoet noemt men de aanbod curve van spaargeld. Zij loopt naar links en omhoog.


Een rekenvoorbeeld met een stationair OLG model

Merk op dat tot heden in het betoog over het OLG model nog geen gebruik is gemaakt van de disconto factor δ. De intertemporele Uh(n) mag nog elke gedaante hebben. Echter er kunnen interessante samenhangen worden afgeleid uit het model, wanneer de formule 2 wèl wordt toegepast. Dan blijkt het consumptie pad wiskundig te kunnen worden uitgerekend. Neem aan dat het consumptieve nut gelijk is aan u(c) = ln(c), dan wordt de formule 2 in het OLG model

(8)     Uh(n) = ln(cwh(n)) + δh × ln(cph(n+1))

Merk op dat dan exp(Uh(n)) de Cobb-Douglas gedaante heeft. Veronderstel dat de formule 8 geldt voor alle huishoudens, met één universele disconto factor δh = δ. Neem voorts aan dat het economische systeem zich bevindt in een stationaire toestand. Zo een toestand heeft als kenmerk, dat de grootheden onafhankelijk zijn van de tijd. De productie sfeer blijft onveranderd, en dus ook ww, wp, en r. Bovendien wordt hier verondersteld, dat het aantal werkers constant is in de tijd, zeg H 11. Aangezien de werkers eindigen als pensioen trekkers, is ook het aantal pensioen trekkers gelijk aan H. Stel dat ww en wp gelijk zijn voor alle huishoudens. Substitueer nu de formule 8 in de formule 7. Men vindt het resultaat

(9)     ρ(n) = δ × cw(n) / cp(n+1)

Elimineer cp(n+1) uit de formule 6 met behulp van de formule 9, dan is het resultaat na enig simpel schrijfwerk

(10)     cw(n) = (ww + wp × ρ(n)) / (1 + δ)

Door de combinatie van de formules 9 en 10 vindt men

(11)     cp(n+1) = (ww / ρ(n) + wp) × δ / (1 + δ)

De formules 10 en 11 definiëren tezamen het consumptie pad van het OLG model met disconto factor.

Beschouw nu de formule 3a voor de ruiming van markten, die vereist wordt bij het Walrasiaanse evenwicht. Aangezien is aangenomen dat het aantal werkers en pensioen trekkers allebei H bedraagt, reduceert de formule 3a hier tot

(12)     cw(n) + cp(n) = ww + wp

Uiteraard geldt de formule 12 evenzeer voor de periode n+1. Echter aangezien cp(n+1) is voorgeschreven door de formule 9, is daarmee kennelijk tevens cw(n+1) vastgelegd. Dat wil zeggen, de situatie wordt gekenmerkt door een dynamische ontwikkeling van cw(n) met de tijdsfactor n. Men kan deze dynamische ontwikkeling uitrekenen, en vindt dan12

(13)     cw(n+1) = ww + wp × (cw(n) − ww) / (cw(n) × (1 + δ) − ww)

Dit toont aan, dat inderdaad cw(n+1) afhangt van de keuze cw(n), en verder van de toestand [ww, wp] van autarkie. Kennelijk is er een schuivend consumptie plan, dat gepaard gaat met een verandering van ρ(n) in de tijd. De eis van een stationaire toestand legt nu als extra eis op, dat het rendement r constant is, en dat er moet gelden cw(n+1) = cw(n). De formule 13 laat zien dat de toestand van autarkie hieraan voldoet. Echter die zal het nut niet maximaal maken. Evenwel is er nog een tweede stabiele toestand. Vergelijk namelijk de formules 6 en 12. Als er geldt dat ρ(n)=1, en dus de rentevoet gelijk is aan r=0, dan zal inderdaad de identiteit cw(n+1) = cw(n) gelden13. Een dergelijk pad van stationaire productie en consumptie wordt het Gouden Regel pad genoemd.

De formule 13 is met name instructief, omdat zij het dynamische gedrag buiten het stationaire evenwicht beschrijft. Zij stelt het functionele verband cw(n+1) = f(cw(n)) voor. Aangezien er twee stationaire toestanden zijn, snijdt f(cw(n)) de lijn(-functie) cw(n+1) = cw(n) op twee plaatsen. Dat komt omdat f(cw(n)) weliswaar een stijgend gedrag vertoont, maar in afnemende mate. Voorbij het eerste snijpunt zal op zeker moment gelden ∂f/∂cw(n) < 1. Tevens betekent dit, dat tussen het eerste en tweede snijpunt geldt f(cw(n)) > cw(n). Kennelijk beweegt in de dynamische situatie cw toe van het laagste snijpunt naar het hoogste snijpunt, naarmate de tijd n vordert14. Dit heeft een merkwaardige consequentie. Namelijk, als in het Gouden Regel pad de werkers sparen, zoals is getekend in de figuur 2, dan komt dit pad overeen met het laagste snijpunt. En dat is niet stabiel. In deze situatie zal elke positieve verstoring van cw de situatie dynamisch naar de autarkie voeren.


Het disconto in de gedrags-economie

De voorgaande tekst laat zien dat de discontering van het nut volgens de formule 2 een handige manier is om de intertemporele keuzen in eeh economische systeem te beschrijven. Echter de formule 2 wordt in twijfel getrokken door de gedragseconomie. De huidige paragraaf somt enkele punten van kritiek op15. Een belangrijke tegenwerping is dat mensen het vooral op de korte termijn onprettig vinden om een beloning later te ontvangen. Echter naarmate de het uitstel van de uitbetaling meer de lange termijn betreft, tillen zij er minder zwaar aan. Dat wil zeggen, de disconto factor δ neemt snel af op de korte termijn, en daalt slechts langzaam voor de lange termijn. Voor de disconto voet d geldt precies het omgekeerde. Dit kan worden verwerkt in de formule 2, door de disconto functie D(n) = β×δn te gebruiken, met β<1. Alleen voor de eerste periode n=0 neemt men D(0)=1, en dus β=1. Men noemt D(n) de quasi-hyperbolische disconto functie.

Overigens, als δ geen constante is, dan verliest hij aan betekenis. Wellicht is voor zulke gevallen de disconto functie D(n) = (1 + α×n)-1 een beter alternatief, waarin α een positieve constante is. Bijvoorbeeld kan men voor α de disconto voet d kiezen. Bij een gegeven d zal deze functie voor de lange termijn minder snel dalen dan δn. Dit wordt hyperbolisch disconteren genoemd. Het blijkt dat sommige laboratorium experimenten hiermee redelijk kunnen worden beschreven. Het (quasi-)hyperbolisch disconteren brengt in rekening, dat mensen veel nut hechten aan het onmiddelijke genot. Gelukkig zijn mensen zich bewust van hun gebrek aan wilskracht, zodat zij zichzelf er enigszins tegen kunnen beschermen. Dat gebeurt via een doelbewuste zelfbeperking vooraf. Analytisch wordt het verklaard met het duale zelf model, waarin de mens zowel de beslisser is als de uitvoerder. De beslisser moet een handig contract afsluiten met zichzelf als de onwillige uitvoerder.

Een voorbeeld van zo een contract is om weinig geld mee te nemen, wanneer men verwacht in een situatie te komen met allerlei verleidelijke "koopjes". Of men kan zelfs helemaal een bezoek vermijden aan plaatsen met zulke aanbiedingen. Dat is bewuste onthouding. Het kan doelmatig zijn om de uitvoering over te laten aan een andere persoon, die ongevoelig is voor de verleidingen. Dit wordt een externe zelfbeperking genoemd. Dit kan als ongewenst neven-effect hebben dat men zelf minder flexibel kan handelen. Denk aan een actie van burgers om de belasting op rookwaren of alcohol te verhogen.

Als de staat de beperking op zich neemt, dan spreekt men van liberaal paternalisme. Een voorbeeld is de verkoop van vuurwerk te beperken tot enkele dagen. Ook mogelijk is een gedwongen afkoel periode, waardoor mensen een impulsieve koop alsnog ongedaan kunnen maken. De sociale zekerheid dwingt de werkers om premies af te dragen, waardoor zij verzekerd zijn tegen allerlei calamiteiten. Een staatspensioen is feitelijk gedwongen sparen. Een variant is de standaard keuze (in de Engelse taal default): de staat levert een publieke dienst zodanig, dat het algemeen belang voorop staat, tenzij de burger expliciet vraagt om het alternatief. Bijvoorbeeld: iedereen is orgaan donor, behalve de expliciete weigeraars.

Plakbiljet staatspensioen van SDAP en NVV
Figuur 3: Plakbiljet
   (SDAP en NVV)

Er zijn evenwel nog andere redenen, waarom de disconto factor δ niet constant is. Het vermelden waard is het mentale boekhouden. De neiging tot onmiddellijk consumeren hangt sterk af van de liquiditeit van de geldbron. Bijvoorbeeld zal men eerder een uitgave doen met een credit card dan met een spaarrekening. Zelfs rood staan op de credit card wordt geen probleem gevonden. Wellicht spelen casino's daarom met chips. Trouwens, winsten uit spel zal men gemakkelijk weer uitgeven, omdat het niet wordt beschouwd als een inkomen. Zelfs professionele beleggers zijn soms irrationeel kortzichtig en daardoor risico mijdend. Beleggings portfolio's zijn altijd divers, soms zonder reden.

Men doet makkelijker vele kleine uitgaven dan één grote, bijvoorbeeld voor duurzame consumptie goederen. Juist daarom is automatisch sparen zo handig. Mensen doen graag een aankoop met inruil, in de illusie dat de inruil geld oplevert. Anderzijds kunnen mensen zozeer gebukt gaan onder de last van een schuld, dat zij die te vroegtijdig aflossen. Het is duidelijk dat in al deze gevallen de mensen een wat irrationele manier hebben om hun intertemporele nut te disconteren.

Ter afsluiting zij nog de voorkeur van mensen genoemd voor stijgende tijdrijen van inkomsten. Werkers hechten er veel waarde aan, dat hun loon stijgt gedurende hun loopbaan. Zelfs als een berekening met de formule 1 zou aantonen, dat de huidige waarde van de loonsom over het hele leven het grootst is bij een dalende rij, dan nog verkiezen de werkers een stijgende rij. Er zijn allerlei verklaringen bedacht voor dit fenomeen. Bijvoorbeeld is een stijgend loon een vorm van gedwongen sparen: wat men nog niet heeft, kan niet worden uitgegeven. Een stijgend loon kan zelfvoldoening geven, wellicht omdat mensen vooral gevoelig zijn voor verschillen. En de ondernemingen bieden zelf graag stijgende lonen aan, omdat ze daarmee het verdienste motief aanspreken. Immers iemand die loonstijgingen verwacht, zal zich inspannen om niet te worden ontslagen.

Helaas toont het betoog in deze paragraaf aan, dat de gedrags-economie nauwelijks beschikt over algemeen geldige modellen. Zij biedt slechts in enkele gevallen een bruikbaar alternatief voor de theorie van intertemporele discontering met δn. De gedrags-economie ontleent haar grootste kracht aan het mensbeeld, dat zij schetst. De mens is niet een rationeel rekenende homo economicus, maar een enigszins impulsief wezen met allerlei emotionele neigingen. Zij roept terecht de vraag op in hoeverre het zin heeft om te proberen het menselijke handelen te verklaren op louter rationele gronden. Men kan beter géén model hebben dan een wereldvreemd model, zelfs wanneer dat laatste een mathematisch kunstwerk is.


Intertemporeel disconto van ervaringen

De formule 2 maakt de gewaagde veronderstelling, dat het totale nut U een som is van afzonderlijke nutten u(c(n)) in de N perioden. Dit impliceert dat het nut u(c(n)) in de periode n onafhankelijk is van het nut u(c(m)) in de vroegere periode m. Echter de gedrags-economie vestigt er de aandacht op, dat mensen neigen tot gewenning aan een zeker niveau van welvaart16. Zij gebruiken de consumptie c(m) als een referentie voor hun tevredenheid over de latere consumptie c(n). Wegens dit effect is er een intertemporele afhankelijkheid tussen de nutten u(c(n)). De Nederlandse econoom B.M.S. van Praag heeft de afhankelijkheid onderzocht, zowel theoretisch als empirisch. De huidige paragraaf is gebaseerd op zijn bevindingen17.

Van Praag onderzoekt het nut (ook wel tevredenheid genoemd) u(y(0)) ten gevolge van een inkomen y(0) in de periode n=0. Dit nut is mede afhankelijk van de situatie van het huishouden, zoals het aantal gezinsleden, de leeftijd, het beroep enzovoort. De situatie wordt vastgelegd in grootheden x1, x2, ..., kortom in een vector x. Evenwel is het nut op n=0 tevens afhankelijk van de inkomens y(n) in de voorgaande perioden (n=-1, -2, ...). Bovendien neemt Van Praag aan dat het nut op n=0 mede wordt bepaald door de inkomens y(n), die het huishouden verwacht in de toekomst (n=1, 2, ...). De lezer zij gewaarschuwd dat dit afwijkt van de formule 2. Van Praag analyseert niet het geaggregeerde nut U van een tijdreeks, maar de invloed die de tijdreeks heeft op het nut u(y(0)) in één periode n=0! Hij wil nagaan hoe realistisch de abstracties zijn, die ten grondslag liggen aan de discontering van nut met de formule 2.

Stel het huishouden h moet het nut beoordelen van een inkomen c(0) in de periode n=0. Van Praag modelleert deze nuts afweging met behulp van de formule

(14)     uh(c(0)) = αc × Σn=-NN ωh(n) × ln(yh(n)) + Σk=1K βc,k × ln(xk,h) + γc + εc,h

In de formule 14 zijn αc, βc,k en wh(n) constanten, die kenmerkend zijn voor het inkomen c(0). De ωh(n) wegen het belang van de periode n af, en zijn typisch voor inkomens aangelegenheden. De grenzen -N en +N van de sommatie over N liggen in beginsel in het oneindige. Het model biedt ruimte aan K concrete factoren, die de situatie van het huishouden vastleggen in de periode n=0. De term γc is een restterm om de overige factoren van de situatie te modelleren. De term εc,h is een toevals variabele, die modelleert in hoeverre de afwegingen van het huishouden afwijken van de maatschappelijke norm, zoals die is verwoord in de voorgaande termen van de formule 14. Lezers die behoefte hebben aan meer uitleg kunnen de voorgaande column over de schaling van geldnut naslaan.

De formule 14 is fascinerend - net zoals overigens vele andere vondsten in het werk van Van Praag. Namelijk, zij kan worden gebruikt om grootschalige enquêtes onder huishoudens te analyseren, en daaruit de maatschappelijke gemiddelden α, βk en ω(n) te berekenen. Men kan ln(y(n)) opvatten als het ondervonden of verwachte nut u(y(n)) van een inkomen in periode n. Deze termen modelleren zowel leer effecten als eventuele voorkeuren voor het verloop van tijdsrijen. Evenzo modelleert het nut ln(xk,h) de invloed van allerlei maatschappelijke situaties op de voorkeuren, die geheel worden genegeerd in de formule 2. De macro-economie krijgt werkelijk een micro-economische grondslag18.

Figuur van tijdsfocus en tijdsspanne versus leeftijd
Figuur 4: Tijds-focus en -spanne versus τ

Van Praag concentreert zijn analyse verder op de ωh(n), die een disconto zijn van het ervaren of verwachte nut. Echter de discontering betreft de intensiteit waarmee dat nut in het geheugen zit, en niet het verlies in waarde door de verplaatsing in de tijd (zoals een uitstel)! Dit onderscheidt de gewichtsfuncties ωh(n) principieel van de disconto functies D(n). Wel wordt er verondersteld, dat ook ωh(n) afneemt in grootte, naarmate n meer in het verleden of in de toekomst ligt. De onmiddelijke ervaringen en verwachtingen domineren bij het afwegen van de nuts alternatieven uh(c(0)) 19. Gewoonlijk neemt men aan dat ω(n) gelijk is voor alle huishoudens. Echter Van Praag onderscheidt de weegfuncties naar de leeftijd τ van de voornaamste kostwinner, waardoor zij de gedaante ωτ(n) krijgen.

Van Praag heeft altijd een voorliefde gehad voor de normale kansverdeling, en hij kiest die ook om de verdeling van ωτ(n) over de periodes n te modelleren. Dat wil zeggen, ωτ(n) heeft de normale verdeling N(n; μτ, στ), waarin μτ het gemiddelde is van de verdeling, en στ de standaard afwijking. Deze keuze is inderdaad enigszins subjectief, want de gedaante van het afnemende geheugen is niet precies bekend (evenmin als de disconto functies D(n), die zonet zijn behandeld in deze column)20. De twee parameters μτ en στ worden bepaald door een statistische analyse van gegevens, in dit geval uit het German socio-economic panel survey (afgekort GSOEP). Van Praag veronderstelt, dat zij polynomen van de tweede graad zijn in τ. Hij noemt μτ de tijdsfocus van de kostwinner, en στ diens tijdsspanne. De tijdsspanne meet wanneer ervaringen of verwachtingen uit beeld verdwijnen. Bij een kleine στ leeft men in het moment.

De deelnemers aan het GSOEP onderzoek hebben in 1997 de inkomens evaluatie vraag beantwoord. Dat wil zeggen, zij hebben hun nuts oordeel gegeven over zes inkomens c. Van Praag neemt 1997 als de periode n=0, en beschikt dankzij GSOEP over voldoende gegevens om in de formule 14 te sommeren van n=-5 tot n=3 (de jaren 1992 tot en met 2000). Via xk,h brengt Van Praag onder andere de gezinsomvang in rekening voor het hele tijdsinterval, alsmede dus de leeftijd τ van de kostwinner voor n=0. De figuur 4 laat zien, hoe de tijdsfocus μτ en de tijdsspanne στ veranderen als functie van de leeftijd τ. De uitkomst is werkelijk aardig. Mensen op middelbare leeftijd blijken in het moment te leven. En hun tijds focus is licht toekomst georiënteerd. Daar en tegen laten jongeren en bejaarden zich juist leiden door het verleden (wegens μτ < 0). En zij laten hun oordeel sterk bepalen door het verleden en door toekomstverwachtingen21.

In ieder geval toont de analyse van de GSOEP gegevens, dat het nut u(c(0)) van een hedendaags inkomen c(0) mede wordt bepaald door de inkomens y(n) in het verleden en in de toekomst. Kennelijk is de formule 2 niet bijster realistisch. Anderzijds, als men haar opgeeft, dan verliezen ook belangrijke vondsten zoals het OLG model hun grondslag.

  1. Deze formule is zeer bekend. Zij laat zien dat met het verstrijken van de tijd een som geld p0 zeer snel kan aangroeien, met name door het verschijnsel van rente op rente. Men kan een uitleg vinden in elk inleidend boek over financiën. Een aardige keuze is Managerial economics (1992, MacMillan Publishing Company) van P. Keat en P.K.Y. Young, met name hoofdstuk 14. Wie echt diep wil duiken in de materie, kan terecht in A concise introduction to engineering economics (Unwin Hyman, 1988) van P. Cassimatis. Uw columnist las beide boeken al weer twintig jaren terug, toen hij nog een loopbaan als bedrijfskundig ingenieur overwoog. (terug)
  2. Zie bijvoorbeeld p.766 in het standaard leerboek Microeconomic theory (1995, Oxford University Press) van A. Mas-Colell, M.D. Whinston, en J.R. Green. De definitie is daar iets anders dan die in de huidige column, omdat de auteurs hun theorie formuleren in termen van de al genoemde wiskundige verzamelingen. (terug)
  3. In de theorie van productie verzamelingen is het gebruikelijk om ook de factor arbeid op te nemen in de formule 3a. Immers elk huishouden h kan beschikken over zijn eigen arbeid, zeg ter grootte lh(n). In de periode n zal het huishouden h alle beschikbare arbeidstijd lh(n) doorbrengen op de werkplek, in het productie proces. Uiteraard "produceert" geen enkele periode nieuwe arbeid. Daarom is de arbeids component in ζ altijd negatief, te weten -Σh=1H lh(n). (terug)
  4. Wellicht lijkt het alsof de formule 3b geen rekening houdt met de productie kosten. Echter zij verrekent die wel degelijk. Met name is de verbruikte arbeid een component in de vector η(n), met als de corresponderende prijs het arbeidsloon. Aangezien de arbeids component in η negatief is, wordt zij bij het inproduct in mindering gebracht als loonsom. (terug)
  5. In voorgaande voetnoten is reeds opgemerkt, dat wh(n) een arbeids component bevat. Elk huishouden beschikt over zijn eigen arbeid. Aldus omvat de meest rechtse term in de formule 3c tevens het inkomen uit loon. (terug)
  6. Zie p.736 en p.769 in Microeconomic theory voor de dynastie interpretatie. Het belang van generatie modellen wordt genoemd op p.769. Overigens is voor uw columnist onduidelijk waarom een dynastie een voorkeur zou hebben voor onmiddelijke bevrediging. Tinbergen heeft in zijn dynastie model de disconto functie weggelaten. (terug)
  7. Deze paragraaf is vooral gebaseerd op hoofdstuk 14 in Economic dynamics (Cambridge University Press, 1997) van R. Shone. Het OLG model wordt beknopt eveneens uitgelegd in Wachstum und Außenhandel (Physica-Verlag, 1999) van K. Farmer en R. Wendner. Het aardige van de uitleg in het laatste boek is dat het OLG model er wordt gecombineerd met het productie model van Solow. (terug)
  8. Uw columnist vindt deze aanname ietwat problematisch. Het lijkt er op dat Shone hier de consumenten markt loskoppelt van de markten van arbeids factoren. Echter dat zou de evenwichts analyse partieel maken. Dat zou verdoezelen, dat de keuzen van de consumerende huishoudens gevolgen hebben voor de productieve sfeer. Bijvoorbeeld omvat de nuts afweging van de huishoudens ook de hoeveelheid arbeidskracht, die zij willen aanbieden. En dat aanbod hangt weer af van het loonpeil. Daarom wordt op p.48 in Wachstum und Außenhandel verondersteld, dat de huishoudens simpelweg al hun arbeidskracht aanwenden in de productie. Dat is nogal een krasse abstractie. (terug)
  9. Zie p.502 in Economic dynamics. (terug)
  10. Uw columnist neemt aan dat de trouwe lezer van de Gazet dit intussen herkent. Op de isonuts curve geldt er dUh(n) = 0. Met andere woorden, (∂Uh(n) / ∂cwh(n)) × dcwh(n) + (∂Uh(n) / ∂cph(n+1)) × dcph(n+1) = 0. Hieruit berekent men de dcph(n+1) / dcwh(n) van de formule 7. Deze helling is tevens de helling -1/ρ(n) van de raaklijn. (terug)
  11. Op p.504 in Economic dynamics wordt een groei van de werkende bevolking toegelaten, middels de formule H(n+1) = (1 + g) × H(n). Hierin is g de constante groeivoet. Dat maakt het model wat veelzijdiger, maar draagt niet wezenlijk bij aan het inzicht. Daarom laat uw columnist deze verrijking achterwege. (terug)
  12. Namelijk de markt ruiming vereist cw(n+1) = ww + wp − cp(n+1). Elimineer ρ(n) uit de formule 6 met behulp van de formule 9, dan is het resultaat cp(n+1) = wp × cw(n) × δ / (cw(n) × (1 + δ) − ww). Substitueer deze formule in de uitdrukking voor markt ruiming, dan is het resultaat cw(n+1) = ww + (cw(n) − ww) / (cw(n) × (1 + δ) − ww). Dit is juist wat was te bewijzen. (terug)
  13. Voor alle volledigheid: met ρ=1 wordt de formule 6 cw(n) + cp(n+1) = ww + wp. Schrijf de formule 12 als cw(n+1) + cp(n+1) = ww + wp. De beide identiteiten zijn verenigbaar, mits er geldt cw(n+1) = cw(n). (terug)
  14. Vanuit didactisch oogpunt zou dit betoog moeten worden verhelderd met een figuur. Echter uw columnist wil de omvang van de column binnen grenzen houden. Des gewenst kan de lezer zelf de functie cw(n+1) = f(cw(n)) uittekenen. Blijkens de formule 13 is ∂cw(n+1) / ∂cw(n) = ∂f/∂cw(n) = δ × ww × wp / ((1+δ) × cw(n) − ww)². Deze formule bewijst dat f in afnemende mate stijgt. Vóór het eerste snijpunt of na het tweede snijpunt is cw(n+1) kleiner dan cw(n). Dat wil zeggen, cw neemt dan dynamisch af met stijgende n. Ook dit laat zien dat het eerste snijpunt instabiel is en het tweede stabiel. (terug)
  15. De huidige tekst is met name gebaseerd op An introduction to behavioral economics (Palgrave Macmillan, 2008) van N. Wilkinson en Behavioral economics (Springer Gabler, 2014) van H. Beck. (terug)
  16. Zie p.237 in An introduction to behavioral economics. (terug)
  17. Zie hoofdstuk 7 in het toonaangevende boek Happiness quantified (Oxford University Press, 2008) van B.M.S. van Praag en A. Ferrer-i-Carbonell. Van Praag presenteert zich als een representant van de geluks-economie. Zij wordt gekenmerkt door het uitvoeren van grootschalige enquêtes en hun statistische analyse. Toch had Van Praag wellicht beter aansluiting kunnen zoeken bij de gedrags-economie. Want helaas raakt de geluks-economie als wetenschap enigszins in discrediet, doordat haar vondsten worden gemanipuleerd en misbruikt door politici, die er hun eigen voorkeuren mee willen rechtvaardigen. Aldus loopt Van Praag nodeloos het risico dat zijn werk wordt overzien. Merk voorts op, dat de geluks-economie haar eigen vocabulaire heeft, met termen zoals tevredenheid (in plaats van nut) en inkomen (in plaats van consumptie). Ook dat draagt niet bij aan de verspreiding. (terug)
  18. De kwetsbaarheid van de nuts analyse met behulp van de formule 14 is vooral gelegen in de practische toepassing. Immers het is welhaast onmogelijk om te bepalen welke situationele factoren xk,h relevant zijn bij de nuts afweging in de periode n=0. De keuze van de K factoren is vatbaar voor willekeur. Bovendien zullen er altijd correlaties bestaan tussen de diverse factoren, met als gevolg een vertroebeling van de analyse. Dit probleem is des te klemmender, omdat de situationele factoren slechts weinig invloed hebben in vergelijking met de eigenaardigheden van het huishouden h (zoals gemeten in εc,h). Men heeft enorme hoeveelheden empirische gegevens nodig om de gemiddelde invloed van xk te schatten. Daarnaast blijkt een deel van de gegevens dermate extreem te zijn, dat zij het model verstoren. Op p.150 vertelt Van Praag, dat hij 10% van de GSOEP gegevens moest weglaten uit zijn analyse. Hij noemt deze aanpak een robuuste regressie. Aldus hebben voorlopig de statische uitkomsten in het werk van Van Praag niet bijster veel betekenis. Voor alsnog hebben zijn modellen vooral gezag, doordat zij de lacunes van de economische hoofdstroom aanwijzen, alsmede manieren om die in te vullen. (terug)
  19. Al verschillen dan ωh(n) en D(n) principieel, toch zou er enige samenhang kunnen zijn in de practijk. Bijvoorbeeld kan men zich afvragen, in hoeverre bij de nuts aggregatie van de formule 2 de bijdragen in de verre toekomst worden genegeerd, niet omdat hun waarde neerwaarts wordt gedisconteerd, maar simpelweg omdat zij worden verdrongen uit het geheugen. Zie ook de beschouwingen van de Leninistische econoom Val'tuch in de column over het cardinale grensnut. (terug)
  20. Zie p.144 en verder in Happiness quantified voor de discussie van dit probleem. (terug)
  21. Men kan eindeloos speculeren over de oorzaken. Wellicht geloven jongeren nog naïef dat hun waarden universeel zijn. En bejaarden neigen tot verstarren. Anderzijds impliceert de symmetrie in de normale kansverdeling, dat bejaarden toch ook worden gemotiveerd door toekomst verwachtingen. Dat lijkt stug. Wellicht levert een model met een asymmetrische verdeling van ωτ(n) betere resultaten. Van Praag is er niet aan toegekomen. (terug)