Lange tijd heeft men gemeend dat een hiërarchie uitstekend geschikt is om een beleid uit te voeren. Echter het beslisser-uitvoerder (principal-agent) model heeft twijfels gezaaid over dit geloof. De huidige column geeft een uitgebreide uitleg van het model, dat heeft geleid tot een herwaardering voor marktwerking, ook in de publieke sector. De gedragseconomie draagt enkele verbeteringen aan. Tenslotte wordt het wiskundige model in detail beschreven, althans voor het geval van de onzichtbare inspanning bij de uitvoerder.
Als men veronderstelt dat elke individu in beginsel volledig vrij is om over zichzelf te beschikken, dan dringt de vraag zich op, waarom mensen nochtans zich onderwerpen aan een extern gezag. De socioloog J.S. Coleman geeft een begin van een antwoord in zijn boek Foundations of social theory1. De rest van deze paragraaf is vooral gebaseerd op zijn bevindingen. Coleman stelt de onderwerping aan een gezag voor als een wederzijdse ruil. Deze ruil heeft overeenkomsten met de ruil op een commerciële markt, maar er kan geen prijs worden gekoppeld aan de onderwerping. Daarom spreekt Coleman van een maatschappelijke ruil. De onderwerping aan een gezag staat gelijk met het opgeven van een aantal rechten, die in beginsel een individueel eigendom zijn. Zij maken deel uit van de oorspronkelijke middelen en rijkdom van die individu. De individu zal die middelen enkel opgeven, indien hij of zij er iets voor terug krijgt.
Degene die zich onderwerpt, wordt de uitvoerder genoemd (in de Engelse taal de agent). Degene die gezag krijgt, noemt men de beslisser (in het Engels de principal). Coleman beschouwt de ruil zowel vanuit de positie van de uitvoerder als van de beslisser. In het simpelste geval wordt iemand een uitvoerder, simpelweg omdat ter compensatie een materiële beloning wordt aangeboden. Die compensatie is nodig, omdat de uitvoerder onvoldoende intrinsiek is gemotiveerd voor de bezigheden, die hij moet verrichten. Coleman duidt deze situatie aan als een los gezag (in de Engelse taal disjoint), omdat de belangen van de uitvoerder en zijn beslisser niet natuurlijk samenvallen. In vele opzichten zijn hun belangen zelfs tegengesteld, soms dermate dat zij een latent maatschappijk conflict veroorzaken, zoals de marxistische klassenstrijd (zie p.81). Maar in ieder geval zorgt de ruil dat de existentie van de uitvoerder min of meer is gegarandeerd.
Vervolgens constateert Coleman, dat de beslisser baat heeft bij de ruil, omdat het gezag hem toegang geeft tot de inspanningen en vaardigheden van de uitvoerder. Deze observatie maakt duidelijk, dat er nog een tweede gezagsverhouding denkbaar is dan de dienstbetrekking. Namelijk, een groep individuen kan besluiten om zich te onderwerpen aan het gezag van een uiterst capabele persoon. Dan verwacht de groep dat deze groepsvertegenwoordiger hun belangen beter kan verdedigen dan elk groepslid zelf zou kunnen. Coleman noemt dit een unilaterale ruil, omdat de groepsleden niets terug krijgen voor het afstaan van hun rechten, behalve de hoop op een betere belangenbehartiging. Merkwaardiger wijze zijn de groepsleden in dit geval toch de beslisser, omdat zij het ultieme recht behouden hun vertegenwoordiger te ontslaan. De vertegenwoordiger is de uitvoerder.
Het meest bekende voorbeeld van de unilaterale ruil is de verkiezing van een democratisch parlement. Dan blijft het volk weliswaar de hoogste soeverein, maar het besteedt zijn bestuur uit aan de beroepspolitici. Coleman betitelt deze situatie als een verenigd gezag (in de Engelse taal conjoint). Bovendien illustreert dit voorbeeld de terugkoppeling in het maatschappelijke systeem. Immers de politici benoemen een bestuur, dat vervolgens burgers in dienst neemt om zijn beleid uit te voeren. De burgers, die eerst als beslisser de politici in functie brengen, worden daarmee de uitvoerders van de politici. Inderdaad moet in de visie van Coleman het gedrag van het maatschappelijke systeem worden verklaard uit het individuele gedrag op het micro-niveau (in dit geval de verkiezingen en sollicitaties)2.
Gewoonlijk breekt de uitoefening van een gezag in op de belangen van sommige individuen. Daarom moet gezag altijd kunnen terugvallen op de één of andere macht. In de politiek begint de macht, doordat burgers zich identificeren met de leiders, en zij eindigt bij de maatschappelijke wet- en regelgeving (sancties). Coleman onderstreept het belang van toewijding (zie p.76, alsmede p.157 en verder), dat ook in het maatschappelijke model van de Nederlandse econoom Frijters prominent aanwezig is. Zij ontstaat uit de persoonlijke psychologie. Gewoonlijk echter baseert de macht toch op het maatschappelijke contract, dat de burgers rationeel afsluiten als een zelfverplichting. Daarna zijn er maar twee exit opties: het bestuur kan worden afgezet door de kiezers, of de individu kan emigreren. Macht is een fenomeen op het macro-niveau, omdat zij uitdrukt in hoeverre een belang zich kan doen gelden in het maatschappelijke systeem (p.133).
Het beslisser-uitvoerder model is bedacht ten einde de effectiviteit van het gezag te bestuderen. Immers gewoonlijk vallen de belangen van de uitvoerder en van de beslisser niet geheel samen. Dan staat de beslisser voor het probleem hoe de uitvoerder optimaal kan worden gemotiveerd. Daarbij wordt de beslisser gehinderd door twee factoren. Ten eerste is de toekomst onzeker, voor zover de ontwikkelingen zich onttrekken aan zijn gezag. Dat maakt de resultaten van de aansturing enigszins onvoorspelbaar. En ten tweede beschikt de uitvoerder over informatie, die verborgen blijft voor de beslisser. De informatie is asymmetrisch verdeeld. Dat geeft een deskundigheidsmacht aan de uitvoerder, die hij kan gebruiken ten eigen bate. Economen zijn pas echt goed gaan nadenken over deze materie in de zeventiger jaren, toen duidelijk werd dat de economische planvorming door de staat niet de verwachte positieve resultaten oplevert.
Indertijd is duidelijk geworden, dat de staat niet kan worden beschouwd als een neutraal orgaan in handen van het soevereine volk3. En dat heeft serieuze consequenties voor de deugdelijkheid van de diverse politieke doctrines. Met name staat men nu kritischer ten opzichte van allerlei staatsinterventies. In vele gevallen heeft bij nader inzien toch de marktwerking de voorkeur. Allereerst kan het politieke bestuur verworden tot een autocratie, die haar beleid ontwikkelt met het oog op haar eigen belangen. Ten tweede kunnen ook de ambtelijke organen, die het politieke beleid moeten uitvoeren, hun eigen belangen voor laten gaan. De wetenschap heeft het traditionele beeld van de ambtelijke dienstbaarheid en ethiek vervangen door een model, waarin ook de ambtenaren handelen als egoïsten. De producent in de staatssector kent dezelfde driften als de producent op de particuliere markt4.
Al rond 1960 ontwikkelt de zogenaamde Public choice school een theorie, waarin het opportunisme van de staatsdienaren wordt benadrukt. Politici en ambtenaren proberen het economische systeem zodanig in te richten, dat zij er zelf een maximale pacht of rente aan kunnen onttrekken. Dat ondermijnt de doelen, die het volk als soevereine beslisser heeft gedicteerd aan deze twee uitvoerende lagen5. Uiteraard bestonden er al eerder twijfels over de goede intenties van de staat, maar zij zijn werkelijk concreet geworden in de laatste halve eeuw. Cusin en D. Benamouzig spreken in hun boek Économie et sociologie zelfs van een legitimiteits-crisis van de staat6. Daardoor moeten staatsgerichte ideologieën, zoals de sociaaldemocratie en het corporatisme, inboeten aan geloofwaardigheid7. Voortaan plaatst men bij voorkeur de staat weer op enige afstand van de economie, althans hij wordt zelf minder economisch actief.
In links-radicale kringen bestaat de neiging om de public choice theorie te betitelen als neoliberaal, wat denigrerend is bedoeld. Echter trouwe lezers herinneren zich hoe ook de voormalige marxisten W. Brus en K. Laski het beslisser-uitvoerder model gebruiken, en wel om het falen van de Leninistische planning te analyseren8. Deze auteurs stellen, dat in een Leninistisch systeem alle bewindvoerders van de ondernemingen in staatsdienst zijn, zodat zij bezien vanuit het beslisser-uitvoerder probleem de rol van ondergeschikten spelen. Zij kunnen hun bedrijfsrisico's altijd afwentelen op de staat, en dat is een perverse prikkel en dus een moreel risico (in de Engelse taal een moral hazard). Volgens het minimax principe proberen de bedrijven om de planopdracht te verlagen, en de toewijzing van productiefactoren op te drijven. Dat maakt de productiekosten onbeheersbaar. Aldus geldt de Leninistische planning zelfs als een schoolvoorbeeld van het beslisser-uitvoerder probleem.
In het westen was de planvorming meestal indicatief, al wilde een halve eeuw terug de sociaaldemocratie juist meer staatsdwang uitoefenen9. Tegenwoordig menen Frijters en anderen zelfs, dat de particuliere markt behoort tot de krachtigste verdedigers van de democratie10. Naarmate dit inzicht terrein wint, wordt het vaker toegepast in democratische processen. Ook de uitvoering van het politieke beleid wordt gemoderniseerd, een evolutie die nog volop aan de gang is. Op p.366 in Économie et sociologie wordt dit new public management genoemd. Zo mogelijk wordt de particuliere sector ingeschakeld om het beleid uit te voeren. Op een mondiale markt zijn de ondernemingen dermate groot, dat zij enorme investeringen kunnen doen, bijvoorbeeld om infrastructuur aan te leggen en daarna zelf te exploiteren. De hiërarchie wordt vervangen door contracten. Wel blijft de staat risico's afdekken, die te groot zijn voor de burgers of voor de ondernemingen (p.370)11.
Het zal duidelijk zijn waarom in de laatste decennia er een voorkeur is gegroeid om ook de publieke diensten aan te bieden via de particuliere markt. Immers op een vrije markt moet de aanbieder concurreren met andere aanbieders om de gunst van de consument en klant. Dan prijzen aanbieders, die proberen om zichzelf een meerwaarde toe te eigenen op kosten van de consument, zich eenvoudig uit de markt. Aldus zorgt marktwerking, dat de publieke diensten efficiënter, goedkoper en kwalitatief beter worden verzorgd. Daarmee is allerminst beweerd, dat in het bedrijfsleven het beslisser-uitvoerder probleem afwezig is. Echter het blijft begrensd dankzij de tucht van de markt.
Het aardige is nu, dat het beslisser-uitvoerder model niet louter een kwalitatief betoog is. Het heeft de aanzet gegeven tot de ontwikkeling van de zogenaamde contract theorieën. In zulke theorieën wordt daadwerkelijk kwantitatief doorgerekend, hoe de beslisser op de meest effectieve manier zijn uitvoerder kan aansturen. Uiteraard is dit in beginsel een gigantisch werkterrein. Echter de aandacht wordt geconcentreerd op twee problemen, die zonet al even zijn genoemd. Ten eerste heeft de beslisser soms meer kennis over de doelmatigheid van de activiteiten dan de uitvoerder. Ook dit is een vorm van asymmetrische informatie. De beslisser kan zijn kennisoverwicht gebruiken om de uitvoerder te manipuleren. Anderzijds weet de uitvoerder beter dan de beslisser hoeveel inspanning er wordt verricht bij de activiteiten. In dit geval kan de uitvoerder zijn eigen inkomen verhogen door de inspanningen te overdrijven.
Allebei deze manipulaties zijn intensief bestudeerd. Echter de huidige column beperkt zich tot het laatste probleem, van de sjacherende uitvoerder.
Hoewel het beslisser-uitvoerder model een beschrijving geeft van allerlei gecompliceerd groepsgedrag, hanteert het gewoon het mensbeeld van de rationele, egoïstische homo economicus. Dien ten gevolge onderzoeken de contract theorieën vooral de materiële prikkels, het zogenaamde verdienste motief. Echter sinds enkele decennia hebben de gelukseconomie en de gedragseconomie aangetoond, dat in vele gevallen de mensen zich irrationeel gedragen. Daarom zet vooral de gedragseconomie kritische kanttekeningen bij het beslisser-uitvoerder model, althans in zijn standaard gedaante. De huidige paragraaf geeft hiervan een beknopte uiteenzetting. Er moet al direct worden aangetekend, dat het beslisser-uitvoerder model niet fundamenteel in twijfel wordt getrokken. Wel wordt het genuanceerd, of verfijnd.
De Amerikaanse econoom N. Wilkinson geeft in An introduction to behavioral economics een aardig voorbeeld van de werking van het beslisser-uitvoerder model12. Het betreft een onderneming, die zijn vertegenwoordiger wil aanzetten tot een maximale verkoopinspanning. Stel dat de verkoper een inspanning e levert (van het Engelse woord effort), met waarden tussen 1 en 10. Hij ervaart die inspanning als een last. Neem in de voetsporen van Sam de Wolff aan, dat zijn onlust kwadratisch in e is:
(1) c(e) = ¼ × (e − 1)²
In de formule 1 wordt de onlust voorgesteld door een geldbedrag c. De verkoper ontvangt een arbeidsloon w van de ondernemer, en moet daarom minimaal e=1 voortbrengen. Het (geld-)nut van de verkoper is u = w − c. De ondernemer verdient per geleverde eenheid van e een bedrag pe = 10.
Zowel de ondernemer (beslisser) als de verkoper (uitvoerder) proberen om hun nut maximaal te maken. Voor ondernemers wordt dat streven gewoonlijk versimpeld tot de winstmaximalisatie. Als in de economie alle informatie volledig beschikbaar zou zijn, dan zou de onderneming haar verkoper belonen volgens hoogstens diens grensproduct. Zij kan een werker niet meer betalen dan zijn productiewaarde. Het grensproduct is in dit geval constant, te weten pe = 10. De marginale kosten voor de verkoper zijn ∂c/∂e = ½×(e − 1), dus stijgend met e. Zelfs voor de maximale inspanning e=10 is ∂c/∂e slechts 4.5. Kennelijk hebben zowel de onderneming als de verkoper er baat bij om de maximale inspanning te leveren. Dan incasseert de onderneming een opbrengst ter grootte van 100, en de verkoper heeft een onlust van 81/4, dus ruwweg van 20. Het loon w wordt bepaald door onderhandelingen, en moet liggen tussen 81/4 en 100, opdat het nut u niet negatief is.
Echter de situatie verandert, zodra de onderneming niet meer de inspanning e kan verifiëren. Immers dan komt de verkoper in de verleiding om zijn loon van minimaal 81/4 te incasseren, en een inspanning van bijvoorbeeld slechts e=1 te leveren. Hij ervaart dan geen enkele onlust, terwijl anderzijds de onderneming verlies zou lijden. De Engelse vakuitdrukking voor dit lijntrekken is shirking. Men zou denken dat de onderneming aan haar opbrengst kan zien hoe groot e is. Echter het beslisser-uitvoerder model gaat uit van een dynamische economie. De marktprocessen veroorzaken schommelingen in zowel de prijs pe als de afzet, zelfs indien de verkoop inspanning e overigens niet wijzigt. Daardoor is de opbrengst toch geen betrouwbare maat van e. Dien ten gevolge moet de onderneming proberen om de verkoper te motiveren tot een optimale inspanning. Motivatie kan verlopen via toezicht en dwang, of via prestatie beloningen.
Voor de situatie met toezicht en dwang veronderstelt Wilkinson dat daarmee kosten ter grootte K gepaard gaan. Vooral als een grote inspanning e is vereist, zal dat toezicht complex zijn. Dus K(e) zal een stijgend verloop hebben, bijvoorbeeld K(e) = 17/12 × (e − 1)². Aldus wordt bij dwang de winst π van de onderneming gegeven door
(2) π = 10×e − w − K
De maximalisatie van de winst vereist dat geldt ∂π/∂e = 0. Men berekent hieruit direct, dat de maximale winst wordt behaald bij ec=4. De verkoper wordt contractueel verplicht om deze inspanning ec te leveren. Blijkens de formule 1 is dan zijn onlust c=9/4. De ondernemer zal het loon w=c aanbieden, omdat dan de onlust juist is gecompenseerd (u=0).
Een gebruikelijke manier om de inspanning ec af te dwingen is de bestraffing met een boete F, in geval het doel niet wordt gehaald13. Als de geleverde prestatie lager is dan ec, dan wordt het loon van de verkoper gekort met een boete F. De boete moet zorgen, dat het lijntrekken in geen geval zal lonen. In het ergste geval zou de verkoper kiezen voor e=1, waarvoor geldt c=0. Dat maakt zijn nut gelijk aan u=w. De boete moet dit nut negatief maken, middels u = (w − F) <0. Dat kan bijvoorbeeld met behulp van F=2.5. Aldus is het contract voltooid. Evenwel ziet men dat de asymmetrische informatie een funeste invloed heeft op de welstand van zowel de onderneming als de verkoper. Terwijl bij volledige informatie de winst maximaal ongeveer 80 kan zijn, is hij hier slechts 40 − 9/4 − 51/4 = 25. Uiteraard perkt dit tevens de potentiële loonruimte in.
Beschouw nu de alternatieve vorm van motivatie. Voor de situatie met een prestatie beloning veronderstelt Wilkinson, dat de onderneming een extra bonus b belooft aan de verkoper. Het nut van de verkoper wordt u = w + b − c, en de onderneming behaalt een winst
(3) π = 10×e − w − b
De onderneming hoopt dat de verkoper vriendelijk wordt gestemd door de bonus, en uit erkentelijkheid zijn maximale inspanning zal leveren. Dit is het principe van de wederkerigheid. In een eerdere column is w+b het efficiëntie loon genoemd, omdat het contract er zelfdragend door wordt. Echter dit past niet in het gebruikelijke economische mensbeeld. Immers de homo economicus kent geen erkentelijkheid, en zal zoveel mogelijk lijntrekken. Bovendien faalt deze vorm van motivatie, doordat volgens het contract de bonus pas wordt uitbetaald na afloop van de prestatie. De verkoper zal nu geloven, dat de ondernemer zijn belofte niet zal nakomen. Immers ook die is een homo economicus, die geen erkentelijkheid kent. Aldus zal de verkoper toch kiezen voor e=1. De ondernemer beseft dit, en biedt aan w=0 en b=0. Het eindresultaat wordt u=0, en π=10. Het is nog slechter dan bij dwang.
Wilkinson houdt dit betoog om te illustreren dat het standaard economische model leidt tot onrealistische uitkomsten. Immers in de practijk hanteert het bedrijfsleven wel degelijk efficiëntie lonen. Wilkinson citeert ook nog uit een laboratorium studie, waarin blijkt dat de proefpersonen een duidelijke voorkeur hebben voor het aanbieden van contracten met een prestatie beloning in plaats van contracten met dwang. Zowel de onderneming als de verkoper bereiken dan een hogere welstand. De oorzaak zijn gevoelens van wederkerigheid, een goede arbeidsmoraal, en een afkeer van ongelijkheid. De homo economicus in het standaard model is simpelweg onrealistisch.
De Amerikaanse econoom E. Cartwright komt in Behavioral economics tot soortgelijke conclusies als Wilkinson14. De gedragseconomie leert, dat in beginsel mensen afkerig zijn van ongelijkheid. Zij wordt ervaren als een onrecht. Evenwel benadrukt Cartwright het belang van de intenties of bedoelingen, waardoor het individuele handelen wordt gedreven. Het blijkt dat individuen positiever staan jegens ongelijkheid, indien zij onvermijdelijk is of normaal. Dus men heeft weinig aversie jegens een ondernemer, die noodgedwongen de lonen moet verlagen, of zijn productprijzen moet verhogen. Nu valt het niet mee om mensen er van te overtuigen, dat een maatregel onvermijdelijk is. Daarom neigen ondernemers tot terughoudendheid bij het verlagen van lonen of bij het verhogen van hun prijzen. Cartwright ziet hierin een verklaring voor de welbekende starheid van het loon- en prijspeil15.
Omgekeerd stelt ook Cartwright, dat het uitkeren van bonussen een stimulerend effect heeft op de prestaties van werkers (uitvoerders). Ook het betalen van een structureel hoger loon dan vergelijkbare bedrijven is een prestatie prikkel. Cartwright citeert allerlei laboratium experimenten, die dit bevestigen. Helaas treedt in allebei de situaties het verschijnsel van de drijvende voorkeuren op, waarmee de uitvoerders gewend raken aan de bonus of het hogere loon. Dan kunnen zij enkel opnieuw worden gemotiveerd door de bonus of het loon verder te verhogen. Des ondanks wordt deze vorm van motivatie veel toegepast.
Op zichzelf zijn dit soort kwalitatieve redenaties over de motivatie van uitvoerders reeds lang bekend. Het aardige aan de gedragseconomie is, dat zij probeert om kwantitatieve modellen van motivatie te ontwikkelen. Namelijk, daarmee kan men proberen om het effect van prestatie contracten concreet door te rekenen. Aldus verwijst Cartwright naar het wederkerigheids-model van Rabin, dat al in een voorgaande column is beschreven aan de hand van het boek van Wilkinson16. De nutsformule uit die column wordt hier herhaald, in iets gewijzigde vorm
(4) u(SA, SB, S'A) = XA(SA, SB) + α × f(SA, SB) × g(SB, S'A)
De formule 4 beschrijft een interactie tussen twee individuen A en B. Elk individu I (met I=A of B) hanteert een strategie SI, en realiseert daarmee een materiële uitkomst XI. De strategie S'A is de strategie, waarvan A denkt dat de individu B die van hem zal verwachten. De functie u is het nut, dat de individu A verkrijgt dankzij de transactie. De functie f is de altruïsme- of vriendelijkheids-functie van A. De functie g is de door A verwachte altruïsme- of vriendelijkheids-functie van B. De functies zijn positief voor altruïstische individuen. De constante α drukt uit hoezeer de individu A geneigd is om te kiezen voor wederkerigheid. Een homo economicus mist die neiging, en heeft daarom α=0. Echter een werkelijk mens beleeft vreugde aan wederkerigheid (f), en wel meer naarmate zij wordt beantwoordt (g). Omgekeerd leidt een versmaad altruïsme (f>0, g<0) tot gevoelens van onvrede en afkeer.
De formule 4 is louter empirisch, en niet gebaseerd op diepgaande theorieën. Het is zonneklaar, dat A probeert om met de functies f en g de intenties van B te modelleren. Cartwright past nu de formule 4 toe op de situatie van een ondernemer B en zijn verkoper A. De verkoper staat voor de keuze of hij zijn niveau van inspanning zal verhogen met een hoeveelheid Δe. In de toestand L (laag) laat hij het na. In de toestand H (hoog) spant hij zich extra in, en zorgt daarmee voor een extra product-opbrengst ΔR. Echter die inspanning kost hem een extra onlust Δc. Het is logisch, dat A een bonus b wil krijgen voor zijn extra inspanning Δe. Cartwright vraagt zich af wat een billijke bonus zou zijn. Afhankelijk van het besluit van A krijgt de ondernemer B een extra opbrengst van 0 of ΔR. Er zit enige logica in om te stellen, dat A billijk handelt, indien hij het gemiddelde ΔR/2 van die twee uitersten produceert. Immers in de matigheid toont zich de meester.
Op die manier komt A tot de conclusie dat hij vriendelijk is, als hij de situatie H met de inspanning Δe verkiest. Immers dan krijgt B een extra opbrengst ΔR, en dat is ΔR/2 meer dan het billijke. Omgekeerd krijgt B geen extra opbrengst in situatie L, wat ΔR/2 minder is dan het billijke. Kennelijk zou de altruïsme functie kunnen worden voorgesteld door f = -ΔR/2 in de situatie L, en f=ΔR/2 in de situatie H. Uiteraard moet A in de situatie H een bonus krijgen, want hij levert de inspanning Δe. Het lijkt billijk dat de ondernemer B zijn extra opbrengst ΔR deelt met A, en aan hem ΔR/2 afstaat. Elke bonus b hoger dan ΔR/2 is vriendelijk van B. Kennelijk kan de vriendelijkheid van B worden afgemeten aan b − ΔR/2. Met andere woorden, de altruïsme functie van B zou kunnen worden voorgesteld door g = b − ΔR/2.
Nu kunnen de bevindingen van zonet worden ingevuld in de formule 4. Men vindt
(5a) u = b − α × ΔR/2 × (b − ΔR/2) in de situatie L, en
(5b) u = b − Δc + α × ΔR/2 × (b − ΔR/2) in de situatie H
Het stelsel 5a-b is fascinerend. Men ziet bijvoorbeeld hoe de keuze voor de situatie L een frustratie kost aan A, zo hij daarvoor een ruimhartige bonus ontvangt. Toch is een vriendelijke bonus b>ΔR/2 nog geen garantie, dat A altijd zal kiezen voor de situatie H. Immers A heeft de onlust Δc, die moet worden gecompenseerd. Men ziet aan de formule 5b, dat die compensatie pas optreedt, als geldt dat
(6) b > ΔR/2 + Δc / (α×ΔR)
Juist de onlust Δc veroorzaakt dat ΔR/2 toch geen billijke bonus is. In de situatie H kan de ondernemer B maximaal een bonus ter grootte b=ΔR betalen, en liever minder. Wegens de formule 6 heeft de eis b<ΔR tot gevolg, dat er moet gelden Δc < ½ × α × (ΔR)². Met andere woorden, zolang de onlust van A niet al te groot is, zal B bereid zijn om de bonus b te betalen, die de verkoper A motiveert tot de keuze voor de situatie H. Daarbij is ook de neiging tot wederkerigheid α van A cruciaal, een gegeven dat ongemerkt blijft in het standaard economische model, wegens zijn mensbeeld van homo economicus.
Nu het beslisser-uitvoerder model is voorzien van enkele nuanceringen vanuit de gedragseconomie, kan vervolgens het algemene model worden beschreven, zoals dat wordt gehanteerd in de standaard economische theorie. Het negeert het irrationele gedrag van zonet, zoals wederkerigheid of een afkeer van ongelijkheid. Wel houdt het model rekening met de menselijke neiging tot het mijden van risico's. Concreet betekent dit, dat individuen de voorkeur geven aan een geldsom gegarandeerd in handen boven een onzeker uitzicht op een wat grote geldsom. Sterker nog, deze eigenschap vormt de ruggegraat van het model. De huidige paragraaf baseert op de uitleg in het boek Microeconomic theory, waarbij regelmatig een vergelijking wordt gemaakt met de iets afwijkende behandeling in het boek Labor economics17. Deze vergelijking is grotendeels ondergebracht in de voetnoten.
Intussen weet de lezer, dat asymmetrische informatie zoals een onzichtbare en niet-verifieerbare inspanning leidt tot een moreel risico. De inspanning e van de uitvoerder wordt onzichtbaar voor de beslisser, wanneer die geen volledig toezicht kan uitoefenen18. Zonet is reeds uiteen gezet, dat de beslisser dan het arbeidscontract moet voorzien van prikkels voor een maximale inspanning. In de beschouwde situatie is opnieuw de beslisser een onderneming, terwijl de uitvoerder een verkoper is. Dit soort modellen is dynamisch, omdat de opbrengst van de onderneming afhankelijk is van marktgrillen. In Microeconomic theory wordt dit gemodelleerd door te veronderstellen, dat de winst π optreedt volgens een dichtheidsfunctie f(π|e). Dat wil zeggen, bij een gegeven inspanning e kan men de winst π verwachten met een kansdichtheid f 19. De mogelijke waarden van de winst bevinden zich in het interval [πmin, πmax].
Aldus wordt de kans dat de winst kleiner is dan π gegeven door de verdelingsfunctie
(7) F(π|e) = ∫πminπ f(χ|e) dχ
De figuur 3 schetst de dichtheids- en verdelingsfunctie voor twee inspanningen eL en eH. Zoals is gezegd introduceren dit soort modellen een risico in de winst π. Algemeen wordt in dit soort modellen verondersteld, dat de beslisser risico-neutraal is. Hij is dermate welvarend, dat de diverse risico's in zijn portfolio of beleggings-portefeuille elkaar ongeveer compenseren. In formule betekent dat ψ(E[π]) = E[ψ(π)], waarin ψ de nutsfunctie van de beslisser is. De functie E(x) meet de verwachte waarde van x (E van het Engelse woord expectation), en is gedefinieerd als
(8) E[π] = ∫πminπmax χ × f(χ|e) dχ
In de eerdere column over riskante inkomsten is aangetoond dat voor een risico-neutraal individu het geldnut ψ(π) evenredig is aan de geldsom π. Daarom is de winstmaximalisatie tevens de nutsmaximalisatie. Overigens zal de huidige definitie van de winst de enigszins ongebruikelijke aanname maken, dat die nog het arbeidsloon w van de uitvoerder bevat. In Microeconomic theory wordt ook nog aangenomen, dat de inspanning van de uitvoerder slechts twee waarden kan aannemen, te weten eL en eH, met eL<eH (Labor economics maakt deze vereenvoudiging niet).
De nutsfunctie van de verkoper is20
(9) u(e, w) = v(w) − c(e)
Deze nutsfunctie heeft een algemenere gedaante dan eerder in deze column. Het nut van het arbeidsloon w wordt gemeten door de nutsfunctie v(w), terwijl ook c(e) nu een echte nutsfunctie is (en niet de geldwaarde van nut, zoals voorheen). Ook de uitvoerder loopt een risico, omdat in beginsel zijn loon w(π) afhangt van de winst. Hij is niet per se risico-neutraal, omdat voor hem het loon zijn enige bron van inkomsten is. Zijn portfolio is niet divers. Uw columnist neemt voortaan aan, dat de uitvoerder risico-mijdend is. In dat geval moet v voldoen aan ∂v/∂w > 0 en ∂²v/∂w² < 0, dat wil zeggen, v verloopt concaaf. Stel voorts dat de uitvoerder naast het aangeboden contract beschikt over een alternatief, met een reserverings-nutsniveau U. Dan moet het contract voldoen aan de participatie voorwaarde E[u(e, w)] ≥ U. Men neemt gewoonlijk aan dat de uitvoerder het contract zelfs accepteert, als E[u] gelijk is aan U.
Het geval met een zichtbare inspanning
Beschouw eerst het hypothetische geval, waarin de inspanning zichtbaar zou zijn. Dan kan kennelijk de opstelling van het optimale contract voor de beslisser worden voorgesteld door de maximalisatie opgave
(10a) maximaliseer voor alle e en w: E[π − w(π)]
(10b) onder de participatie voorwaarde E[v] − c(e) ≥ U
Merk op dat in de formule 10b gebruik is gemaakt van de formule 9 en van E[c] = c. Het blijkt handig te zijn om eerst de optimale w(π) uit te kiezen, bij een nog nader te bepalen e. Dan verandert de maximalisatie van de formule 10a in de minimalisatie van E[w]. Dit soort problemen kan worden opgelost met de methode van Lagrange, met als resultaat21
(11) ∂v/∂w = 1/λ
In de formule 11 is λ een constante. Aangezien bij risico-mijding de afgeleide ∂v/∂w een dalende functie van w is (wegens ∂(∂v/∂w)/∂w <0), lost slechts één waarde van w de formule 11 op22. Kennelijk is w(e) onafhankelijk van de toevallige waarde van de winst π(e). De beslisser verzekert de uitvoerder als het ware volledig tegen de schommelingen in de winst. De beslisser wil niets te veel betalen aan de uitvoerder, en kiest in de voorwaarde 10b de benedengrens. Zij v-1 de inverse functie van v, dan is voor de beslisser het optimale loon gelijk aan w(e) = v-1(c(e) + U). Voorts is nu E[w]=w. Tenslotte moet de beslisser nog kiezen uit de twee situaties met inspanningen eL en eH. Kortom, de optimalisatie opgave 10a-b van de beslisser is versimpeld tot
(12) kies de grootste van E[π(eL)] − v-1(c(eL) + U) en E[π(eH)] − v-1(c(eH) + U)
Na deze uitstap keert de redenatie terug naar het geval met een onzichtbare inspanning. In tegenstelling tot het stelsel 10a-b kan de beslisser nu niet meer e direct voorschrijven. Hij kan slechts het loon w(π) minimaliseren. Wel vertelt het stelsel 10a-b hem, welke inspanning eo optimaal is voor hem. Dan kan hij het contract zodanig ontwerpen, dat het zijn uitvoerder aanzet tot deze gewenste inspanning eo. Dit kan worden gegarandeerd door de zogenaamde aanmoedigings-voorwaarde toe te voegen aan het stelsel 10a-b. Zij luidt:23
(13) eo moet het maximum opleveren van E[v(w)] − c(e)
Stel weer de beslisser kan kiezen uit eL en eH. Als hij genoegen neemt met eo = eL, dan kan hij net zo handelen als bij een zichtbare inspanning. Hij biedt simpelweg het loon w(eL) = v-1(c(eL) + U). Immers dan is voldaan aan de participatie voorwaarde, zodat de uitvoerder het contract zal accepteren. En de uitvoerder zal vanzelf eL verkiezen.
Interessanter is het geval, waarin de beslisser probeert om zijn uitvoerder te verleiden tot eH. De aanmoedigings-voorwaarde in de formule 13 laat zien dat er moet gelden: E[v(w(eL))] − c(eL) ≤ E[v(w(eH))] − c(eH). Als hier de identiteit geldt, dan is kennelijk de aanname dat de uitvoerder toch kiest voor eH. Het Kuhn-Tucker theorema stelt dat het onderhavige optimalisatie probleem leidt tot de relatie25
(14) 1/(∂v/∂w) = λ + μ ×(1 − f(π|eL) / f(π|eH))
De gelijkenis met de formule 11 springt in het oog. Men kan eenvoudig aantonen dat λ en μ allebei positief zijn26. De beslisser kan de formule 14 gebruiken om de loonfunctie w(π) te berekenen, die de uitvoerder aanmoedigt om te kiezen voor eH.
Aangezien f(π|eL) / f(π|eH) allerlei waarden kan aannemen als functie van π, kan kennelijk ∂v/∂w zich nogal grillig gedragen als functie van π. Maar zoals reeds eerder is aangetoond, is ∂v/∂w een strikt dalende functie van w. De conclusie moet zijn, dat w(π) zich grillig kan gedragen als functie van π. Het contract kan in sommige intervallen van π een loondaling aanbieden, wanneer de winst gaat stijgen. Zie bijvoorbeeld de figuur 4, die is overgenomen van p.486 in Microeconomic theory. Uiteraard komt dat, doordat f(π|e) de grilligheid van de markt modelleert. De markt kan de winsten opjagen, terwijl de uitvoerder zich weinig inspant, en omgekeerd. Dit is een belangwekkende bevinding van het hele voorgaande betoog.
Ook een tweede bevinding verdient vermelding. Namelijk, de participatie voorwaarde dwingt tot E[v|eH] = c(eH) + U. Voorts laat een eerdere column zien, dat risico-mijding bij de uitvoerder leidt tot E[v(w)] < v(E[w]). Nu is v een strikt stijgende functie, zodat hetzelfde geldt voor v-1. Dit heeft tot consequentie dat E[w] > v-1(E[v(w)]). Kortom, er blijkt te gelden E[w|eH] > v-1(c(eH) + U). En het rechterlid van de ongelijkheid is juist gelijk aan w(eH) voor het geval van een zichtbare inspanning.
Kennelijk is in de situatie met een onzichtbare inspanning eH het verwachte arbeidsloon van de uitvoerder hoger dan in de situatie met een zichtbare inspanning eH. In de situatie met inspanning eH is de loonsverhoging nodig om de uitvoerder te verzekeren tegen het risico. Zijn ervaren nut is bij zichtbaarheid en onzichtbaarheid gelijk, te weten U. Maar deze extra onkosten voor de situatie eH reduceren het inkomen van de beslisser. Zonet is al geconstateerd, dat de situatie met eL dit probleem niet heeft. Aldus is denkbaar, dat soms de beslisser eigenlijk de inspanning eH zou willen verkiezen, maar wegens de onkosten voor de risico-verzekering tenslotte toch de inspanning eL goedkoper is voor hem. Klaarblijkelijk leidt de onzichtbaarheid tot een verlies aan welvaart bij de beslisser, en dus bij de maatschappij als geheel. Dit is de belangrijkste conclusie van het beslisser-uitvoerder model met onzichtbare inspanning27.