Veel economische transacties hebben een tijdsasymmetrie, die de handelaren dwingt om vertrouwen te stellen in elkaar. Vertrouwen baseert in laatste instantie op een reputatie. De huidige column laat zien hoe de handelaren hun reputatie signaleren aan elkaar door te kiezen voor een bepaald gedrag. Na een algemene inleiding aan de hand van de socioloog J.S. Coleman wordt de signalering geïllustreerd met voorbeelden van het gedrag in oligopolies, van het beleid van een Centrale Bank, en van werkzoekenden op de arbeidsmarkt.
Vele columns in de Gazet hebben gewezen op de onvolkomenheden van de neoklassieke theorie in haar simpelste gedaante. Dit gebrek wordt zelfs dermate knellend gevoeld, dat er een nieuwe discipline is ontstaan, te weten de gedragseconomie. De gedragseconomie verzet zich tegen het mensbeeld van de homo economicus, die in isolement op een rationele en egoïstische manier probeert zichzelf te verrijken. Immers, de individu is ingebed in de maatschappij, en laat zijn of haar eigen gedrag daardoor verregaand aansturen. Aldus kan de maatschappij niet worden verklaard uit een model, dat de menselijke wisselwerking voorstelt als onpersoonlijke ruilacties van goederen en middelen. De huidige column laat zien, dat de persoonlijke reputatie van individuen en organisaties wezenlijk bijdraagt aan hun vermogen om succes te boeken.
De socioloog J.S. Coleman heeft de gedragswijzen in het maatschappelijke verkeer diepgaand geanalyseerd in zijn werk Foundations of social theory1. Uw columnist put voor het vervolg van deze paragraaf uit deze rijke bron. Coleman constateert dat de reputatie doorwerkt in het vertrouwen, dat wordt geschonken aan de betreffende persoon. Dien ten gevolge plaatst hij het vertrouwen centraal in zijn uitweidingen. Uiteraard is daarbij vooral interessant hoe het vertrouwen van invloed is op de menselijke acties. De benadering van Coleman wordt gekenmerkt door een wonderlijke dubbelzinnigheid. Namelijk, enerzijds typeert hij de mens als een homo economicus, die rationeel en doelbewust zijn eigen welzijn probeert te optimaliseren. En anderzijds wordt diezelfde mens steeds weer onderuit gehaald door zijn natuur, inclusief allerlei driften, die hem verleidt tot subjectieve en irrationele gedragswijzen2.
Vertrouwen is onmisbaar bij menselijke acties, omdat die zelden bestaan uit een directe ruil van goederen en middelen. Vaak verstrijkt er enige tijd tussen de leverantie en de betaling of wederdienst. De handelaar, die de leverancier is in de transactie, doet als het ware een investering. De tijdsasymmetrie is een risico voor hem, want het is onzeker of de handelaar, die de ontvanger is van de leverantie, zijn betalingsplicht zal nakomen. Kennelijk is de leverancier een vertrouwende, die vertrouwen geeft aan zijn afnemer. Omgekeerd is de afnemer een vertrouwde, die vertrouwen krijgt. Vaak zal het vertrouwen worden geschonken dankzij de goede reputatie van de afnemer. De leverancier schat in, dat de kans p van betaling hoog is. Wiskundig geformuleerd betekent dat p × Ow > (1 − p) × Qv. In deze formule is Ow de winst van de leverancier bij een succesvolle transactie, en Ov is zijn verlies, in geval dat de afnemer het vertrouwen schendt en in gebreke blijft3.
Men zou kunnen denken, dat dankzij het afsluiten van contracten het vertrouwen overbodig wordt. Echter contracten zijn een gebrekkig instrument. Vaak kan men niet alle toekomstige ontwikkelingen voorzien. Soms zal de tijd ontbreken om een contract af te sluiten. En niet op de laatste plaats, het afsluiten van een contract veroorzaakt extra kosten, die de transactie minder rendabel maken en wellicht zelfs geheel blokkeren. Kortom, de aanwezigheid van vertrouwen is bevorderlijk voor de bedrijvigheid. Daarom noemt men het vertrouwen wel een maatschappelijk kapitaal. In de basale neoklassieke theorie is vertrouwen niet nodig, omdat zij veronderstelt dat de individuen volledig zijn geïnformeerd. Zij kennen de situatie van de andere handelaren perfect, en zijn bovendien geheel op de hoogte met alle toekomstige ontwikkelingen.
Uiteraard beschikken in de echte wereld de handelaren slechts over onvolledige informatie. Zij vertrouwen er op, dat tijdens een transactie de anderen geen valse informatie geven of anderszins bedrog plegen. Dat vertrouwen kan ontstaan uit de reputatie van eerlijkheid bij de andere, die is opgebouwd door de ervaring dat diens eerdere transacties steeds naar behoren zijn verlopen. Dan krijgt die een goede naam. Concreet betekent dit, dat de handelaar met een goede reputatie geen bedrog gebruikt om zich kortstondig te verrijken, bijvoorbeeld door in gebreke te blijven bij de betaling. Hij geeft de voorkeur aan de winst, die hij kan vergaren in toekomstige transacties met handelaren, die hem vertrouwen. Immers alle handelaren, die noodgedwongen een vertrouwende moeten zijn, zullen kiezen voor een betrouwbare vertrouwde. Kennelijk vertrouwt de betrouwbare handelaar er zelf op, dat zijn klanten hem trouw zullen blijven. Dat maakt de relatie wederkerig.
Het ligt voor de hand om bij de acties of transacties te denken aan economische handelingen. Echter het betoog is ook toepasbaar op andere soorten maatschappelijke acties. Bijvoorbeeld moeten politici voortdurend compromissen sluiten met elkaar, en daarbij worden vaak afspraken gemaakt voor een langere periode. Dat lukt enkel, indien er vertrouwen is dat de ander zich zal houden aan het compromis. Een cultuur van vertrouwen is simpelweg een collectieve moraal van de betreffende groep. Die komt niet gratis en vanzelf. Zij moet geleidelijk worden opgebouwd door investeringen in elkaar. Men krijgt dan een reputatie, simpelweg omdat men wordt opgenomen in de groep. Het moge duidelijk zijn dat het ontwikkelen van een deugdelijke moraal complex is. Namelijk, men wil de kosten van acties verminderen, en nochtans wèl de onderlinge wedijver in stand houden.
Overtreders van de moraal moeten een gepaste afstraffing krijgen. De strafnorm zal eerst informeel zijn, en later wellicht worden vastgelegd in een wet, bij voldoende draagvlak. De ontwikkeling van een deugdelijke moraal is een algemeen belang. Op deze manier wordt een terugkoppeling ingebouwd in het maatschappelijke systeem. Enerzijds wordt een handelaar beperkt door de moraal van zijn groep. Anderzijds onderneemt hij acties, die nu en dan zullen leiden tot aanpassingen van het systeem. Trouwe lezers zullen zich een bijzonder geval van deze terugkoppeling herinneren, te weten de communicatiestromen in een pluralistische democratie, zoals is getoond in de eerdere column over het algemeen belang. Daar is het volk de vertrouwende, en de regering is de vertrouwde. Het systeem is de maatschappij als geheel. Het schept hoop, dat dit systeem functioneert. Immers een parlement en kabinet van louter homini economicus zouden zichzelf onverschaamd verrijken.
Sommige personen of organisaties zijn makelaars in vertrouwen. Coleman noemt dit gedrag ondernemend. De ondernemers brengen verschillende investeerders bijeen ten einde productieve arbeid te kunnen financieren. In dit model krijgen de arbeiders het vertrouwen. Maar een ondernemer kan ook organisaties bijeen brengen, bijvoorbeeld in een kartel. De leden van het kartel geven vertrouwen aan de initiatiefnemer, en zullen later tevens vertrouwen gaan opeisen. Een ander voorbeeld: de Centrale Bank stelt zich ten doel, dat de burgerij het vertrouwen behoudt in het nationale geld. Omgekeerd bestuurt de burgerij in laatste instantie de Centrale Bank.
Als een groot aantal handelaren zich verenigt op basis van wederzijds vertrouwen, dan spreekt Coleman van een groep (zie p.188). De groep heeft één doel en actie, allebei gericht op het gedeelde belang van de groepsleden. De groep ontwikkelt een moraal, en handhaaft die via afstraffingen, in laatste instantie de uitstoting van de afvalligen uit de groep. De groepsleden kunnen zich onderwerpen aan een leider, bijvoorbeeld aan de ondernemer, die de groep heeft opgericht. Dan wordt de groep hiërarchisch. De leider krijgt een grote macht. Hierin zit het gevaar, dat hij de groep op een dwaalspoort voert, en daarna onvoldoende of niet wordt gecorrigeerd door de leden van de groep.
Trouwe lezers zullen zich herinneren, dat de Nederlandse econoom P. Frijters de redenatie van Coleman navolgt in zijn boek An economic theory of greed, love, groups and networks4. Hij analyseert naast de wederkerige en hiërarchische groep ook nog het netwerk. Een netwerk bestaat uit handelaren, die onderling contacten onderhouden, zonder nog institutionele normen te hebben afgesproken. Frijters concentreert zijn studie op het handelsnetwerk, waarbij de ondernemers fungeren als contactmakers. Net zoals Coleman neemt Frijters het mensbeeld van de homo economicus tot uitgangspunt. Naarmate een handelsnetwerk hechter wordt, kan het zich ontwikkelen tot een groep. Elk groepslid drukt zijn vertrouwen in de groep uit door middel van toewijding (in het Engels love). Dankzij die toewijding wint dat lid zelf het vertrouwen van de rest van de groep. Het is een riskante strategie, want toewijding heeft hoge kosten5.
Voor Frijters is de toewijding niet hetzelfde als vertrouwen. Immers in de definitie van Coleman is het vertrouwen berekenend. Echter toewijding is een welhaast mystiek proces, dat soms zelfs onderbewust verloopt, en geen externe beloning kent (zie p.87 in Aetoglgan). Zij is een complex van gevoelens en emoties. Daarom definieert Frijters op p.181 het vertrouwen als een embryonale vorm van toewijding. De toewijding stimuleert de coördinatie van activiteiten. Op die manier kan een handelsnetwerk tenslotte worden verleid tot de oprichting van marktinstituties, die het positieve effect hebben, dat zij de transactiekosten verminderen. Zelfs meent Frijters, dat de democratie in laatste instantie is gegroeid uit een marktinstitutie (zie p.286, 304).
Kennelijk nadert hij in de uitwerking van zijn theorie toch sterk naar de nutstheorie van Coleman. Zijn bezwaar tegen de theorie van het verwachte nut is, dat het slecht lukt om daarin een overtuigende verklaring te geven voor groepsmacht (zie p.219). Evenzo vindt Frijters de gedragseconomie onbevredigend, omdat die nog geen universeel model heeft ontwikkeld. Zij is niet in staat om de maatschappij in al haar samenhang te beschrijven (p.222). Met andere woorden, Frijters vraagt om een koppeling van het micro-niveau aan het macro-niveau. Zonet bleek al, dat Coleman de koppeling legt via de invloed van alle individuele acties op het systeem als geheel. De terugkoppeling naar het macro-systeem verloopt via het micro-niveau. Evenals Coleman beschouwt Frijters het vertrouwen als een maatschappelijk kapitaal (p.277). Vertrouwen kan groeien door ervaring (p.278).
Kortom, Frijters voegt de factor toewijding toe aan de uitleg van Coleman. De homo economicus is van nature behept met de neiging tot toewijding. Zij verrijkt het maatschappij model met een innerlijke drang tot menselijke binding. Des al niettemin is het voorstel van Frijters nog niet breed omarmd door de wetenschappelijke gemeenschap. In het vervolg zullen nu enkele modellen worden toegelicht, die het belang van een reputatie duidelijk maken. Het betreft gevestigde (gangbare) modellen, waarin het begrip toewijding nog geen plaats heeft gekregen. Kennelijk kan zij hier worden gemist - al lijken de modellen haar niet uit te sluiten. Het betreft signalen die achtereenvolgens de indruk moeten geven van een sterke monopolist, van een strenge Centrale Bank, en van een hoog-productieve werker.
In eerdere columns is reeds gebleken dat het boek Industrial organization in context van S. Martin een goudmijn is voor iedereen, die meer wil begrijpen van commerciële organisaties6. In het hoofdstuk 7 over dominerende ondernemingen beschrijft Martin twee situaties, waarin de onderneming er baat bij heeft om via een signaal aan haar omgeving duidelijk te maken wat haar "karakter" is. In beide situaties wil de onderneming signaleren hoe zij haar productprijzen bepaalt. Het doelwit van de signalen zijn respectievelijk de afnemers van de producten en potentiële concurrenten op de markt van de onderneming.
De eerste situatie heeft betrekking op de markt voor een duurzaam product (zie p.216). De onderneming introduceert het product als een innovatie, en heeft daarom aanvankelijk een monopolie. Een eerdere column heeft laten zien dat in een dergelijke situatie de monopolist zijn winst kan vergroten dankzij prijsdiscriminatie. Direct na de marktintroductie kan de productprijs p(0) erg hoog zijn, ten einde te verkopen aan de consumenten met een buitensporige behoefte. Als dat marktsegment is verzadigd, dan komt in de volgende periode t=1 de onderneming in de verleiding om de productprijs te verlagen, zeg naar p(1) < p(0). Immers daarmee breidt zij de markt uit met de consumenten, die wat minder behoefte hebben aan het product. Aldus zou in opeenvolgende perioden t de prijs p(t) stapsgewijze worden verlaagd.
Men noemt dit beleid een tegenstelling in de tijd (in de Engelse taal een time inconsistency).Er moet worden benadrukt dat de onderneming niet met een kwade opzet de indruk wekt dat p(0) de juiste prijs is. Zij constateert simpelweg op t=1, dat het welzijn van de consumenten kan worden verbeterd door bij nader inzien af te wijken van p(0). Zolang de consumenten inderdaad geloof hechten aan de oorspronkelijke prijs p(0), gaat iedereen vooruit dankzij het nieuwe prijsbeleid. Echter het nieuwe beleid overziet, dat elke afzonderlijke individu er baat bij heeft om het gedrag aan te passen bij de nieuwe situatie. Immers de prijsdalingen maken het voordelig voor de consumenten om met de aankoop te wachten tot een latere periode, ook al vinden zij de huidige prijs redelijk. De consumenten geloven de prijs p(0) niet meer. Daarom neemt de bekende econoom Ronald Coase aan, dat de onderneming noodgedwongen direct de productprijs gelijk moet maken aan de marginale kosten.
Echter Coase doet enkele suggesties voor signalen, waarmee de onderneming de prijs p(0) geloofwaardig kan maken. De onderneming kan de consumenten beloven om des gewenst het product terug te kopen voor de prijs p(0), verminderd met een schappelijke afschrijving. Als de consument daarvoor kiest, dan heeft die in feite het product gehuurd. Ook kunnen er kleine wijzigingen worden aangebracht aan het product, waardoor de suggestie wordt gewekt dat het oorspronkelijke product is verouderd. In dit geval wil het signaal de indruk wekken, dat het product niet bijster duurzaam is.
De tweede situatie van signalering betreft een monopolist, die andere ondernemers wil ontmoedigen om zijn markt te betreden. Dien ten gevolge is de monopolist een initiatiefnemer inzake de geproduceerde hoeveelheid Q. Dit model wordt aangeduid als het Von Stackelberg type. Er wordt verondersteld, dat de initiatiefnemer de beste reactie-functie van de toetredende onderneming kent. De vraagcurve wordt gegeven door p(Q) = pmax − β×Q. Zij gemakshalve de variabele productiekosten c van allebei de ondernemingen gelijk. Dan wordt in een eerdere column uitgerekend hoe zij de markt onderling zullen verdelen. Duidt de initiatiefnemer aan met I, en de toetreder met II. In evenwicht op een gedeelde markt zou hun productie respectievelijk worden
(1a) qI = (pmax − c) / (2×β)
(1b) qII = ½ × qI
Hieruit kan een model van signalering worden afgeleid, dat een limiet prijsstelling wordt genoemd. Deze wat verwarrende benaming wil uitdrukken, dat de monopolist I het aantal ondernemingen wil begrenzen tot alleen hemzelf. Hij accepteert de verdeling volgens het stelsel 1a-b niet. Daartoe moet hij de onderneming II overtuigen, dat die na toetreding altijd verlies lijdend zal blijven. Concreet geeft I dit signaal af door een zodanige productiecapaciteit qI op te bouwen, dat de prijs p(Q) naar believen kan worden neergedrukt. Als I nochtans winst wil blijven maken, dan moet hij natuurlijk zijn variabele kosten c zo laag mogelijk houden. In de zonet genoemde column is aangetoond dat II kan rekenen op een afzet
(2) qII = ½ × (pmax − c − β×qI) / β
Dien ten gevolge is tevens de winst van II op de lopende productie bekend, namelijk πII = (p(Q) − c) × qII. Invullen van Q = qI + qII en van de formule 2 geeft
(3) πII = (½ − β/4) × (pmax − c − β×qI)²
In dit model wordt nu aangenomen, dat II bij entree op de markt vaste kosten CII heeft. Als op een zeker tijdstip het gemiddelde kapitaalrendement gelijk is aan r, en de jaarlijkse vergoeding aan de eigenaar van onderneming II is πII, dan is de gekapitaliseerde waarde gelijk aan πII/r. Met andere woorden, dit is de vermogenswaarde van de onderneming. Dan is de tegenwoordige verdisconteerde waarde van entree gelijk aan
(4) WII = πII(qI) / r − CII
Deze formule toont duidelijk de macht van I. Immers blijkens de formules 3 en 4 zorgt qI = (pmax − c) / β − (1/β) × √(r×CII / (½ − β/4)) dat er geldt WII=0. Een iets grotere qI zorgt zelfs voor een te verwachten verlies. Via de vraagcurve is direct duidelijk, dat de limiet prijs om de entree van II te blokkeren gelijk is aan
(5) p = c + √(r×CII / (½ − β/4))
De monopolist I moet besluiten of hij wil blokkeren. De blokkade levert hem een winst π1 = (p − c) × qI op. Invullen van qI geeft
(6) πI = (1/β) × √(r×CII / (½ − β/4)) × (pmax − c − √(r×CII / (½ − β/4)))
Als de monopolist rationeel wil besluiten, dan moet hij deze winst πI vergelijken met de winst πI*, indien hij wèl de toetreding van II toelaat. Stel nog steeds dat hij kan leiden in de hoeveelheid qI* (Von Stackelberg duopolie). Uit de formule πI* = (p − c) × qI* kan tezamen met vraagcurve en het stelsel 1a-b eenvoudig worden berekend dat geldt
(7) πI* = (pmax − c)² / (8×β)
Klaarblijkelijk zal I de toetreding van II blokkeren, indien er geldt πI* < πI. Als omgekeerd geldt πI* > πI, dan accepteert I het duopolie. De formule 6 laat duidelijk zien, dat de blokkade minder aantrekkelijk wordt, naarmate de ingezonken kosten CII lager uitvallen. Ook een lage rentevoet r kan een belemmering zijn voor de blokkade.
De signalering naar II is hier verlopen via de productiecapaciteit, die I heeft opgebouwd. Merk op dat het voorgaande betoog heeft aangenomen dat allebei de ondernemingen gelijke variabele kosten c hebben. Echter als ondernemer II zijn kosten kan neerdrukken (cII < cI), dan maakt dat de blokkade weer moeilijker voor I. De ondernemer II moet dan wel weten hoe groot cI is, en die informatie zal vaak niet beschikbaar zijn. Op p.225 van zijn boek beschouwt Martin dit geval van onvolledige informatie bij II, waarbij echter I evenmin de beste reactie functie van II kent. Nu I niet het initiatief kan nemen, is er sprake van een normaal Cournot duopolie. Er ontstaat een evenwicht op de markt bij qI = (pmax + cII − 2×cI) / (3×β), en qII = (pmax + cI − 2×cII) / (3×β). Dan is Q = (2×pmax − cI − cII) / (3×β), en de winst van II wordt πII = (p − cII) × qII, dus
(8) πII = (pmax + cI − 2×cII)² / (9×β)
De ondernemer II zal weer de formule 4 voor de tegenwoordige verdisconteerde waarde gebruiken om te berekenen of WII wel positief is. Men ziet uit de formule 8 dat de winstgevendheid zowel afhangt van het kostenverschil cI − cII als van de kosten cII zelf. Kennelijk is de toetreding een gok, zolang de grootte cI niet bekend is aan II. Nu kan II een schatting maken van cI door te kijken hoeveel I produceerde als monopolist. Namelijk, in een eerdere column is aangetoond dat de optimale productie van de monopolist gelijk is aan qIM = (pmax − cI) / (2×β). Een monopolist met lage onkosten zal meer produceren dan één met hoge. Het lijkt alsof II zo alsnog een goed inzicht krijgt in de markt.
Een volledig geïnformeerde II is vooral onaangenaam voor I, indien diens variabele productiekosten hoog zijn. Echter in dat geval kan een slimme I een truc uithalen. Hij kan als monopolist zijn productie qIM groter maken dan het optimum vereist. Daarmee signaleert hij aan de ondernemer II dat hij relatief lage onkosten heeft, lager dan in werkelijkheid. De monopolist maskeert zijn kosten. Wegens de formule 8 gaat II nu denken dat hij na toetreding tot de markt weinig winst maakt. Dankzij de onjuiste illusie van II heeft op die manier de monopolist I een ontmoedigend signaal gezonden aan II. Uiteraard moet I tevoren uitrekenen of de maskering zinvol is. Enerzijds behoudt hij daardoor wellicht het monopolie op zijn markt. Anderzijds produceert hij als monopolist te veel, waardoor hij een deel van zijn eigen winst opgeeft. Signalen om sterker te lijken dan men feitelijk is doen zich vaak voor. Ook de twee volgende paragrafen houden zich bezig met dit thema.
Een voorgaande column heeft laten zien, dat de Centrale Bank er baat bij heeft om op elk tijdstip t de verwachtingen van inflatie πv(t) bij de burgers te beïnvloeden. De theorie van dit macroeconomische beleid wordt uitstekend uitgelegd in het boek Political economy in macroeconomics van A. Drazen, waarop deze paragraaf is gebaseerd7. De Centrale Bank (afgekort CB) is aangewezen door de staat om de prijsstabiliteit te beschermen, Het bevorderen van de werkgelegenheid is vooral de taak van de regering, al moet de CB er wel rekening mee houden. Het beheersen van de inflatie verwachting πv is belangrijk, omdat die anders de inflatie gaat opdrijven. Een strenge Centrale Bank (afgekort CB(S)) heeft geen problemen met πv, want de burgers weten dat zij altijd de inflatie bestrijdt. Dat wil zeggen, zij streeft π(t)=0 na.
Anderzijds heeft een zwakke CB (afgekort CB(Z)) de reputatie regelmatig inflatie toe te laten, omdat zij weinig weerstand durft te bieden tegen de druk van de regering. Immers die wil de werkloosheid bestrijden, en dat gaat gepaard met enige inflatie. Dien ten gevolge geloven de burgers het niet, wanneer de CB(Z) een beleid π(t)=0 belooft. Het vertrouwen ontbreekt. De CB(Z) kan enkel πv beïnvloeden, indien en zolang zij zich gedraagt alsof zij CB(S) is. Dan weten de burgers niet zeker van welk type (S of Z) de CB feitelijk is. Men herkent de maskering van het monopolie met een grote cI uit de voorgaande paragraaf.
In de zonet genoemde paragraaf is de verliesfunctie Λ(π, u) kwadratisch in de inflatie π en de werkloosheid u. Hier kiest Drazen een iets andere gedaante, te weten
(9) Λ(π, u) = μ × u(t) + π(t)²
In de formule 9 is μ een positieve constante, die bepaalt hoeveel waarde de CB hecht aan de werkgelegenheid. De CB wordt strenger naarmate haar μ kleiner is. Trouwe lezers weten, dat de CB haar verliesfunctie wil minimaliseren. Behoudens bijzondere omstandigheden zijn u en π gerelateerd via de Phillips curve
(10) π(t) = πv − β × u(t)
In de formule 10 is gemaks halve de natuurlijke werkloosheid un gelijk aan nul gekozen. Nu wordt u geëlimineerd door de formule 10 in te vullen bij de formule 9. Het resultaat is
(11) Λ(π(t), πv(t)) = (πv(t) − π(t)) × μ / β + π(t)²
Uiteraard vindt de CB het minimum van de verliesfunctie door ∂Λ/∂π = 0 uit te rekenen. Men vindt daarmee de optimale πo = μ / (2×β). Als de burgers hierop hun verwachting baseren, dan wordt de verliesfunctie Λ = πo². Het valt op dat de CB een beter resultaat kan bereiken door de burgers te overtuigen, dat zij πv=0 moeten nemen. Immers dan komt Λ=0 binnen handbereik, door aan te sturen op π=0. Zonet is geconstateerd dat enkel een CB met een sterke reputatie de burgers kan overtuigen. Drazen gaat nu onderzoeken hoe de reputatie CB(S) kan worden opgebouwd of worden behouden. Hij noemt dit het Backus-Driffill model van signalering. In dit model kiest de CB(S) voor de inflatie πo=πS, gebaseerd op μS. Zij kiest πS zo klein, dat zij zo goed als nul is.
Het model onderscheidt daadwerkelijk twee typen voor de CB, te weten CB(S) en CB(Z). Tussenvormen worden genegeerd. De CB(Z) wil het liefst hebben dat π=πZ met een relatief grote πZ, want zij wordt getypeerd door een grote μZ. Wiskundig geformuleerd: πZ >> πS. De ontwikkeling van de reputatie wordt gemodelleerd via kansrekening. Volgens de burgers is er een waarschijnlijkheid p(t), dat de CB van het type CB(S) is. Stel dat de CB inderdaad de inflatie volledig kan aansturen. Dan kan de CB op tijdstip t haar reputatie verbeteren door te kiezen voor π(t) = πS. Stel dat er een kans q(t) is dat de CB(Z) hiervoor inderdaad kiest in een poging om haar reputatie te verbeteren. Merk allereerst op dat de burgers een inflatie verwachten ter grootte
(12) πv(t) = (p(t) + (1 − p(t)) × q(t)) × πS + (1 − p(t)) × (1 − q(t)) × πZ
Klaarblijkelijk zijn er op tijdstip t twee mogelijkheden voor de inflatie, te weten πZ en πS. De verwachte inflatie πv(t) ligt tussen deze twee waarden, zolang de burgers twijfelen over het type CB. Stel eerst dat in realiteit optreedt π(t)=πS. Dan kan met de zogenaamde Bayesiaanse regel worden berekend, dat in de volgende periode t+1 de burgers hun schatting p als volgt actualiseren:8
(13) p(t+1) = p(t) / (p(t) + (1 − p(t)) × q(t))
Aangezien de noemer van de formule 13 kleiner is dan 1 (want kleiner dan p+1-p), geldt dat p(t+1) groter is dan p(t). Kennelijk is inderdaad in de periode t+1 de reputatie van de CB verbeterd. Beschouw vervolgens de omgekeerde situatie, waarin optreedt π(t)=πZ. Met andere woorden, in de periode t treedt er een flinke inflatie op. Dan kan op analoge manier worden bewezen dat de geactualiseerde schatting gelijk is aan9
(14) p(t+1) = 0
Een flinke inflatie is voor de burgers het bewijs, dat de CB van het type CB(Z) is. Voortaan zit zij vast aan die reputatie. De burgers zullen nooit meer willen aannemen πv = πS.
Merk verder op, dat een vooruitziende CB eigenlijk de verliesfunctie Λ = Σt=1ω δt-1 × Λ(π(t), πv(t)) wil minimaliseren, waarin het symbool ω staat voor oneindig. De factor δ verdisconteert, dat toekomstig leed minder wordt gevoeld dan het hedendaagse. Met andere woorden, er geldt 0 ≤ δ ≤ 1. Uiteraard heeft de CB een gigantische taak, wanneer zij uit de optimalisatie van Λ de beste strategie voor het signaleren wil afleiden. Nochtans doet Drazen een poging. Daarbij veronderstelt hij dat de CB enigszins bijziend is, en enkel de perioden t=1 en t=2 in rekening brengt10. In die situatie zal in de laatste periode t=2 elke CB, ongeacht het type, zijn favoriete inflatie kiezen. Dat maakt geen verschil voor de CB(S), want die hanteert altijd πS. Echter de CB(Z) zal op t=2 kiezen voor π(2) = πZ. Daarmee krijgt zij een zwakke reputatie, maar dat heeft pas effect in de periode t=3, die hier buiten de horizon van de CB valt.
Kortom, in dit scenario kiest de CB(Z) voor q(2)=0. Invullen in de formule 12 geeft πv(2) = p(2) × πS + (1 − p(2)) × πZ. Herschrijf gemaks halve voor CB(Z) de formule 11 tot Λ(π(t), πv(t)) = 2×πZ × (πv(t) − π(t)) + π(t)². Dien ten gevolge vindt men voor de verliesfunctie van CB(Z)11
(15) Λ(π(1), p(2)) = 2×πZ × (πv(1) − π(1)) + π(1)² + δ × (2×πZ × p(2) × (πS − πZ) + πZ²)
De CB(Z) gaat nu de formule 15 gebruiken om te bepalen welke signalering zorgt voor het minste verlies. Een mogelijke strategie is q(1)=0, waarbij de CB(Z) dus kiest voor π(1) = πZ. Daarmee ontmaskert zij zichzelf voor de burgers, met als gevolg dat geldt p(2)=0. De verliesfunctie wordt simpelweg Λ(πZ, 0) = 2×πZ × (πv(1) − πZ) + πZ² + δ × πZ² = 2× πZ × πv(1) − πZ² + δ × πZ². Een alternatieve strategie is q(1)=1, waaruit direct volgt π(1)=πS. Merk op, dat in deze strategie met q(1)=1 zich een tegenspraak in de tijd (time inconsistency) kan voordoen, omdat immers CB(Z) kiest voor q(2)=0. Des al niettemin zijn in dit model de burgers voldoende rationeel om niet uit π(1)=πS te concluderen dat er een type S is. De burgers behouden onduidelijkheid over het CB-type. De formule 13 toont dat ze het type inschatten volgens p(t+1) = p(t), in casu p(2) = p(1). Dat zorgt alsnog voor consistentie.
De cruciale vraag is welke van de twee opties het meest aantrekkelijk is voor de CB(Z). De formule voor Λ(πS, p(2)) blijft complex, maar men rekent simpel uit dat12
(16) Λ(πS, p(2)) − Λ(πZ, 0) = (πZ − πS) × (πZ − πS − 2×δ × πZ × p(2))
De formule 16 laat zien dat de strategie q(1)=0 de voorkeur heeft, indien de laatste term tussen haakjes positief is. Immers dan is kennelijk Λ(πS, p(2)) de grootste. Die behoort bij q(1)=1. En men wil juist Λ minimaliseren. Is de term negatief, dan heeft omgekeerd q(1)=1 de voorkeur. En als zij gelijk is aan 0, dan maakt de strategie niet uit. Dit nulpunt doet zich voor bij
(17) p(2) = ½ × (1 − πS/πZ) / δ
Kortom, de waarden van de verdiscontering δ, van het inflatieverschil πZ − πS, en van de inschatting p(2) = p(1) van de burgers bepalen welk signaal CB(Z) moet zenden op t=1. Indien er is voldaan aan de formule 17, dan liggen de beide opties q(1)=0 en q(1)=1 op dezelfde iso-verlies curve van Λ. In die situatie zou de CB(Z) elke willekeurige waarde van de kans q(1) kunnen kiezen. Haar gemiddeld gekozen π(1) wordt dan q(1) × πS + (1 − q(1)) × πZ. In deze interpretatie van π(1) als een gemiddelde kan kennelijk π(1) in de formule 15 continu veranderen. In de figuur 2 is de bijbehorende iso-verlies curve getekend in het (π(1), p(2)) vlak. Zij voldoet aan de formule p(2) = (π(1) − πZ)² / (2×δ × πZ × (πZ − πS)) 13.
In het geval dat p(2) > ½×(1 − πS/πZ) / δ kiezen klaarblijkelijk de CB(Z) en de CB(S) dezelfde strategie voor t=1. Men noemt dit een verenigd evenwicht (in de Engelse taal pooling). De CB(Z) bootst de CB(S) na, althans op t=1. Een CB met een grote δ zal al gauw voldoen aan deze eis voor p(2). In het geval dat p(2) < ½×(1 − πS/πZ) / δ kiezen kennelijk de CB(Z) en de CB(S) hun eigen favoriete strategie voor t=1. Men noemt dit een scheidend evenwicht (in de Engels taal separating). De CB(Z) signaleert direct welk type zij is. In deze situatie zal δ gewoonlijk klein zijn. Merk evenwel op, dat δ een benedengrens heeft, omdat moet gelden p(2) ≤ 1. Dat impliceert δ ≥ ½×(1 − πS/πZ). Mocht toch δ beneden deze grenswaarde liggen, dan heeft signaleren geen zin. De CB zal simpelweg haar eigen voorkeur volgen, zodat zich een scheidend evenwicht vormt.
De CB(S) hoeft geen keuze te maken van signaleren. Echter zij heeft last van de twijfels p(t), die de burgers hebben over haar type. Immers blijkens de formule 12 is daardoor πv nodeloos hoog. De formule 11 laat zien dat daardoor de verliesfunctie toeneemt. Gelukkig is er een uitweg uit deze onprettige toestand, namelijk door πS zo klein mogelijk te nemen, bijvoorbeeld πS=0. Daarmee wordt het bereik van p(2) waarden met een scheidend evenwicht zo groot mogelijk, met p(2) < 1/(2×δ). Als in dit bereik de scheiding π=πZ uitblijft, dan weten de burgers zeker dat de bank van het type CB(S) is. Met deze constatering kan de uitleg van het Backus-Driffill model worden afgesloten.
Het voorgaande is een fikse rekenpartij, en Drazen vraagt zich af hoe zinvol zij is. Feitelijk is het model oorspronkelijk ontwikkeld om de signalering in oligopolies te beschrijven. Backus en Driffill hebben het model vertaald naar het monetaire beleid, maar natuurlijk is een CB toch heel iets anders dan een oligopolie. Daarom zal de strategie van signaleren eveneens anders zijn. Nochtans vindt uw columnist het Backus-Driffill model de moeite waard, want het illustreert enkele reacties van burgers, waarmee de CB rekening moet houden. Daarom staat het model hier.
Deze paragraaf analyseert de betekenis van het onderwijs voor de economie. Volgens de theorie van het menselijke kapitaal voorziet het onderwijs de burgers van extra kennis en vaardigheden, waardoor zij productiever worden in het arbeidsleven. Echter deze theorie wordt bestreden door wetenschappers, die de menselijke vaardigheden verklaren uit aangeboren talenten. Deze innerlijke talenten kunnen genetisch zijn bepaald, of zijn overgedragen in de opvoeding, door het milieu waarin men opgroeit. Deze wetenschappers stellen, dat het onderwijs niets bijdraagt aan de productiviteit ap. Het onderwijs is enkel nuttig, omdat het een signaal afgeeft over het innerlijke talent. Hoewel deze theorie van signalering intuïtief vreemd overkomt, heeft zij toch veel aanhangers. De huidige paragraaf legt haar uit, aan de hand van hoofdstuk 13 in Microeconomic theory14.
De redenatie is als volgt. Stel dat een individu, waarvan de productiviteit ap is, psychische kosten ter grootte c(e, ap) heeft, wanneer hij e jaren lang onderwijs volgt. Immers gewoonlijk wordt leren ervaren als een last. In wiskundige termen bedragen de jaarlijkse kosten C = ∂c/∂e > 0. Deels kunnen de kosten reëel zijn, te weten het schoolgeld. Maak nu de cruciale aanname dat mensen met talent een beter leervermogen hebben. Dan zijn voor hen de jaarlijkse kosten relatief laag, met name de immateriële last. Wiskundig geformuleerd: ∂C/∂ap < 0, ofwel ∂²c/∂e ∂ap < 0 15. Met andere woorden, naarmate iemands productiviteit hoger is, wordt het leren goedkoper, en zal die dien ten gevolge meer bereid zijn om langer te studeren. Juist die persoonlijke eigenschap van leergierigheid maakt zijn ap zichtbaar. Zij geeft een signaal, dat met name bruikbaar is voor ondernemers op zoek naar personeel.
Het model verdeelt de individuen in twee groepen overeenkomstig hun productiviteit, te weten apL voor het laag-productieve type L en apH voor het hoog-productieve type H. Dat vereenvoudigt de analyse. Stel de maatschappij bestaat uit N werknemers, waarvan een fractie λ behoort tot het type H. Kennelijk is de gemiddelde maatschappelijke productiviteit gelijk aan apG = λ×apH + (1 − λ)×apL. Dan produceert de maatschappij in totaal N×apG. De ondernemers kunnen de twee typen niet onderscheiden, en betalen daarom aan iedereen een loon w, dat overeenkomt met de gemiddelde productiviteit. Met andere woorden, er geldt w = apG. Merk op, dat in dit model de ondernemers geen winst maken.
Aldus betalen de ondernemers eigenlijk meer aan het type L, dan die waard is. Omgekeerd wordt het type H niet beloond naar prestatie. Dat ergert hen. Het type H komt nu op de vondst om een schoolsysteem in te voeren. De opleiding kan dan signaleren aan de ondernemers, wat H werkelijk waard is. In een maatschappij met een schoolsysteem wordt de individuele nutsfunctie
(18) u(w, v, e, ap) = w(ap) + v(ap) − c(e, ap)
In de formule 18 is w het loon, dat de ondernemers betalen aan de betreffende individu. Als de individu niet werkt, dan krijgt die geen loon. De grootheid v is het nut, dat een werkloze heeft. Eigenlijk is deze term nogal vaag, want hij omvat diverse invloeden. De werkloosheid is op zich weliswaar een leed, maar anderzijds profiteert de werkloze van vrije tijd, van vrijheid en van rust. Bovendien maakt hij aanspraak op allerlei uitkeringen. Daarnaast wordt de mogelijkheid open gehouden, dat de werkloze voor zichzelf begint, en een inkomen opbouwt uit zijn zelfstandige activiteit. De grootheid v compliceert de toestand nogal, omdat bij v>w de individu niet zal willen werken in loondienst. Dit heet de armoedeval. Neem voorlopig v=0.
De formule 18 houdt rekening met de signalering van ap. Het type H kan zijn nut vergroten, indien de kosten voor onderwijs lager zijn dan het extra salaris, dat hij vervolgens krijgt aangeboden op grond van zijn apH. In deze maatschappij met een schoolsysteem kiezen de individuen eerst hun opleiding, waarna vervolgens de ondernemers een functie aanbieden met een bijpassend salaris. De ondernemers hanteren daarbij een geloofsfunctie μ(e), die de kans aangeeft dat de sollicitant van het type H is. Zonet is opgemerkt, dat de ondernemers geloven in een positieve samenhang tussen μ en e. Kortom, ap(e) = μ×apH + (1 − μ)×apL. Dankzij de geloofsfunctie en de formule 18 komt de arbeidsmarkt in evenwicht. Microeconomic theory noemt dit een perfect Bayesiaans evenwicht (zie p.452). Aangezien de individuen en de ondernemingen allebei optimale keuzen maken, heet dit een Nash oplossing.
Men kan het gedrag van de individuen afleiden door hun isonuts curven te beschouwen in het (e, w) vlak: α = w(ap) − c(e, ap), waarin α een vaste nutswaarde weergeeft. Op de isonuts curve is ∂w/∂e = ∂c/∂e > 0, dat wil zeggen, de curve heeft een stijgend verloop. Bovendien verloopt de curve voor het type H wat vlakker dan de curve voor het type L, omdat immers geldt ∂C/∂ap < 0. Concreet betekent dit, dat het type H bereid is relatief veel onderwijs te volgen om wat meer loon te krijgen. Dat tast hun nut niet aan (indifferentie). In de figuur 4 zijn twee isonuts curven getekend in het (e, w) vlak, één voor elk type individu. De twee isonuts curven snijden elkaar in precies één punt e=eo. Als de scholing e langer duurt dan eo, dan is het type H tevreden met een lager loon dan het type L.
Beschouw vervolgens het gedrag van de ondernemers. Aangezien zij geen winst maken, kunnen zij een loon w = ap bieden. Het loon zal liggen in het interval apL ≤ w(e) ≤ apH. Lager accepteren de werkers niet, en hoger zou verlies brengen. Het bod van de ondernemer baseert op diens geloofsfunctie: e → μ(e) → ap(e) → w(e). Het ligt voor de hand, dat μ(e) en dus w(e) een stijgend verloop heeft, want juist op die eigenschap baseert het signaleren. Echter dat hoeft niet te gelden voor alle waarden van e. In Microeconomic theory worden diverse voorbeelden van w(e) gegeven, die dalend zijn in enkele intervallen van e. Uw columnist heeft een dergelijk evenwichtsloon afgebeeld in de figuur 4. Men ziet dat de twee isonuts curven zodanig zijn gekozen, dat zij w(e) juist raken in e=eo. Uiteraard zijn er veel meer isonuts curven voor de typen L en H, maar enkel deze twee zijn relevant voor het huidige betoog.
In de paragraaf over de centrale Bank is gebleken dat signalering kan leiden tot een verenigd (pooling) evenwicht of tot een scheidend (separating) evenwicht. Bij een verenigd evenwicht kunnen de ondernemers nog steeds geen onderscheid maken tussen de typen L en H. Die toestand is voor het type H even ergerlijk als die waarin allen e=0 hebben. Het type H wil juist een scheidend evenwicht. Gelukkig voor het type H komt een verenigd evenwicht enkel voor bij zeer bijzondere looncurven w(e) 16. Bij een scheidend evenwicht kiezen de typen L en H een verschillend aantal jaren onderwijs. De ondernemers kunnen de twee typen onderscheiden, en betalen L en H overeenkomstig hun prestatie respectievelijk een loon apL en apH. Aangezien voor het type L blijkens de formule 18 het onderwijs bij een gegeven loon w = apL enkel het nut verlaagt, zal het kiezen voor c=0, en dus voor e=0. Het type L ziet af van scholing.
Kennelijk start bij een scheidend evenwicht de looncurve bij w(0) = apL. Voor e>0 moet w(e) beneden de isonuts curve van L blijven, omdat anders L een onnodige loonsverhoging zou krijgen. Echter w(e) moet wel ergens haar bovengrens apH bereiken ten einde het type H te kunnen aanwerven. Die mogelijkheid biedt zich bij e=eo, omdat daar de isonuts curve van het type L "buiten beeld" raakt. Het type H wil zijn scholingskosten zoveel mogelijk beperken, en zal daarom juist in dit punt e=eo met een isonuts curve willen raken aan w(e) 17. Voor het type H leidt elke e>eo tot extra scholingskosten, bij een ongewijzigd loon apH. Deze hele samenloop van verlangens resulteert in de situatie, die is weergegeven in de figuur 4. Klaarblijkelijk zijn de twee signalen voor het type L en H respectievelijk e=0 en e=eo. In beginsel kan w(e) van de ondernemer weliswaar de bovengrens apH bereiken voor een e>eo, maar dit evenwicht zou maatschappelijk niet optimaal zijn.
Merk op, dat het type L slechter af is in een maatschappij met een schoolsysteem. Immers de invoering van het schoolsysteem verlaagt hun loon van het gemiddelde apG naar apL. Het type H is enkel beter af, indien er geldt λ < 1 − c/(apH − apL) 18. Als deze drempelwaarde van λ wordt overschreden, dan is ook het type H slechter af in een systeem met signalering. Immers als λ nadert naar 1, dan moeten bijna alle individuen scholing volgen om zich te onderscheiden van de handvol typen L. Dan wordt de scholing een gigantische maatschappelijke kostenpost. Men zou net zo goed de scholing kunnen laten (e=0).
Men zou haast constateren, dat signalering op de arbeidsmarkt toch niet zo een goed idee is. Evenwel verandert de situatie, wanneer men in de formule 18 toelaat dat het nut v(ap) van werkloosheid positief is. Beschouw een situatie zonder scholing en signalering. Dan zal w gelijk zijn aan apG. Stel voorts dat voor alle ap het nut v(ap) groter is dan apG, maar kleiner dan apH. In die situatie zal geen enkel individu willen werken19. Dezelfde situatie doet zich ook voor, indien er weliswaar een schoolsysteem is, maar er een verenigd evenwicht ontstaat. Immers zonet is opgemerkt dat dan iedereen kiest voor e=0.
Echter in deze situatie blijkt een scheidend evenwicht wèl het type H te prikkelen tot werken, omdat die nu zijn type kan signaleren. Immers daardoor wordt w = apH > v(apH). Aangezien het type H een hoger inkomen krijgt, is hij nu beter af. In dit scheidende evenwicht krijgt het type L een loon w = apL aangeboden, en dat is nog steeds lager dan v(apL) > apG. Dus het type L weigert te werken, maar is daardoor niet slechter af dan zonder signalering. Kennelijk verbetert de signalering nu wel altijd het maatschappelijke welzijn. Dat is te danken aan het maatschappelijke vangnet v. Aldus blijken de conclusies van het model voor signalering op de arbeidsmarkt sterk af te hangen van de aannames, waarmee men de redenatie begint20. Nochtans meent uw columnist dat met deze kanttekening toch de idee van signalering een intrigerend element toevoegt aan het inzicht in de arbeidsmarkt.
De huidige column heeft de signalering geanalyseerd voor drie cruciale thema's: de samenzwering in het bedrijfsleven, de ontwaarding van geld, en het maatschappelijke belang van kennis en kunde. De grondslag van de analyse is nog steeds het mensbeeld van de rationele, zelfzuchtige homo economicus. Men zal in de modellen tevergeefs zoeken naar een verzet tegen onrechtvaardigheid, of naar wederzijdse sympathie. Maar wel houden de modellen rekening met de grenzen aan het menselijke weten, en dat is al een hele stap vooruit ten opzichte van de oude orthodoxie.
De modellen laten zien dat men daadwerkelijk de menselijke interactie op het micro-niveau kan vatten in een logisch raamwerk. Overigens moet men de uitkomsten van de modellen niet al te serieus nemen, want die worden grotendeels bepaald door de vooraf gaande veronderstellingen. Wellicht zit het nut van de modellen vooral in de inspanning, die het kost om ze te begrijpen. Onderweg ontdekt men nogal eens dat de uitgangspunten van de theorie weinig meer zijn dan een tamelijk extreme ideologie.