De ondeelbaarheid van zuiver publieke goederen heeft invloed op de prijsvorming. Vaak moeten de kosten worden gedekt met behulp van belastingen. Een wiskundig model van het nut van publieke goederen wordt gepresenteerd. De Pareto optimaliteit wordt niet bereikt. Dit fenomeen is eveneens zichtbaar in het nutsveld van het verzekerings-spel. In de coöperatieve speltheorie is de nucleolus een maat van verdeling. Men kan dit toepassen op kabinets-formaties. Maar er zijn andere maten van verdeling, zoals de BPFN allocatie regel en het model van stabiele partities.
Alvorens het nutsveld van een publiek goed in detail te analyseren, is het wenselijk om de kenmerken van dat goed te recapituleren. Een maatschappij produceert zowel private als publieke goederen. Beschouw een representatief product van beiden, en noem hun hoeveelheden respectievelijk C en G. Stel dat de prijzen p en q zijn voor eenheden van respectievelijk het private en publieke goed. De maatschappelijke situatie beperkt de combinaties (C, G) door een grens van productie-mogelijkheden. Op de grens is de maatschappelijke transformatie-voet MTV gelijk aan de prijsverhouding q/p, die de marginale kosten van G voorstelt1. Echter, de prijs q kan niet worden bepaald door middel van de marktruil, omdat het goed niet exclusief is. Alle n actoren in de maatschappij consumeren dezelfde beschikbare hoeveelheid G. Een actor k kan dus niet zijn consumptie van G afstemmen op de prijs q 2.
Als bij een hoeveelheid G de bereidheid tot betalen (willingness-to-pay) δqk van de actor k wordt genormeerd op p, dan is zij gelijk aan zijn marginale substitutie verhouding (MSV(k)) van het publieke en private goed3. De spreiding in de waarden van δqk wordt allereerst veroorzaakt door de individuele verschillen van smaak. Maar ook het inkomen yk van de actor k heeft invloed, evenals de belasting-voet τk, die wordt geheven om het goed te betalen4. De totaal wenselijke hoeveelheid van het publieke goed moet worden bepaald uit de voorwaarde van Samuelson voor maatschappelijke efficiëntie. Zij luidt
(1) Σk=1n δqk = q
Volgens de formule 1 levert elke actor de bijdrage, die hij uit vrije wil zou betalen voor G. Daardoor is de productie van het publieke goed Pareto efficiënt. Merk echter op, dat de formule 1 niet garandeert, dat de begroting van het publieke goed kosten-dekkend is. Immers, de begrotings-balans wordt bepaald door de totale kosten, en niet door de marginale kosten5. Er is een filosoof-koning nodig (een objectieve waarnemer, een centraal plan-orgaan) om de maatschappelijke efficiëntie volgens de formule 1 te realiseren. De hoeveelheid G is gelijk voor allen, maar de individuele prijs wordt gedifferentieerd6. In de practijk is het natuurlijk onmogelijk, dat de centrale actor aan elke individuele actor k diens prijs δqk rekent voor het publieke goed. De actor k besteedt zijn begroting yk in overeenstemming met zijn behoeften, en met de prijzen p en δqk (of enigerlei andere politieke prijs voor het publieke goed).
De collectieve begrotings-balans voor het goed wordt gerealiseerd door voldoende belasting te heffen7. De simpelste vorm van belasting heffen hanteert een uniforme belasting T = δq×G, waarin δq de gemiddelde individuele prijs q/n is. Als de actor k beschikt over een inkomen yk, dan daalt het vrij besteedbare deel met T. Zijn begroting wordt gegeven door
(2) p × ck + δq × G = yk
De figuur 1a toont het nutsveld van een representatieve actor. De indifferentie krommen zijn in groen weergegeven. Bovendien zijn er begrotings-lijnen ingetekend, in rood, voor twee inkomens yk. Hun helling is -δq/p. De lijn raakt aan een kromme in het optimale G-punt van de actor k. Men ziet, dat een hoger inkomen leidt tot een grotere behoefte aan het publieke goed (en, algemener, ook aan allerlei goederen). Hier blijkt tevens een nadeel van uniformiteit. Immers, de politiek moet het feitelijke aanbod van G bepalen, passend bij T. Blijkens de figuur 1a zal dat aanbod Gpol voor vele maatschappelijke groepen sub-optimaal zijn. Er is een politieke afweging van belangen nodig8.
De situatie van de figuur 1a correspondeert met de realiteit, dat publieke goederen vaak grotendeels worden betaald door de hogere inkomens. De lage inkomens worden toch ontzien. Een alternatieve vorm van belasting heffen is de proportionele belasting-voet, die evenredig oploopt met het inkomen yk van de actor. Een rechtvaardiging is, dat het marginale geldnut van de hogere inkomens lager is dan van de lagere inkomens. Definieer de belasting-voet τ = q×G/Y, waarin Y het nationale inkomen Σk=1n yk is. Dan is de individuele belasting T'k = τ×yk. De totale belasting-ontvangsten dekken juist de kosten van het goed. Enig uitschrijven geeft T'k = (yk/Y) × (q×G) = (n×yk/Y) × T. In dit geval wordt de begroting gegeven door
(3) p × ck + (yk / Y) × (q × G) = yk
De figuur 1b toont opnieuw de begrotings-lijnen voor de twee actoren. Hun helling is -(q/p) × (yk/Y), zodat zij afhankelijk is van het individuele inkomen. In dit geval zijn de behoeften van de lagere en hogere inkomens lastig voorspelbaar, omdat de hogere inkomens in hun behoeften worden getemperd door hun hogere belasting T'k. De figuur 1b toont een situatie, waarin juist een lager inkomen leidt tot een grotere behoefte aan het publieke goed. Ook hier moet de politiek een Gpol kiezen, en daarbij de belangen van de diverse groepen afwegen.
Volgens de speltheorie moet een actor kiezen tussen het wel of niet bijdragen aan een publiek goed. Hij moet besluiten of hij zijn belasting Tk wil betalen ten einde het aanbod van G te realiseren. Men heeft Σk=1n Tk = q×G. Kennelijk kan men Tk ook schrijven als q×gk, waarbij gk het deel van G is, dat wordt betaald door de actor k. Deze schrijfwijze wordt gewoonlijk gehanteerd in de nutstheorie van publieke goederen, omdat die theorie baseert op de individueel geconsumeerde hoeveelheden. De keuze om belasting te betalen verandert dan in de keuze om te voorzien in het goed gk. De speltheorie schematiseert de keuze van de actor k tot gk = 0 of 1. Echter, dit wil niet zeggen, dat hij werkelijk voorziet in een eenheid van het publieke goed. Een burger kan niet op eigen kracht een park, een autoweg, of zelfs een defensie-macht bekostigen.
Kennelijk is het wenselijk om te reflecteren op de deelbaarheid van publieke goederen. Gewoonlijk wordt aangenomen, dat zuiver publieke goederen ondeelbaar zijn. De term "ondeelbaar" drukt uit, dat het goed alleen collectief kan worden geconsumeerd. In die zin is een goed zonder rivaliteit ondeelbaar9. Men gebruikt ook wel de term "gemeenschappelijk" (joint) of, wat minder streng, "klonterig" (lumpy). Ondeelbaarheid is vaak een gevolg van de productie-techniek, maar kan ook optreden door instituties10. Een voorbeeld is straat-verlichting. Natuurlijk heeft elke langs de straat geplaatste lantaarn-paal enig nut. Maar gewoonlijk zijn er technische normen, die het minimum aantal lantaarn-palen vastleggen om de straat veilig te kunnen gebruiken. Die verzameling palen vormt het echte publieke goed.
Als er n huishoudens in de straat wonen, dan zou elk huishouden een fractie 1/n van de palen kunnen leveren, en de corresponderende kosten dragen. Deze bijdrage wordt bedoeld met de voorwaarde gk=1. Natuurlijk komt elk huishouden in de verleiding om niet bij te dragen, omdat daardoor het publieke goed slechts weinig wordt aangetast. Dit is het gevangenen spel. De straat-verlichting zou dan niet meer voldoen aan de technische eisen, en is althans in die zin geen publiek goed meer. Hetzelfde geldt voor een zeedijk, wanneer sommige delen ervan een hoogte beneden de wettelijke normen hebben. In wettelijke zin is er dan zelfs sprake van een verzekerings-spel. De gemengde strategie zorgt al voor enige deelbaarheid van gk. Overigens verwijst die deelbaarheid 0<gk<1 naar de kans, dat wordt bijgedragen aan het goed, en niet naar een klonterigheid. De waarde gk wordt bereikt als een gemiddelde in de tijd11.
De nutstheorie heeft een minder strenge definitie van ondeelbaarheid dan de speltheorie. Net zoals in de niet-coöperatieve speltheorie maakt elke actor k unilateraal zijn nut maximaal. Maar in de nutstheorie is de geaggregeerde hoeveelheid G niet technisch of institutioneel vastgelegd. Daarom kan de actor vrij kiezen welke hoeveelheid gk van het goed hij wil bijdragen. Bovendien beperkt de nutstheorie zich niet tot de analyse van unilateraal gekozen evenwichten. Zij laat overleg toe om het Pareto optimum te realiseren. Het optimum zal gewoonlijk meer gk vergen dan het (Nash) evenwicht. De huishoudens kunnen best meer lantaarn-palen verlangen dan de technische norm. Omgekeerd is een zeedijk ook nog nuttig, wanneer de hoogte beneden de wettelijke norm ligt. Aldus hanteren de speltheorie en de nutstheorie ieder hun eigen perspectief. De analist moet bepalen, welke van de twee het meest geschikt is voor zijn onderhavige probleem.
Het is zinvol om nog eens te herinneren aan de taxonomie van goederen. Volgens deze theorie zijn zuiver publieke goederen ondeelbaar, evenals club goederen. Maar club goederen kunnen wel exclusief worden aangeboden aan leden. De klonterigheid van het club goed heeft de omvang van de club zelf. Een gemeen(schappelijk) goed (common pool resources, CPR) is niet exclusief. Maar aangezien zijn consumptie enigszins rivaliserend is, is het goed niet volkomen gemeenschappelijk. Deze taxonomie houdt nog geen rekening met de aggregatie technologie. De aggregatie koppelt de collectieve baten van het goed aan de omgevings-situatie. Dan wordt deelbaarheid een nogal ongrijpbaar begrip. Bijvoorbeeld, het netwerk goed heeft enige overeenkomst met het zwakkere-schakel technologie. Onwillige buitenstaanders verminderen de waarde van het goed voor het netwerk.
Voor een goed begrip is de illustratie met enkele voorbeelden van dit soort goederen behulpzaam, in aanvulling op het reeds genoemde12. Het toont de grote verscheidenheid aan goederen, die kunnen worden geclassificeerd. Tot het zuiver publieke goed behoren onder andere de zonne-energie (als straling) en de bescherming tegen atmosferische opwarming. Taal behoort eveneens tot deze categorie, en is bovendien een netwerk goed13. Tot het club-goed behoren onder andere de kabel-televisie, de weersvoorspelling via satellieten, collectieve arbeids-overeenkomsten, het onderwijs, theater, tolwegen, tunnels of kennisbanken. De euro munt is een club goed voor staten, en bovendien een netwerk goed. Tot de gemene goederen behoren onder andere drukke autowegen, viswater, weidevelden, of de bestrijding van criminaliteit14.
De ondeelbaarheid van collectieve goederen zou de indruk kunnen wekken, dat de staat moet voorzien in een groot deel van de maatschappelijke consumptie. Dit standpunt is inderdaad met veel vuur verdedigd door het socialisme. Maar het voorgaande betoog is nu juist ook een relativering van de ondeelbaarheid. Veel collectieve goederen kunnen privaat worden geleverd, bijvoorbeeld door clubs en andere collectieve actoren. Dit is ook de essentie van het empirische onderzoek naar CPR van Elinor Ostrom. En vaak zullen individuele actoren bereid zijn om privaat zuiver publieke goederen te leveren, met name wanneer zij het politieke aanbod Gpol onvoldoende vinden. Dit zijn particuliere initiatieven, die zorgen dat de opgelegde belasting-druk van de burgers binnen de perken kan blijven15.
Feitelijk zijn bijna alle goederen op de één of andere manier uitsluitbaar. Veel genoemde voorbeelden zijn tolwegen en de codering van satelliet-TV. Het probleem ligt minder bij de exclusie zelf, dan bij de kosten, die nodig zijn voor uitsluiting16. De kosten van de barrière zijn niet productief. Maar de ontwikkelingen in de techniek en informatica verminderen de kosten van exclusie. Denk aan rekening-rijden of aan kabel-televisie. Merk voorts op, dat bij niet-rivaliteit de marginale kosten van een extra consument gelijk zijn aan nul. Zelfs als uitsluiting mogelijk is, dan ziet men er soms vanaf, omdat de maatschappelijke baten van consumptie zwaarder wegen. Het nadeel is natuurlijk, dat dan de consumptie feitelijk toch wordt gesubsidieerd door anderen. De ontkoppeling van consumptie en bekostiging vermindert de efficiëntie.
Een recente column heeft het nutsveld van actoren ten gevolge van publieke goederen onderzocht. Het bekende boek Public choice III (afgekort PC) van de econoom D.C. Mueller behandelt hetzelfde thema, maar vanuit een iets ander perspectief. Met name worden wiskundige formules gehanteerd, zij het simpele. De recapitulatie van zijn betoog helpt om het inzicht te vergroten17. Beschouw een actor k, die kan beschikken over een privaat goed en een zuiver publiek goed. Zij c en g respectievelijk hun hoeveelheden, en p en q hun prijzen. Substitueer in de formule 2 de expressie q×gk voor δq×G. Als de actor k beschikt over een inkomen yk, dan wordt zijn begroting gegeven door
(4) p × ck + q × gk = yk
Natuurlijk kan q geen marktprijs zijn. Men duidt q wel aan als de belasting prijs. Stel dat de aggregatie van gk verloopt als een sommatie technologie. Als er n actoren zijn, en elk levert een bijdrage gk aan het publieke goed, dan is de totaal beschikbare hoeveelheid gelijk aan G = Σk=1n gk. Defineer gemaks halve G − gk = G-k (let op de min in de index). Het aanbod G-k representeert een extra inkomen voor k, dat hij echter niet vrij kan besteden. Men noemt Rk = yk + q×G-k het volledige inkomen van k. Elke actor beschouwt G-k als een extern gegeven, en kiest daarbij de gk, die zijn eigen nut uk(G, ck) maximaal maakt. Volgens de tweede wet van Gossen moet dan gelden (p.18 in PC)18
(5) ∂(uk/∂gk) / (∂uk/∂ck) = q/p
In de formule 5 kan de afgeleide naar gk worden vervangen door de afgeleide naar G, omdat G-k hier een constante is. De variabele gk wordt bepaald door de productie, en niet door de ruil op de markt. Daarom is de analyse met de Edgeworth box niet bruikbaar. De formule 5 stelt de beste-reactie kromme van k voor bij een gegeven G-k. Daarom definieert de formule 5 het Nash evenwicht van elke k in zijn groep van n actoren.
De eigenschappen van het Nash evenwicht kunnen worden onderzocht door een Cobb-Douglas nutsfunctie uk = Ga × ck1−a in te vullen in de formule 5, met 0 <a < 1 (p.20 in PC). Trouwe lezers van de Gazet herkennen deze functie uit het lineaire systeem van handelen, dat is bedacht door de socioloog J.S. Coleman. Deze aanname maakt de beschouwing minder algemeen, maar vereenvoudigt wel de situatie. Toepassing van de formules 4 en 5 leidt tot (p.20)19
(6) gk = a × yk / q − (1 − a) × G-k = a × Rk / q − G-k
Blijkens de formule 6 zal de actor k minder gk bijdragen, naarmate G-k groter is, of naarmate zijn inkomen yk kleiner is. Zie ook de beschouwing van zonet over de uniforme belasting. Een directe vergelijking met de voorwaarde voor Pareto efficiëntie wordt mogelijk, wanneer wordt gekozen voor een representatieve actor. Of, anders gezegd, alle actoren zijn gelijk, en hebben daarom dezelfde nutsfunctie u en hetzelfde inkomen y. De maatschappij is anoniem, zodat actoren niet onderscheidbaar zijn. In deze situatie is gk = G/n, en G-k = (1 − 1/n) × G. Daardoor versimpelt de formule 6 tot (p.21)
(7) gk = (a / (n × (1−a) + a)) × yk / q
Beschouw eerst weer de maatschappij met n verschillende actoren. De maatschappelijke welvaarts-functie kan worden voorgesteld als W(u) = Σk=1n αk × uk, waarbij de constanten αk het belang van de actor k wegen (p.19)20. Hypervlakken in de n-dimensionale nutsruimte geven de indifferenties van W aan. De centrale planner (of de filosoof-koning, of de ideale waarnemer) wil het nut W maximaal maken binnen de bestaande begroting Y = Σk=1n yk. Dit kan leiden tot een herverdeling van inkomens. De maximalisatie hanteert de methode van Lagrange, en maximaliseert met betrekking tot G en met betrekking tot alle n consumpties ck. Het resultaat is (p.19)21
(8) Σk=1n (∂uk/∂G) / (∂uk/∂ck) = q / p
Merk op, dat (∂uk/∂G) / (∂uk/∂ck) juist de marginale substitutie verhouding (afgekort MSV) is voor een indifferentie kromme van uk in het (G, ck)-vlak. En een eerdere column heeft laten zien, dat q/p juist de marginale transformatie-voet MTV is. Daarom is de formule 8 de voorwaarde van Samuelson voor maatschappelijke efficiëntie, en die is hier dus volledigheids halve nogmaals afgeleid.
Introduceer ook hier de Cobb-Douglas nutsfunctie. En beperk het betoog tot een representatieve actor, zodat alle actoren gelijk zijn. Substitueer de functies in de formule 8, en elimineer de ck met de formule 4. Dan vindt men, dat voor de optimale (meest efficiënte) allocatie moet gelden (p.21)
(9) gk = a × yk / q
Merk op, dat geldt gk = G/n en yk = Y/n. Nu is eindelijk de vergelijking van het Nash evenwicht en maatschappelijke efficiëntie mogelijk. Uit de formules 7 en 9 blijkt, dat gk in het maatschappelijke optimum n × (1−a) + a keer zo groot is als in het evenwicht. Naarmate de groep van n actoren groter wordt, tasten hun persoonlijke keuzes steeds meer de efficiëntie aan. De stabiele situatie ligt ver beneden de welvaart W, die in potentie haalbaar is. Kennelijk verergert de verspilling, naarmate a kleiner is, en dien ten gevolge de actoren meer hechten aan hun private consumptie. Er is onderproductie van G. Dat kan enkel worden gecorrigeerd door instituties aan te brengen.
De voorgaande paragraaf baseert op een sommatie technologie van uitkomsten. Het Cobb-Douglas nut van publieke goederen is evenredig met Ga, waarbij geldt G = Σk=1n gk. De prijs q bepaalt de individuele kosten van het publieke goed. Wegens de Cobb-Douglas functie zijn de individuele baten niet evenredig met gk. Er is een afnemend grensnut van G. Maar zoals is uitgelegd in eerdere columns, leiden sommige aggregatie-technologieën tot een speciale vorm van niet-rivaliteit. Mueller kiest er voor om dit fenomeen te modelleren met de variabele G (p.22 in PC). Het nadeel is dat G dan noch materieel, noch een nut is22. Mueller beschouwt onder andere de beste-poging technologie, die wel wordt voorgesteld door G = maxalle k gk. Voorts kan de zwakste-schakel technologie worden voorgesteld door G = minalle k gk. Kennelijk kunnen deze drie technologieën worden samengevat of gemengd in de formule
(10) G = α × maxalle k gk + β × minalle k gk
Zij n=2 het aantal actoren. Dan is de formule 10 een beste-poging technologie voor β=0, een zwakste-schakel technologie voor α=0, en een sommatie technologie voor α=β. Mueller wil vooral effecten van het zwakste-schakel effect analyseren, en zet daarom β=1 en 0<α≤1. Dan wordt de zwakste schakel (α=0) niet bereikt, maar hij kan wel dicht worden benaderd. Men kan aannemen, dat geldt g1 ≤ g2, zonder enigerlei beperking te introduceren. Dan verandert de formule 10 in (p.23)
(11) G = g1 + α × g2
De technologie van de formule 11 werkt ongunstig door in de begrotings-beperking van de actor 2. De formule 4 wordt y2 = p×c2 + (q/α) × G − q×g1/α. Het publieke goed wordt duurder voor de actor 2, met een prijs q' = q/α, omdat hij marginaal minder bijdraagt aan G (p.23). Zijn begroting wordt afgebeeld in de figuur 2 (in rood). Ter vergelijking zijn ook de begrotings-beperking van actor 1 ingetekend (in groen), en een aantal indifferentie krommen u2(G, c2) (in blauw)23. Voorts geldt nu voor het grensnut van actor 2, dat geldt ∂u2/∂g2 = α × ∂u2/∂G. De hoge prijs ontmoedigt de actor 2 om bij te dragen aan het publieke goed. Maar zolang geldt α>0, behoudt zijn bijdrage boven g1 toch enig nut.
Ook in dit geval is de Pareto efficiëntie interessant. Mueller leidt de corresponderende voorwaarde af met behulp van de restant (leftover) kromme. Het resultaat is (p.24)24
(12) ∂(u1/∂G) / (∂u1/∂c1) + α × ∂(u2/∂G) / (∂u2/∂c2) = q/p
Kennelijk moet in dit geval de voorwaarde van Samuelson (formule 8) worden gecorrigeerd voor de aggregatie technologie.
Veronderstel weer, dat de nutsfunctie een Cobb-Douglas gedaante heeft. Dan kan het Nash evenwicht weer worden berekend door de formule 5 uit te schrijven voor de beide actoren25. Men vindt G = a×Y / (q× (2−a)), met nu Y = y1 + α×y2. Kennelijk wordt de koopkracht (Y) voor G ingeperkt wegens de technologie. De toestand van Pareto efficiëntie wordt berekend met de formule 12. Men vindt G = a×Y/q. Kennelijk is er in de optimale situatie een factor 2−a meer beschikbaar van G dan in het evenwicht. Als de actoren unilateraal handelen, dan is er een onderproductie van G, waardoor de potentiële welvaart niet volledig wordt gerealiseerd.
Volgens een eerdere column correspondeert de sommatie technologie met het gevangenen spel, en de zwakste-schakel technologie correspondeert met het verzekerings-spel. In beide spellen loont het niet om als enige een hoeveelheid gk bij te dragen aan het publieke goed (wegens uk = b − c < 0). Echter het verzekerings-spel onderscheidt zich van het gevangenen spel, doordat een collectieve bijdrage aan het goed méér loont dan opportunistisch parasiteren op de bijdrage van de ander. Met andere woorden, de actoren zullen samenwerken in het verzekerings-spel, maar niet in het gevangenen spel. De vraag is hoe deze aspecten zichtbaar worden in het zojuist gepresenteerde betoog. Merk op, dat daarin de actoren heterogeen zijn. Dat botst met de speltheorie, die een symmetrische situatie beschouwt, met homogene actoren. De nutstheorie en de speltheorie hanteren kennelijk een verschillend perspectief.
Maar wellicht kan de nutstheorie toch iets zeggen over de samenwerking. De argumentatie van uw columnist gaat als volgt. In de nutstheorie van de zwakste-schakel is de bijdrage g2 van de actor 2 groter dan g1, dus per definitie meer dan nul. Anderzijds kost juist voor de actor 2 het publieke goed het meest, namelijk q'>q. Dat geldt des te meer, naarmate α kleiner is. Dus als de actor 2 toch bijdraagt, ondanks zijn hoge kosten, dan zal het waarschijnlijk ook wel lonen voor de actor 1. Kennelijk zullen de actoren samenwerken. Anderzijds, als α nadert naar 1, dan sommeert het publieke goed op de normale wijze. De prijzen q en q' vallen samen. Er is geen logisch onderscheid meer tussen de twee actoren. Er kan geen uitspraak meer worden gedaan over de hoogte van hun bijdragen. Als het nut van de Cobb-Douglas gedaante is, dan zou men blijkens de formule 7 de waarde van de parameter a moeten kennen26.
In een eerdere column zijn voor een systeem met n=2 actoren nutsvelden van het gevangenen- en chicken-spel afgebeeld. De huidige paragraaf hanteert een iets aangepaste methode om voor het verzekerings-spel het nut van publieke goederen te schetsen in een (g1, g2) veld. De 2×2 spelmatrix van het verzekerings-spel is te vinden in een eerdere column. In het spel is de strategie-keuze van elke actor discreet. De actor k kan kiezen uit niet of wel een eenheid van het publieke goed bijdragen. Dit correspondeert met gk = 0 of 1, met k=1 of 2. Bovendien is het spel helemaal symmetrisch in de beide actoren. De strategieën van de actoren leiden tot uitkomsten met een bepaald individueel nut. Gemaks halve worden de nutswaarden van deze spellen ordinaal uitgedrukt, waarbij een oplopend nut wordt aangegeven door u = 1, 2, 3 en 4.
Het spel heeft twee Nash evenwichten, namelijk u = (4, 4) en (2, 2). De overige uitkomsten worden gegeven door de nutten u = (1, 3) en (3, 1). Bovendien kunnen de actoren een Nash evenwicht bereiken, wanneer zij een gemengde strategie hanteren, waarbij ieder met een kans van ½ wel of niet een eenheid van het publieke goed bijdraagt. Dat evenwicht heeft als uitkomst u = (5/2, 5/2), en is dus niet Pareto optimaal. Kennelijk is het evenwicht u = (4, 4) de enige Pareto-optimale uitkomst. Echter, deze bewering moet zorgvuldig worden uitgelegd. Immers, de voorgaande tekst heeft laten zien, dat evenwichten gewoonlijk juist niet Pareto-optimaal zijn. Het spel laat het evenwicht kunstmatig samenvallen met het optimum, door alleen enkel discrete keuzes voor gk toe te laten. Uw columnist neemt nu aan, dat (4, 4), (5/2, 5/2) en (2, 2) inderdaad evenwichten zijn. Het corresponderende nutsveld is weergegeven in de figuur 3a, voor beide actoren.
De indifferentie velden van de actoren 1 en 2 zijn respectievelijk blauw en groen. Merk nogmaals op, dat het spel is symmetrisch is. Het veld van de actor 2 is het gespiegelde van het veld van de actor 1. De krommen zijn getekend, alsof het beste-reactie pad van de beide actoren slingert rondom de lijn g1 = g2. De twee paden zijn weergegeven als stippel-lijnen. Zij kruisen inderdaad de drie Nash evenwichten, die zijn weergegeven als rode punten. De kam van de nutsbergen loopt van (g1, g2) = (0, 0) naar (1, 1). Echter in deze figuur 3a is het onmogelijk, dat de indifferentie krommen van de twee actoren elkaar raken. Dat wil zeggen, een Pareto optimum bestaat hier niet. Het liefst zouden de twee actoren de hoeveelheden gk zo veel mogelijk uitbreiden, binnen de grenzen van hun begroting yk. Kennelijk is het optimum simpel gk = yk/q, voor k=1 en 2.
De figuur 3b toont het (g1, g2) oppervlak, alsof de waarnemer wat meer afstand heeft genomen dan in de figuur 3a. Nu is het gebied buiten de vierkant tussen (g1, g2) = (0, 0) en (1, 1) ook zichtbaar. Beschouw allereerst het gele gebied tussen de twee indifferentie krommen, die het punt (g1, g2) = (1, 1) doorsnijden. In het hele gebied is het nut voor de beide actoren groter dan uk=4. Dus in dit perspectief is het genoemde punt duidelijk niet Pareto efficiënt. Bovendien zijn in het buitengebied de twee reactie-paden zodanig getekend, dat zij zich verwijderen van de lijn g1 = g2. Dat schept als het ware een dal tussen de nutsbergen van de twee actoren. De figuur 3b laat zien, dat in het buitengebied de indifferentie krommen elkaar wèl kunnen raken. Daar is de Pareto efficiëntie wel mogelijk is, zij het op grote afstand van de evenwichten. Zie de rode kromme in de figuur 3b. Kennelijk kiezen de actoren dan toch ook voor enige consumptie van private goederen27.
Een aantal recente columns verdiept zich in de collectieve speltheorie, omdat zij de invloed van de moraal onderzoekt, in de vorm van axioma's. Bovendien kan zij de gevolgen van exclusie door maatschappelijke netwerken analyseren, een thema, dat relevant is voor pogingen tot netwerk sturing. Het uitgangspunt van alle gepresenteerde modellen is de Shapley waarde ζk(N, ν). Er zijn vele toepassingen gepresenteerd, die leiden tot fascinerende inzichten. Nochtans bestaan er theoretische alternatieven voor ζk. Immers, de toedeling van opbrengsten aan de diverse actoren k (k=1, ..., n) is altijd enigszins omstreden, omdat zij een morele afweging is, en dus subjectief. De huidige paragraaf wil enkele van deze alternatieven presenteren.
Een kritiek op de Shapley waarde is, dat zij extern moet worden gedicteerd. Zij ligt gewoonlijk niet in de kern (core) van het spel. Een column van een jaar terug heeft uitgelegd, dat bij een gegeven coalitie-functie ν(C) de kern Γ bestaat uit de verzameling van stabiele nutsvectoren u. Dat wil zeggen, beschouw een verzameling N van n actoren. In de kern is hun strategie-vector s optimaal. Geen enkele van de n actoren kan zich verbeteren, door via de vorming van een coalitie C de realisatie van vectoren u in Γ te blokkeren. Zelfs wanneer de c actoren in de coalitie C in N hun strategieën sk coördineren, dan kunnen zij toch niet voor zichzelf een nuts-opbrengst wk>uk realiseren. De uitkomsten in de kern hebben de billijkheid van het onvermijdelijke. Helaas geeft Γ in het algemeen geen unieke oplossing. Bovendien kan een toevallig unieke oplossing u soms worden afgedwongen door diverse coalities (partities)28. Daarom is de coalitie evenmin uniek. Voorts kan de kern leeg zijn.
Om deze redenen heeft de wiskundige D. Schmeidler de nucleolus bedacht29. De nucleolus ligt in de kern. Binnen de kern wijst hij de unieke oplossing aan. Als de kern leeg is, dan levert de nucleolus toch een unieke oplossing. De nucleolus wordt berekend aan de hand van het nuts-overschot (excess), dat is gedefineerd als
(13) e(u, C) = ν(C) − Σk in C uk  voor alle C in N
In deze formule mag u vrij worden gekozen, zolang hij maar toelaatbaar is. Dat wil zeggen, er moet gelden Σk=1n uk ≤ ν(N). Merk op, dat het overschot bij C=N niet negatief kan zijn. Stel er zijn MC coalities mogelijk. Dan is e op te vatten als een vector met MC componenten. Het overschot heeft een voor de hand liggende betekenis. Als e(u, C) positief is voor een coalitie C, dan kan zij kennelijk een nuts-opbrengst voor zichzelf realiseren, die uitstijgt boven de som van alle uk met k in C. Dit prikkelt C tot verzet tegen u. Anderzijds, als het overschot niet positief is, dan is de vorming van een rebellerende coalitie C zinloos, zodat u in de kern ligt. Als de kern leeg is, dan kan het overschot van de coalitie C positief zijn. De nucleolus is dan de nuts-vector, die de minste prikkels geeft om af te wijken van u 30.
De formule 13 is bedoeld om te toetsen of de nutsvector u de unieke nucleolus is. De toetsing vereist, dat de MC "componenten" e(C) van het overschot worden geordend volgens hun afnemende waarde. Dat wil zeggen, de waarde van de eerste component van e(C) wordt bepaald door de coalitie C met het grootste overschot. De waarde van de tweede component wordt bepaald door de coalitie C' met het op-één-na grootste overschot. Enzovoort. De waarde van de component MC wordt bepaald door de coalitie C'' met het kleinste overschot, bij de gegeven u.
De nucleolus is nu de nutsvector u met het lexicografisch kleinste overschot. In een lexicografische vergelijking van u en w betekent e(u, C) ≤ e(w, C), dat men de componenten van deze twee vectoren vergelijkt, te beginnen bij de eerste, en eindigend bij component MC. Zodra men een component vindt, waar de coalitie C leidt tot e(u, C) < e(w, C), valt w af als nucleolus. De nucleolus wordt dus bepaald door negatieve eliminatie. Aangezien dit een proces van uitproberen is, is het lastig om de nucleolus te vinden.
De huidige paragraaf illustreert de nucleolus aan de hand van kabinets-formaties in het Nederlandse politieke bestel tussen 1980 en 2010 31. Er zijn drie bepalende actoren, namelijk de PvdA, het CDA en de VVD. De confessionelen hebben zich verenigd in het CDA. De VVD is indertijd nog de kleinste partij. De tabel 1 geeft een denkbare coalitie-functie ν(C) voor constellaties met een coalitie C. De waarden hebben geen wetenschappelijke pretentie, maar nodigen uit tot reflectie. Kabinetten met de PvdA hebben een relatief lage waarde, omdat zij minder stabiel zijn wegens haar activisme32. De VVD heeft als kleinste partij enige baat bij de oppositie-rol, omdat zij zich dan ideologisch kan profileren bij de aanhang van het CDA en, in mindere mate, van de PvdA. Dat trekt kiezers aan.
coalitie C | coalitie waarde ν(C) |
---|---|
PvdA-CDA-VVD | 3/4 |
CDA-VVD | 1 |
PvdA-CDA | 5/8 |
PvdA-VVD | 1/2 |
PvdA | 0 |
CDA | 0 |
VVD | 1/8 |
De Shapley waarden voor deze politieke constellatie zijn ζPvdA(ν) = 1/12 en ζCDA(ν) = ζVVD(ν) = 1/3. Echter de nucleolus blijkt uPvdA(ν) = 0, uCDA(ν) = 7/16, en uVVD(ν) = 5/16 te zijn. Het verschil van ζk en uk is maximaal 0.1, op een Pareto optimaal totaal van 0.75. Dat valt mee. De verdelingen tonen allebei de zwakke positie van de PvdA, wat natuurlijk wordt bepaald door de gekozen waarden van ν in de tabel 1 33. Maar kennelijk hanteert de nucleolus toch een andere verdelende moraal dan de Shapley waarde. De nucleolus beloont de diverse actoren naar hun macht, en niet naar hun feitelijke bijdrage aan ν(C). Dit is de ethiek van de orthodoxe homo economicus, die zijn enge eigen belang najaagt. Namelijk, de coalitie van CDA en VVD is duidelijk het meest waardevol. Daarom hebben het CDA en de VVD geen belangstelling om een kabinet te vormen met de PvdA. De PvdA krijgt een waarde van nul. De winnaars krijgen alles.
Des al niettemin (of juist derhalve) oefent de PvdA wel invloed uit op de formatie. Immers zij kan de VVD een waarde van 1/2 bieden in de coalitie, en het CDA kan zelfs 5/8 krijgen. Die alternatieven ondermijnen de formatie van een CDA-VVD kabinet. In de nucleolus zijn de overschotten e(un, C) van een PvdA-CDA kabinet en een PvdA-VVD kabinet allebei 3/16, zodat de PvdA indifferent (neutraal) wordt voor de twee alternatieven. Wegens de PvdA-dreiging met alternatieven kunnen het CDA en de VVD hun optimale waarde van 1 niet realiseren in de nucleolus. De aanwezigheid van de PvdA perkt de beschikbare waarde in (wat ook al duidelijk is uit de waarde ν(N)).
De positieve wetenschap kan geen afweging maken tussen de Shapley waarde en de nucleolus (of de vele andere verdelings-functie). De afweging is een morele keuze. Men hecht aan beloning naar bijdrage, zoals in de Shapley oplossing. Of men hecht aan beloning overeenkomstig de machts-verhoudingen, zoals in de nucleolus. Wel is er een esthetische voorkeur voor de Shapley waarde, omdat alleen zij kan worden berekend uit een formule. Bovendien kan men argumenteren, dat de moraal van de Shapley waarde kan worden gebruikt als een argument in onderhandelingen, waardoor ook zij een machtsfactor wordt. Politici zijn ook homines politici34. Merk tenslotte op, dat de kern Γ(ν) leeg is voor deze coalitie functie ν. Dat maakt de kern minder aantrekkelijk als moreel kompas, en leidde natuurlijk tot de vondst van de nucleolus. Maar zelfs de nucleolus moet hier extern worden gedicteerd, omdat geen enkele coalitie stabiel is.
Volgens de sociale netwerk analyse (SNA) mag een netwerk Λ bestaan uit diverse componenten, die onderling geïsoleerd zijn35. Een component is zelf een (sub-)graaf, dus een kleiner netwerk of zelfs een enkele actor (knoop). In de berekening van de Myerson oplossing μk(ν, Λ) wordt aangenomen, dat al die componenten volkomen autonoom zijn. Maar de econoom M.O. Jackson meent, dat de diverse componenten in een netwerk elkaar toch zullen beïnvloeden. Immers, er is een maatschappelijke dynamiek, waardoor contacten kunnen worden verbroken, en nieuwe contacten kunnen worden gelegd. Jackson verwijt aan de Myerson waarde, dat zij de berekening van waarde alleen uitvoert binnen verbonden (connected) netwerken of grafen36.
Stel bijvoorbeeld er is een verzameling N van n actoren. Uit deze groep kunnen allerlei netwerken λ(N) ontstaan, en elk netwerk (graaf) wordt gekarakteriseerd door zijn componenten (partitie P). Een voorbeeld uit de Nederlandse politiek kan dit verhelderen. De figuur 4a toont de verzameling {PvdA, CDA, VVD}, met n=3, waarbij is verondersteld, dat alleen de drie coalities C met c=2 partners haalbaar zijn. De reden kan zijn, dat men de coalitie zo klein mogelijk wil houden. De contacten zijn in rood aangegeven. De drie netwerken zijn genummerd λ1, λ2 en λ3. Men kan allerlei coalitie-functies ν(C) bedenken, die horen bij deze drie netwerken. Als uw columnist de uitleg goed begrijpt (Jackson is weer akelig beknopt), dan koppelt Jackson de functie-waarde ν aan de grootste component van het netwerk. In de figuur 4a is dat dus C met c=2.
Jackson zoekt nu een netwerk-functie, die de waarde van de verzameling Λ van mogelijke netwerken berekent. Daartoe definieert hij37
(14) η(C, Λ) = maxalle λ in Λ(C) ν(λ)
Kennelijk veronderstelt de netwerk-functie η, dat de component (coalitie) C het netwerk λj zal kiezen met de grootste opbrengst voor zichzelf. Volgens Jackson is in dit geval de juiste verdeling (imputation, toedeling) gelijk aan de Shapley waarde ζk(N, η). Helaas vermeldt Jackson weinig over de axioma's, die deze verdeling funderen. Hij merkt slechts op, dat deze oplossing niet efficiënt is binnen de component, in tegenstelling tot de Myerson oplossing38. Kennelijk mag in dit model waarde worden overgedragen tussen componenten. Jackson noemt zijn oplossing de player-based flexible network allocation rule. Uw columnist maakt er de PBFNA regel van39.
De PBFNA regel zal worden geïllustreerd met het geval van de figuur 4a. Beschouw eerst een coalitie-functie ν1 met waarden van 1 voor alle drie netwerken λk uit de figuur 4a. Men berekent met behulp van de formule 14, dat dan de Shapley waarde wordt gegeven door (ζPvdA, ζCDA, ζVVD) = (1/3, 1/3, 1/3). Jackson argumenteert, dat voor de coalitie-functie ν1 de Myerson oplossing bestaat uit (½, ½, 0) voor λ1, uit (0, ½, ½) voor λ2, en uit (½, 0, ½) voor λ3. Immers, Myerson laat enkel een verdeling toe binnen de component. Zie ook de oplossing voor het jaar 1982 in de column over kabinets-formaties. Jackson vindt dat niet terecht, omdat de geïsoleerde partij altijd kan proberen de bestaande coalitie open te breken, en zelf een nieuwe te vormen. Daarom vindt hij voor de verzameling van netwerken Λ = {λ1, λ2, λ3} de uitkomst (1/3, 1/3, 1/3) logischer.
Beschouw vervolgens een coalitie-functie ν2 met waarden van 1 voor λ1=λ2, en een waarde van 0 voor λ3. Nu berekent men met de PBFNA regel, dat dan de Shapley waarde wordt gegeven door (ζPvdA, ζCDA, ζVVD) = (1/6, 2/3, 1/6). Vergelijk dit met de Myerson oplossing, die bestaat uit (½, ½, 0) voor λ1, uit (0, ½, ½) voor λ2, en uit (0, 0, 0) voor λ3. Ook hier vindt Jackson de oplossing van de PBFNA regel logischer. Uw columnist constateert nog, dat blijkens een eerdere column de PBFNA oplossing voor ν1 gelijk is aan de Shapley oplossing voor het bovenste netwerk in de figuur 4b. En blijkens een eerdere column is de PBFNA oplossing voor ν2 gelijk aan de Shapley oplossing voor het onderste netwerk in de figuur 4b 40.
Uw columnist neemt de kritiek van Jackson voor kennisgeving aan. De PBFNA regel zal in sommige gevallen inderdaad wel nuttig zijn. Overigens moet worden aangetekend, dat de regel kennelijk de transactie-kosten voor het wijzigen van contacten bagatelliseert. In werkelijkheid zijn vooral duurzame contacten kostbaar, omdat zij baseren op vertrouwen. Dat maakt een (sub-)netwerk stabiel.
Kennelijk neemt Jackson aan, dat de actoren onderling onderhandelen over het te vormen netwerk. Anderzijds is in een eerdere column een andere methode voorgesteld om het netwerk endogeen te maken. De actoren kiezen unilateraal hun wens-coalitie (of wens-netwerk). Dit is een niet-coöperatief proces, dus zonder enig overleg. Alleen realistische wensen komen tot stand. Nog een andere methode wordt voorgesteld door de econoom R.A. McCain in diens boek Game theory and public policy (afgekort GP)41. Hij veronderstelt, dat een partitie P de verzameling N van n actoren verdeelt in componenten Cj (j=1, ..., J met natuurlijk J≤n). De coalities Cj zijn ooit contractueel ontstaan uit een onderhandeling. In dynamische situaties kan een subgroep in N ontdekken, dat haar leden er baat bij hebben om een nieuwe coalitie C te vormen. De partitie P wordt daardoor instabiel. Omgekeerd is de eis voor stabiliteit van de partitie P, dat zo een coalitie C niet bestaat.
De benadering van McCain onderscheidt zich van de endogene netwerken en van de PBFNA regel, doordat de nieuwe coalitie C de initiatief-nemer tot verandering is. De tijdsvolgorde van acties wordt relevant. In feite neemt nu het spel de extensieve vorm aan, al volhardt McCain zelf in de normale vorm. De methode van McCain kan het best worden uitgelegd via een voorbeeld. Beschouw het not-in-my-backyard (NIMBY) probleem van beleid. Een regio-beraad van n gemeenten wil collectief een publieke voorziening realiseren, maar wegens de schadelijke effecten op de directe omgeving wil geen enkele gemeente de voorziening zelf huisvesten. De individuele strategie van actor k is huisvesten (s'k) of niet (s''k). Een simpel model stelt het nut zonder voorziening op u0=3. De voorziening levert aan alle gemeenten baten b=3, terwijl de kosten (negatieve effecten) van huisvesting c=4 bedragen42.
In dit model is de aggregatie een ongunstige vorm van de beste-poging technologie, omdat de baten van m voorzieningen (m>1) nog steeds b zijn. Kennelijk is het geaggregeerde netto nut W bij minimaal één voorziening (s') gelijk aan W = Σk=1n uk − n×u0 = n×b − m×c. De optimale hoeveelheid is m=1 43. Maar zij komt unilateraal niet tot stand, omdat geldt b<c 44. Enkel een coalitie C kan de voorziening realiseren, door compensatie te bieden voor de huisvesting. Dit veronderstelt, dat nut overdraagbaar is, bijvoorbeeld via side payments. Maar al kan iedereen winnen dankzij de coalitie C, geen enkele actor wil zitting nemen in C. Beschouw bijvoorbeeld het geval met n=3. Stel dat de partitie P triviaal is, dus {N}. Zij geeft een netto nut W van 0, 5, 1 en -3 voor respectievelijk m=0, 1, 2 en 3. Wegens symmetrie ligt uk = u0 + W/3 voor de hand. Dan is uk maximaal 14/3. Daarom loont het voor de coalitie {3} om N te verlaten. Zij laat N\{3} = {1, 2} achter.
{3} | |||
---|---|---|---|
s' | s'' | ||
{1, 2} | s', s' | 4, 2 | 4, 6 |
s', s'' | 8, 2 | 8, 6 | |
s'', s' | 8, 2 | 8, 6 | |
s'', s'' | 12, 2 | 6, 3 |
De tabel 2 toont de bijbehorende spelmatrix. Er zijn twee Nash evenwichten, te weten (s', s'', s'') en (s'', s', s''). Op deze manier bereikt {3} een waarde u{3}=6. En u{1, 2}=8 is nog altijd beter dan 2×u0. Na compensatie voor de huisvesting krijgen de gemeenten 1 en 2 een nut uk=4. Dit toont aan, dat de partitie {N} niet stabiel is. McCain noemt de waardes in de tabel 2 de partitie functie ρ(Q, C). Hierin is Q de partitie {{1, 2}, {3}}, terwijl C={1, 2} of {3} de componenten van de functie zijn (p.184 in GP). Bovendien wordt de opvolgings-functie (successor) R gedefinieerd als Q = R(P, C) (p.182). In de huidige situatie is dit {{1, 2}, {3}} = R({N}, {3}). Natuurlijk heeft elke gemeente k de optie om N te verlaten. Aldus wordt de partitie functie als geheel ρ({N}, N) = 14, ρ({{1, 3}, {2}}) = ρ({{2, 3}, {1}}) = (8, 6), en ρ({{1}, {2}, {3}}) = (3, 3, 3).
Het is duidelijk, dat de atomaire partitie P = {{1}, {2}, {3}} evenmin stabiel is, omdat twee gemeenten zich kunnen verbeteren door samen een coalitie C te vormen (uk=4 > u0). Nochtans zijn ook de partities {{1, 3}, {2}}, {{1, 3}, {2}}, en {{1, 3}, {2}} niet stabiel. Immers, zij moet de kosten c van de voorziening dragen. Elke gemeente in de coalitie C heeft de prikkel om haar weer te verlaten, in de hoop dat de andere twee gemeenten een coalitie vormen. Dien ten gevolge is de kern van dit spel leeg (p.184). Elke partitie met uitkomsten u kan worden geblokkeerd door een nieuwe coalitie {k} te vormen, waarbij minstens deze gemeente k beter af is. Het blijkt, dat voor de grand coalitie N de nucleolus gelijk is aan un = (14/3, 14/3, 14/3) (p.191). Blijkens de formule 13 is het overschot e(un, {N}, {3}) = ρ({{1, 2}, {3}}, {3}) − 14/3 = 4/3. Dus de nucleolus geeft een positief overschot voor {3}, in overeenstemming met de lege kern.
McCain komt nu met de vondst, dat in hogere zin alle partities behalve de atomaire partitie {{1}, {2}, {3}} toch stabiel zijn (p.192). Namelijk, zonet is geconstateerd, dat er cycli ontstaan tussen de diverse partities. Als bijvoorbeeld {1} de partitie Q={{1, 2}, {3}} opbreekt, dan vormt zich Q'={{1}, {2, 3}}. Echter nu zijn {2} en {3} gemotiveerd om Q' op te breken. Er vormt een partitie Q''. Dit brengt {1} weer terug naar zijn oorspronkelijke nutswaarde. Aangezien {1} deze ontwikkeling kan voorzien, zal hij de partitie Q intact laten. Dit heet rationeel vooruit zien (p.181). Deze duurzaamheid van Q wordt ω-stabiliteit genoemd (p.189).
Wellicht maakt deze column een wat chaotische indruk, omdat er weinig samenhang is tussen de gepresenteerde modellen van coöperatieve speltheorie. Soms kiezen de actoren unilateraal hun netwerk (endogeen model), dan weer vormt een groepje actoren in overleg een coalitie (McCain), of alle actoren tezamen analyseren de mogelijke netwerken (Jackson). De feitelijke reden om de PBFN allocatie regel en de theorie van stabiele partities te presenteren in de huidige column is, dat zij de complexiteit van verdelings-vraagstukken aantonen. De waarden van Shapley, Aumann-Drèze en Myerson zijn niet het laatste woord. Er bestaan enorm veel verdelings-regels, waarbij elk zijn specifieke eigenaardigheden en voordelen heeft. Hier trekt uw columnist de grens voor zichzelf. De Gazet heeft niet de ambitie om een gegevens-bank van verdelings-regels te worden.