De opbouw van theorieën over de maatschappij is welhaast gedoemd om te mislukken. Pogingen om orde te scheppen met behulp van het positivisme hebben geleid tot teleurstellingen. Het constructivisme biedt soms een uitweg. Men moet rekening houden met culturele factoren. Parsons heeft de cultuur ingebouwd in zijn systeem-model. De speltheorie kan handig zijn om gedrag te modelleren. Statistische methoden en analyses zijn essentieel in het positivisme. Maar hun toepassing is lastig, zeker op tijdreeksen, en is eigenlijk een ambacht.
De economische wetenschap gebruikt vooral methoden uit het positivisme. Kenmerkend zijn het streven naar objectiviteit, en het vertrouwen op empirische waarnemingen om de werkelijkheid te achterhalen. Sinds ruim twee jaren verdiept de Gazet zich ook in de bestuurs- en beleidskunde. Zulke analysen maken vaak gebruik van het constructivisme1. De huidige paragraaf wil het positivisme en constructivisme met elkaar vergelijken. Volgens een eerdere blog verdeelt A. Wagner de aanpak van het positivisme in twee stappen2. De analist verzamelt allereerst empirische waarnemingen, en ordent die overeen komstig de aanwezige regelmatigheden. Dit is de inductieve fase. In de tweede stap worden de regelmatigheden vertaald in universele wetten. De wetten worden geverifieerd met behulp van aanvullende waarnemingen. Dit is de deductieve fase.
In beginsel is deze uitleg juist. Echter de kennis-filosoof K. Popper heeft gewezen op enkele onvolkomenheden. Ten eerste begint tegenwoordig een analyse niet meer met willekeurige waarnemingen. Actoren hebben een eigen referentie-kader, en dat geldt dus ook voor analisten. De menselijke kennis is dermate groot geworden, dat de analist al wetten in gedachten heeft bij het doen van empirische waarnemingen. Er wordt gericht waargenomen3. Ten tweede kan een algemene wet nooit werkelijk worden geverifieerd. Een wet heeft de gedaante: als is voldaan aan de verzameling van voorwaarden {A1, ..., AN}, dan is B geldig. Verificatie vraagt dus om waarnemingen bij alle denkbare rand- en begin-voorwaarden An. Dat is practisch onmogelijk. Daarom zal elke algemene wet wel ergens falen, bijvoorbeeld in een alternatieve tijd-ruimte. Volgens Popper kan men enkel een wet weerleggen. Overigens gebruiken verificatie en weerlegging dezelfde soorten waarnemingen.
Het constructivisme vult het eerste commentaar van Popper op een radicale manier in. Aangezien de analist leeft in een eigen groep, zal hij zijn waarnemingen filteren overeenkomstig de moraal van zijn groep. Dat maakt de waarnemingen subjectief. Het lukt niet om de werkelijkheid waar te nemen zonder voor-oordelen. Dit is inderdaad een nuttige waarschuwing4. De ervaring leert, dat kennis vaak cumulatief en lineair toeneemt. Maar soms moet toch oude kennis worden afgedankt. De oude zienswijze blijkt te zeer te beperken, of is ronduit fout. Dan is de opbouw van kennis meer "circulair". Kennelijk varieert het inzicht in de waarheid met de tijd. Het zou inderdaad dwaasheid zijn om dit te ontkennen. Men noemt de aanpak van het constructivisme ideografisch, in contrast met de nomothetische of nomologische aanpak van het positivisme5.
Anderzijds heeft het constructivisme het risico, dat de effecten van willekeur en subjectiviteit worden overdreven6. Immers, de subjectiviteit is onderworpen aan inperkende factoren. Met name maakt de analist deel uit van de wetenschap, die objectiviteit en het vinden van waarheid tot hoogste doel verheft. De analist heeft allerlei werkmethoden tot zijn beschikking om de subjectiviteit in te perken. Trouwens, enige maatschappelijke (subjectieve) druk onder wetenschappers is zelfs wenselijk, omdat dit resulteert in een productieve harmonie en standaardisatie7. Voorts dringt de menselijke natuur in een bepaalde richting, en perkt daarmee de willekeur van analisten in. Immers, het valt op, dat men vele maatschappelijke concepten terug vindt in alle culturen, zoals monogamie of religie. Zij zijn weliswaar maatschappelijk, maar met een biologisch fundament. Daarom bestaan er universaliteiten, ook in de maatschappelijke sfeer.
Een gevaar van het constructivisme is, dat het de analist kan doen geloven, dat wetenschap mag worden bedreven vanuit een bepaald perspectief. Dan laat de analist de objectiviteit vallen, en presenteert zijn bevindingen op een normatieve wijze. De waarheid wordt vervangen door een persoonlijke fantasie8. Des al niettemin kan het constructivisme vermoedelijk nooit helemaal afwezig zijn in de sociologie, economie, of beleids-analyse. Zelfs rationele benaderingen, zoals het actor-institutie kader, houden rekening met de lokale instituties en cultuur. Trouwens, het actor-institutie kader presenteert zich als een paradigma. Het hecht veel waarde aan een gedeelde taal. Overigens, wanneer het positivisme het belang van de begin- en rand-voorwaarden (meer) benadrukt, dan gaat het al lijken op constructivisme.
Tot nu toe heeft de Gazet nauwelijks expliciet aandacht besteed aan het belang van de cultuur voor maatschappelijke processen. Echter, een recente blog heeft laten zien, dat sommige richtingen in de beleids-analyse de cultuur juist aanwijzen als de doorslag gevende factor. Zij putten uit de kennis van de antropologie, die de cultuur als thema heeft. Daarom is het wenselijk, dat ook de Gazet een perspectief op de cultuur ontwikkelt. De institutionele analyse en ontwikkeling (afgekort IAO) van het echtpaar Ostrom neemt een interessant standpunt in. De IAO rekent de regels in de actie situatie nadrukkelijk niet tot de cultuur. De cultuur heeft uitsluitend betrekking op de diverse houdingen of oriëntaties van de actoren. Bijvoorbeeld is het
Houdingen zijn essentieel voor de maatschappelijke ontwikkeling. Denk ook aan tolerantie, openheid, rationaliteit, of empathie, en hun tegendelen. Vertrouwen impliceert een algemeen respect voor collectieve rechten en plichten. Houdingen zijn nauwelijks meetbaar, al heeft de politicoloog R. Putnam wel een index van vertrouwen bedacht, het zogenaamde sociale kapitaal. Aangezien de regels wèl aanwijsbaar zijn, heeft het zin om ze te scheiden van de cultuur. Als de cultuur een bepaalde houding oplegt, dan definieert zij tevens het actor model. Dit kan goed worden geïllustreerd met de speltheorie. Veruit het bekendste spel, ook in de beleids-analyse, is het gevangenen spel (prisoner's dilemma). Dit spel wordt hier nogmaals weergegeven, in de tabel 1. De tabel toont de twee mogelijke unilaterale strategieën sj (j=1, 2) van twee actoren Ak, alsmede het nut uk, dat zij hebben van hun interactie.
oriëntatie | individualisme | solidariteit | ||
---|---|---|---|---|
A2 werkt samen | A2 buit uit | A2 werkt samen | A2 buit uit | |
A1 werkt samen | 1, 1 | -1, 2 | 2, 2 | 1, 1 |
A1 buit uit | 2, -1 | 0, 0 | 1, 1 | 0, 0 |
Stel de nutsfunctie van actor k wordt gegeven door uk = vk + β×v≠k 9. In deze formule zijn vk en v≠k de nauwe eigenbelangen van de twee actoren k en ≠k. Dankzij de kruisterm v≠k in uk weegt de actor k toch het nut van de ander mee in zijn keuzen. De waarde van β bepaalt het actor model. Links in de tabel 1 zijn de beide actoren egoïstisch (β=0). Het Nash evenwicht van de interactie is (0, 0) rechts onder. Helemaal rechts in de tabel 1 zijn zij solidair (β>0, hier β=1). Nu is het evenwicht (2, 2) links boven, en dat is een collectieve verbetering ten opzichte van (0, 0). Kennelijk is de solidaire oriëntatie hier optimaal. Als de maatschappij pluralistisch (divers) is, dan is er interactie tussen egoïsme en solidariteit. De egoïst gedijt, ten koste van de solidaire groep.
Kennelijk bepaalt de culturele keuze voor een bepaalde houding het maatschappelijke evenwicht. De houding is een oplossing voor allerlei problemen van collectieve actie (afgekort CAP), zoals het gevangenen spel. De speltheorie noemt de collectieve keuze voor dezelfde houding een focaal punt. Dat wil zeggen, elke actor gedraagt zich overeenkomstig zijn cultuur, en verwacht wederkerigheid van de anderen. Wederkerigheid is meer een verlangen dan een houding. Dankzij wederkerigheid wordt het gedrag van actoren enigszins voorspelbaar. Dit is rationeel voordelig, maar ook psychologisch. Toch is wederkerigheid niet per se goed. Bijvoorbeeld kunnen twee actoren elkaar bestrijden op leven en dood (met β<<0, zodat uk = -v≠k). Met andere woorden, sommige culturen botsten echt met de menselijke natuur. Zij presteren slechter dan andere culturen. Daarom voelt uw blogger weinig voor constructivisme in de zin van cultuur relativisme10.
Wederkerigheid is niet vanzelf gegarandeerd. Zij moet worden afgedwongen door een sociale controle, die gebruik maakt van positieve en negatieve sancties. De speltheoreticus T.C. Schelling heeft het effect van sancties op een overtuigende manier gemodelleerd. Zonder sancties zijn actoren geneigd tot zwart rijden (free riding, uitbuiting). Negatieve sancties verlagen het nut van de zwart rijdende actor. Naarmate meer actoren bereid zijn om te sanctioneren, wordt zwart rijden steeds minder aantrekkelijk. Er is een kantelpunt, waarna geen enkele actor nog zal zwart rijden11.
Actor-institutie kaders nemen aan, dat de cultuur inwerkt op de actie arena of constellatie. De socioloog T. Parsons meent, dat de maatschappij is opgebouwd als een rollen-structuur. Rollen moeten zich voegen naar de heersende cultuur. De IAO van het echtpaar Ostrom spreekt van posities in plaats van rollen. De mogelijke strategieën en de evaluatie van de uitkomsten van interacties zijn eveneens cultureel bepaald. Hetzelfde geldt voor de wijze van besluitvorming. Daarom maakt de bestuurskundige F.W. Scharpf onderscheid tussen de verschillende vormen van collectieve besluiten. Een cultuur kan de besluitvorming overlaten aan netwerken, of aan verenigingen, of hiërarchieën enzovoort. Kennelijk stelt de verzameling van houdingen in de cultuur grenzen aan de regels in de actie arena. Uw blogger vindt dit een zinvol perspectief op cultuur12. Dan moet het systeem van maatschappelijke regels worden geïdentificeerd met de instituties, inclusief de moraal.
Tenslotte moet worden opgemerkt, dat het zoeken naar culturele effecten in processen eigenlijk een blijk van machteloosheid is. Juist om deze reden was de cultuur tot heden afwezig in de Gazet. De socioloog J.S. Coleman wees er op, dat men de cultuur niet meer kan verklaren, wanneer zij als gegeven is verondersteld13. Het bestaan van een cultuur suggereert een determinisme van gedrag. Wie de ontwikkeling en de bestendiging van de cultuur wil begrijpen, moet starten met een actor model, dat nog vrij is van cultuur. Dit is het standpunt van het methodologisch individualisme. Helaas heeft een eerdere blog laten zien, dat het verklaren van de cultuur vanuit een actor model een gigantische taak is, die nog in zijn kinderschoenen staat. Soms is culturalisme onvermijdelijk, met name wanneer andere perspectieven niet werken. Zie verderop in deze blog de systeem-theorie van Parsons.
Het concept van cultuur in de IAO kan worden verhelderd door de systeem-theorie van Parsons te beschouwen14. Parsons is een culturalist, die focusseert op de maatschappelijke moraal. Hij karakteriseert een maatschappelijk systeem door de AGIL functionele sub-systemen15. Hier staat A voor de functie van aanpassing. Het maatschappelijke systeem heeft steeds voldoende middelen nodig om te kunnen overleven. G staat voor de functie van doel-formulering van het systeem. Dit is de taak van de politiek en het bestuur. I is de functie van systeem-integratie, en schept samenhang. En L heeft als functie om de (latente) systeem-cultuur te bestendigen. Het is interessant om te zien, dat ook Parsons de cultuur (L) opvat als een verzameling van houdingen. De vier functionele sub-systemen en hun interacties zijn afgebeeld in de figuur 1b.
Als men de systeem-theorie van Parsons wil vergelijken met de institutionele analyse, dan kan het A-systeem worden opgevat als de actie arena (zie figuur 1a). Het is verantwoordelijk voor de productie van materiële welvaart. Parsons beschouwt alleen het macro-niveau, en verdiept zich niet in de handelingen van individuele actoren. Het G-systeem bevat de formele instituties van de maatschappij, en met name de staat, maar ook bijvoorbeeld de centrale bank. Hier zetelt de macht. De staat reguleert de overige drie systemen, en bepaalt de verdeling van de rijkdom. Het I-systeem bevat de informele instituties, die zorg dragen voor de groeps-controle. De groepsdruk bevordert, dat actoren zich conformeren aan de heersende groeps-moraal. Dit is het kennis-gebied van de sociale psychologie. Ook zorgt het I-systeem, dat de collectieve actoren doelmatig worden georganiseerd.
Men kan het G- en I-systeem tezamen opvatten als de zeven categorieën van regels in de IAO (zie figuur 1a). Op die manier vindt men alle concepten van de IAO terug in de systeem-theorie. Het is interessant, dat de systeem-theorie de interacties tussen de (sub-)systemen expliciet omschrijft, in tegenstelling met de IAO. Bijvoorbeeld helpt het I-systeem om de A- en G-systemen doelmatig te organiseren. En het A-systeem (zeg, de actie arena) levert de middelen aan voor de GIL-systemen. Hoewel het L-systeem nogal ongrijpbaar lijkt, is zijn functie essentieel. De houdingen van de actoren hebben wel degelijk consequenties voor de andere subsystemen. De cultuur bepaalt de inhoud van de informele instituties, zoals symboliek, in het I-systeem. Ook moet de cultuur zorgen voor de legitimiteit van het G-systeem.
Volgens Parsons en Smelser wordt het L-systeem belichaamd door de bevolking zelf. Dit heeft tot verrassende consequentie, dat het L-systeem de arbeidskrachten levert voor de actie arena (A). Zie de figuur 1b. Overigens moet men voorzichtig zijn met deze aanname, omdat elke bevolking enigszins pluralistisch is. Het is dubieus of de vergelijkende analyse van staten op basis van hun nationale cultuur iets zinnigs oplevert16. Men moet trouwens de AGIL-systemen zien als abstracte concepten, en niet als concrete groepen17. Bijvoorbeeld handelen collectieve actoren in het A-systeem, maar zij hebben het I-systeem nodig om intern stabiel te blijven. Dit zijn allemaal aspecten, die niet expliciet ter sprake komen in de institutionele analyse van Ostrom. Het culturalisme moedigt aan om rekening te houden met menselijke houdingen. Dit onderstreept nogmaals de wenselijkheid van triangulatie.
Er moet een opmerking worden gemaakt over het functionalisme in de systeem-theorie van Parsons. Parsons analyseert de maatschappij steeds op het macro niveau. Hij ziet het systeem als een organisme, dat moet beschikken over functionaliteiten om te kunnen overleven. Het is direct duidelijk, dat het voortbestaan van een collectief vraagt om aanpassing, doelgerichtheid en (voldoende) integratie. De functionaliteit van cultuur is minder vanzelf sprekend. Als uw blogger Parsons goed begrijpt, dan definieert de cultuur de verwachtingen en inschattingen van de actoren. Mensen kunnen niet in een cultureel vacuum handelen18.
De socioloog Merton maakt enkele interessante opmerkingen over functionaliteit19. Hij stelt, dat sommige culturele activiteiten enkel ten goede komen aan een sub-systeem in het totale systeem. De functionaliteit is beperkt in reikwijdte. Dit geldt zeker in een pluralistische maatschappij20. Volgens Merton zijn culturele activiteiten soms nutteloos, en kunnen dan natuurlijk worden afgeschaft. Functies kunnen elkaar zelfs tegenwerken. Men kan hoogstens constateren, dat het waargenomen stelsel van functies het systeem in stand houdt. In een extreme situatie is er dys-functionaliteit. Dit prikkelt tot een systeem-verandering. Aldus relativeert Merton eigenlijk de analytische betekenis van het functionalisme21.
Het is niet eenvoudig om het functionalisme van Parsons en Merton terug te vinden in de actor-institutie analyse. De actie arena van de IAO probeert om problemen van collectieve actie (afgekort CAP) op te lossen op het macro niveau, net zoals het systeem van Parsons. Maar de drijvende kracht achter een CAP zijn de des-betreffende actoren op het micro niveau. Zij beoordelen de situatie aan de hand van hun persoonlijke nutsfunctie. En zij nemen persoonlijke of collectieve beslissingen over de inzet van hun middelen en rijkdom22. Aldus ligt de functionaliteit in het actor-institutie kader vooral op het micro niveau. De functionaliteit van het systeem kan enkel worden afgeleid door de micro-functionaliteiten te aggregeren. Een systeem-functie zou kunnen worden gerealiseerd door een collectief gedrags-patroon (wel meme genoemd) Op die manier kan men toch de systeem-prestaties analyseren. Men komt dan op het terrein van de evolutionaire speltheorie.
De speltheorie geeft een nauwkeurig schema van het gedrag van de actoren in de actie arena. Dit geldt met name voor de extensieve vorm van het spel. Stel bijvoorbeeld, dat de politiek een beleid moet formuleren om een bepaalde doelgroep te beïnvloeden. Zie de figuur 2 voor het betreffende spel in extensieve vorm. Kennelijk zijn er twee actoren, te weten de politiek en de doelgroep. Echter, de politiek wil een zodanig beleid formuleren, dat het steun krijgt van de kiezers. Stel dat de politiek enkel een vermoeden heeft van de voorkeur van de kiezers. De politiek denkt, wellicht op basis van opinie-peilingen, dat de kiezers een voorkeur K1 hebben met kans p, of een voorkeur K2 met kans 1 − p. De speltheorie duidt een ongrijpbare actor, zoals de kiezers, aan met de term natuur23. Het electoraat is een passieve factor in het spel. Hun voorkeur wordt enkel duidelijk in het nut van een bepaalde uitkomst voor de politiek.
Het electoraat zit in de wortel van de spelboom. De politiek weet niet welke situatie de kiezers scheppen, en moet rekening houden met K1 en K2. Men noemt elke situatie een (keuze-)knoop (node) in de boom. De groene omhullende in de figuur 2 drukt uit, dat in beide knopen de politiek beschikt over dezelfde kennis. De omhullende wordt de informatie verzameling genoemd24. De politiek overweegt in beide situaties dezelfde drie beleids-alternatieven B1, B2 en B3. Één van deze alternatieven krijgt steun van een democratische meerderheid in de volksvertegenwoordiging, en wordt uitgekozen. Tenslotte moet de doelgroep van het beleid besluiten, of zij het alternatief wil accepteren (A) of verwerpen (V). Het besluit van de doelgroep leidt naar een eind-knoop van de boom. De eindknoop is een uitkomst, die een nut uP heeft voor de politiek en uG voor de doelgroep. In dit geval zijn er 12 uitkomsten mogelijk.
Afgezien van de exacte voorkeur van het electoraat is alle informatie in het spel vooraf beschikbaar voor de politiek en de doelgroep. Deze informatie omvat ook de spelregels. Dien ten gevolge kunnen zij hun optimale strategie al bepalen bij de aanvang van het spel. Hetzelfde geldt voor de analist van beleid. Interessant aan deze representatie van de actie arena is, dat men er de zeven variabelen van de IAO in herkent. De participanten zijn de natuur (kiezers), de politiek, en de doelgroep. Zij hebben eigen posities in het spel. Er zijn strategieën of acties Kj (met j=1, 2), Bm (met m=1, 2, 3), A en V. De informatie is duidelijk gedefinieerd. Elke actor heeft zijn eigen wijze van besluitvorming. De diverse combinaties van strategieën leiden tot uitkomsten, die op hun waarde worden beoordeeld door de politiek en de doelgroep.
Een bijzonder geval van het spel in extensieve vorm treedt op in de beslissings-analyse. Hier speelt de actor enkel tegen de natuur en tegen zichzelf. Zijn tegenspeler is dan hijzelf in een latere fase. Het schema wordt nu een beslissings-boom genoemd25. Concluderend: kennelijk is het spel in extensieve vorm een goede manier om de rationele en cognitieve aspecten van het actor-institutie kader te onderzoeken. Maar toch wordt de speltheorie nog weinig toegepast in de practijk van de beleids-analyse. Meestal ontbreekt eenvoudig de informatie om het schema van de figuur 2 in detail uit te werken.
Het spel in normaal-vorm van de tabel 1 is een leerzaam model van de cultuur. Maar het is enkel bruikbaar voor simpele situaties. Het aantal maatschappelijke evenwichten is beperkt, en de actoren besluiten unilateraal, zonder coördinatie. Een eerdere blog heeft aangetoond, dat in zulke situaties de uitkomst sub-optimaal is. Coördinatie geeft betere resultaten. De Gazet heeft twee cultuur-modellen van coördinatie uitvoerig onderzocht, te weten de markt-cultuur van de socioloog Coleman en de corporatisme-cultuur van de wiskundige Binmore. In de markt-cultuur is het zaak-eigendom rn van elke actor n gegeven, zeg wegens zijn maatschappelijke rol. De maatschappelijke waarde vk van elke materiële of immateriële zaak k moet worden vastgesteld door het collectief, dat daarmee tevens het evenwicht van de cultuur selecteert. Maar de actoren zijn pluralistisch in hun voorkeuren. Zij optimaliseren hun tevredenheid door onderling hun zaken te ruilen.
In de corporatisme-cultuur wordt onderhandeld over de verdeling. Kenmerkend is de onderlinge empathie van de actoren. Daarom verlangt hun cultuur, dat alle zaken egalitair (in gelijke proporties) worden verdeeld. Het corporatisme kent aan elke actor n een deel toe, dat evenredig is met zijn maatschappelijke waarde wn. De waarde wn van de actoren is bepaald in een collectief overleg, dus op culturele gronden. Bovendien wil de corporatisme-cultuur expliciet de collectieve welvaart optimaal maken. Aldus wordt ook hier het evenwicht van de cultuur geselecteerd. De grondslagen van de markt-cultuur en corporatisme-cultuur zijn duidelijk verschillend. De markt-cultuur is gegrond op het zaak-eigendom rn van actor n, en de corporatisme-cultuur is gegrond op de collectieve waardering wn voor actor n. Een blog heeft aangetoond, dat ze inderdaad leiden tot verschillende verdelingen van de maatschappelijke welvaart, en dus tot verschillende evenwichten.
Voorgaande blogs beschrijven de taxonomie van modellen van De Swaan, en de taxonomie van gegevens van Lijphart. Volgens het positivisme geeft het experiment de meest nuttige en volledige gegevens. Wanneer deze ontbreken, dan neemt men genoegen met statistische gegevens. De huidige paragraaf verdiept zich verder in statistische methoden. In een voorgaande blog is al de coëfficiënt van determinatie rxy² gedefinieerd. In dit intermezzo zal worden uitgelegd, hoe de coëfficiënt kan worden geïnterpreteerd. Stel y is de afhankelijke variabele, en er zijn xm onafhankelijke variabelen (m=1, ..., M). Er zijn N waarnemeningen beschikbaar. Dit impliceert, dat de waarnemingen kunnen worden opgevat als N×1 vectoren. Zij de schatting van yn 26
(1) y'n = Σm=1M am×xmn
Dat wil zeggen, de vector y' wordt uitgedrukt in een combinatie van de xm. De xm omspannen een ruimte S(X). De fout in de schatting is e = y−y'. De lineaire kleinste kwadraten methode maakt e†·e minimaal, te weten de lengte |e| van de vector e († staat voor de getransponeerde matrix of vector). Dit impliceert, dat de vector van y' naar y loodrecht op de ruimte S(X) moet staan. Dan is y' de projectie van y op S(X). Dit is weergegeven in de figuur 3a voor het geval M=1, te weten de enkelvoudige regressie27.
De precisie van de schatting y' hangt af van de omvang van de ruimte S(X). Idealiter zijn alle belangrijke variabelen opgenomen in S(X). Dan nog zal gelden |e|>0, omdat y een toevals-component heeft. Als de analist variabelen weglaat uit zijn model, dan leidt dat tot andere waarden van de parameters am. Namelijk, de vectoren xm zijn gewoonlijk niet onderling loodrecht. Dien ten gevolge is bijvoorbeeld de correlatie coëfficiënt rx1,x2 ongelijk aan nul. Dit is schematisch weergegeven in de figuur 3b. Met andere woorden, de invloed van x2 op y kan deels worden verklaard met behulp van x1. Dus zelfs wanneer x2 wordt weggelaten uit het model, dan nog wordt die deels in rekening gebracht door x1. Zij a de vector van geschatte parameters van een model met M=2, en b de model-parameter voor M=1. Men kan aantonen, dat moet gelden28
(2) b = a1 + P × a2
Men zegt ook wel, dat elke toegevoegde onafhankelijke variabele xm in het model een direct effect heeft, en een indirect effect. In de formule 2 is het directe effect van x1 de term a1. Het indirecte effect is de term P×a2, en drukt uit, dat de waarnemingen van de variabelen x1 en x2 zijn gecorreleerd. Als hun coëfficiënt van determinatie groot is, dan spreekt men van multi-collineariteit29.
Blijkens de eerdere blog over de statistische analyse kan de coëfficiënt van determinatie worden berekend als30
(3) rxy² = 1 − e† · e / Σn=1N (yn − y*)²
In de formule 3 is y* het gemiddelde van de yn. Vaak schrijft men kernachtiger rxy² = 1 − SSE / SST. Volgens de formule 1 maakt de multipele regressie een schatting y', die een functie is van de vectoren xm. Dan geldt dat eveneens voor e. Daarom moet rxy² hier worden opgevat als een functie van alle xm tezamen (misschien zou ryy'² een duidelijkere schrijfwijze zijn). De interpretatie van rxy² is nu ook duidelijk: de coëfficiënt van determinatie is het percentage in de steekproef y, dat wordt verklaard dankzij het regressie-model y', die rekening houdt met de waarnemingen van de variabelen xm.
Merk op, dat rxy² in de formule 3 dichter naar 1 nadert, naarmate meer onafhankelijke variabelen worden toegevoegd. Als zou gelden N=M, dan is de formule 1 een perfecte schatting. Maar dit is schijn, want in werkelijkheid hebben de y waarnemingen ook een toevals-component31. Het model deugt enkel, zolang de analist een N kiest, die groter is dan M. Om die reden hanteert men gewoonlijk de aangepaste coëfficiënt van multipele determinatie32
(4) (rxy*)² = 1 − (1 − rxy²) × (N − 1) / (N − M)
De coëfficiënt van multipele determinatie wordt ook gebruikt om te controleren of de regressie zinvol is. Wegens de formule 3 laat een grote rxy² zien, dat de fouten van de schatting gering zijn. Echter men wil ook zeker zijn, dat sommige am significant verschillen van nul. Dit wordt gecontroleerd met de F-toets. De F statistiek is voor dit geval33
(5) F = (N − M) × rxy² / ((M − 1) × (1 − rxy²)
De analyse zal geen significant van nul verschillende am opleveren, wanneer de F-waarde van de steekproef te klein is. Dien ten gevolge moet men allereerst de F-waarde van de regressie toetsen. De kritische F-waarde hangt af van het niveau van significantie, dat men nastreeft. De analist kan beschikken over tabellen, die de kritische F-waarden weergeven als functie van de significantie, N en M.
Een eerdere blog heeft de statistische analyse van tijdreeksen onderzocht. De tijdreeks bestaat uit waarnemingen op tijden t=1, ..., T. De afhankelijke variabelen zijn y(t), en de onafhankelijke variabelen zijn x(t). Het gebeurt nogal eens, dat de waarde y(t) afhankelijk is van sommige voorgaande waarden y(t−k), met k = 1, ..., t−1. Men noemt dit een auto-correlatie of seriële correlatie. De oorzaak kan een trend zijn in de tijdreeks y(t), of een relatie tussen y(t) en x(t−k). Dan heeft de y(t) een auto-correlatie coëfficiënt rk van de k-de orde, die duidelijk afwijkt van nul. Bovendien kan y(t) dus ook correleren met x(t−k). Het optreden van auto-correlatie wordt vastgesteld door te toetsen met de Durbin-Watson statistiek. Als er auto-correlatie is, dan moeten de model-parameters worden geschat met een aangepaste methode. Een optie is het model van Cochrane-Orcutt34.
Seriële correlatie impliceert, dat de stoortermen ε(t) in het regressie model zijn gecorreleerd. Bijvoorbeeld kan men aannemen, dat geldt
(6) ε(t) = ρ × ε(t−1) + η(t)
De η(t) term is stochastisch verdeeld. Dit heet een auto-regressie model van de eerste orde (afgekort AR(1)). Als dit wordt gecombineerd met de formule 1, dan vindt men het model
(7) y(t) = ρ × y(t−1) + Σm=1M αm×xm(t) − ρ × Σm=1M αm×xm(t−1) + η(t)
In de Cochrane-Orcutt methode worden de αm en ρ geschat via iteratie. In de eerste stap wordt ρ=0 gezet in de formule 7. De αm worden geschat met de gebruikelijke regressie van de gegevens uit de steekproef. De residuen in de schatting zijn e(t) = y(t) − Σm=1M am×xm(t). Zij worden gebruikt in de tweede stap om ρ te schatten via de regressie van de formule 6. Zij ρ' de schatting. Vervolgens worden de stappen iteratief herhaald, met als nieuwe variabelen y(t) − ρ' × y(t−1) en x(t) − ρ' × x(t−1). De iteratie gaat net zolang door, tot de geschatte waarden am en ρ' zijn geconvergeerd. Merk op dat er termen Δy(t) = y(t) − y(t−1) en Δxm(t) = xm(t) − xm(t−1) verschijnen in de formule 7. Dit zijn de snelheden van verandering in xm en y.
In een eerdere blog is geprobeerd om het tekort op de Nederlandse begroting statistisch te verklaren aan de hand van de rentevoet voor eeuwig durende staats-leningen. Dit liep vast op het probleem, dat de rentevoet wordt beïnvloed door de inflatie. Nu zal alsnog worden geprobeerd om deze invloed te elimineren uit de rentevoet. De tijdreeks voor de rentevoet komt van de onbewerkte gegevens van het Centraal Bureau voor de Statistiek (CBS)35. Hier wordt ook de tijdreeks van de inflatie overgenomen van de CBS website36. De figuur 4 toont het verloop van de twee tijdreeksen, tezamen met het verloop van de werkloosheid37. De figuur toont duidelijk, dat de rentevoet en de inflatie correleren. De figuur 5 toont dezelfde gegevens in een strooi diagram. De statistische berekeningen zijn uitgevoerd met het gegevens-bestand programma Quattro Pro. De correlatie coëfficiënt blijkt 0.71 te zijn voor de periode 1963-2002.
De analyse van tijdreeksen is lastig, omdat de onderzochte variabelen gewoonlijk een trend vertonen. Dit blijkt ook uit de figuur 4. Zij y(t) de rentevoet en x(t) de inflatie in jaar t, dan krijgt de schatting van het regressie model de gedaante y(t) = b + a×x(t) + e(t). In deze formule is e(t) de fout van de schatting. De statistische berekening voor 1963-2002 levert op b=4.65 en a=0.342, met een significantie op het 1% niveau. Maar dit resultaat is potentieel misleidend. Immers, het model is enkel toepasbaar, zolang de waarden van de fouten op een toevallige manier zijn gespreid. Men kan de zogenaamde Durbin-Watson toets gebruiken om te controleren, of dit inderdaad het geval is. De DW waarde voor 1963-2002 blijkt DW=0.71 te zijn. Via raadpleging van de DW tabellen kan men aantonen, dat bij N=40 waarnemingen de fouten helaas serieel gecorreleerd zijn. Het regressie model voldoet dus niet aan de eisen.
Daarom is de schatting opnieuw uitgevoerd, nu met de Cochrane-Orcutt methode. De regressie van de fouten schat de waarde van ρ op ρ' = 0.624. Vervolgens worden b en a voor de tweede keer geschat in een regressie. Het resultaat is b=2.09 en a=0.132. De schattingen zijn significant op het 5% niveau. Vervolgens wordt de iteratie voortgezet. Maar de tweede regressie op de fouten geeft geen significante relatie tussen e(t) en e(t−1) meer. Ter illustratie toont de figuur 6 de fouten van de modellen bij de eerste en tweede iteratie. Merk op, dat het gedrag van de fouten varieert per tijds-interval, vooral ten gevolge van de grillige inflatie. De verschillen tussen de twee iteraties zijn gering, voor het ongeoefende oog38. Des al niettemin is de DW waarde van de tweede iteratie 1.54, wat net boven de kritische waarde ligt. Aldus is het resultaat van de schatting
(8) y'(t) = 2.09 + 0.624 × y(t−1) + 0.132 × x(t) − 0.0822 × x(t−1)
Dit resultaat is fascinerend, en lastig om te interpreteren. De rentevoet van het vorige jaar blijft sterk present in de huidige rentevoet. Het eerste regressie model werkte niet goed, omdat de invloed van y(t−1) op y(t) niet louter komt door inflatie-schommelingen. Natuurlijk heeft de inflatie x(t−1) van het vorige jaar wel een zekere invloed op y(t−1). Evenzo zal de huidige inflatie x(t) leiden tot variatie van de rentevoet. De laatste twee termen in de formule 8 beschrijven het effect van inflatie39. Het niveau van de huidige inflatie verhoogt de rentevoet. Opvallend is dat de stijging van de inflatie (Δx(t) = x(t) − x(t−1)) eveneens de rentevoet verhoogt. Voorts schept de sterke correlatie van alle variabelen in het rechter lid van de formule 8 het probleem van multi-collineariteit. Dan hebben de waarden van de geschatte parameters een inherente onzekerheid. Zo belandt men van de regen in de drop, en de formule 8 is te complex om conclusies te trekken over de reële rentevoet.
Er is nog een tweede reden om de inflatie te beschouwen. Immers, her en der in de Gazet is vaak het model van de Phillips kromme toegepast. Economen gebruiken deze kromme zelfs heden nog vaak om het verband tussen de werkloosheid en de loon-stijgingen te beschrijven. Toch is de kromme controversieel. Een blog van zes jaren terug liet al zien, dat de Phillips kromme kan verschuiven in de tijd, en daarom op de langere termijn eigenlijk geen kromme is. Dit kan opnieuw worden aangetoond met de gegevens van de figuur 7. De figuur 7 toont het strooi diagram van de werkloosheid en de inflatie voor 1955-2004. Deze periode is opgesplitst in zes perioden van telkens tien jaren. Aldus vindt men zes Phillips krommen, weergegeven in verschillende kleuren. De corresponderende decennia worden weergegeven in de legenda van de figuur (daar is het startjaar aangegeven).
De Phillips kromme wordt gewoonlijk weergegeven als een dalende lijn of kromme. Een lage werkloosheid drijft de lonen op, en schept inflatie. Veel werkloosheid stabiliseert de lonen, en houdt daarmee de product-prijzen constant. Blijkens de figuur 7 ontbreekt dit verband in de decennia 1955-1964 en 1965-1974. Wellicht is de reden, dat indertijd de staat nog kiest voor een geleide loon-politiek. Merk nochtans op, dat in 1965-1974 de cluster van punten al omhoog is geschoven. Het decennium 1975-1984 laat wel een soort Phillips kromme zien, maar hoger gelegen dan de clusters in de voorgaande decennia. Dan ontstaat de loonvorming al in een marktproces. Vanaf 1985 zijn de punten weer flink omlaag geschoven, en vormen tezamen een ongeveer constante kromme. In 2005-2014 vindt men zelfs een horizontale lijn. De figuur 7 illustreert, dat de Phillips kromme weliswaar geen onzin is, maar als model zorgvuldig moet worden toegepast.
Uw blogger heeft diverse tijdreeksen uit eerdere blogs onderzocht met de regressie analyse. Helaas blijken al deze gevallen te lijden aan een seriële correlatie, net zoals in de zonet behandelde casus van de rentevoet. Toepassing van de Cochrane-Orcutt methode produceert complexe modellen, die geen duidelijke interpretatie hebben. Deze paragraaf werkt zo een model uit, ter illustratie van de problemen. De casus is de investerings-quote, die grafisch is onderzocht in een eerdere blog. Neem deze als afhankelijke variabele y(t). Als onafhankelijke variabelen worden de economische groeivoet x1(t) en de reële rentevoet x2(t) gebruikt. Hier wordt de reële rentevoet berekend door de inflatie af te trekken van de genoemde nominale rentevoet. Dat is enigszins speculatief, omdat het eeuwig durende staats-leningen betreft. Maar uw blogger heeft niets beters. De periode is 1970-2002. Zie de figuur 8 voor y(t) (neer-geschaald op de y-as met een factor 5), x1(t) en x2(t).
Er is nu een statistische analyse uitgevoerd, uiteraard weer met het programma Quattro Pro. De analyse hanteert verschillende ruimten S(X) van de onafhankelijke variabelen, te weten M=1 en 2. De resultaten zijn weergegeven in de tabel 2 40. Men ziet, dat een model inderdaad meer verklaart van y(t), naarmate M toeneemt. Helaas laat zelfs het meest uitgebreide model van M=2 toch nog 36% van y onverklaard! De tabel toont de waarden van de geschatte model-parameters. De interpretatie van de waarden vereist een indicatie van hun betrouwbaarheid. Daarom bevat de tabel ook de zogenaamde p-waarden van de schatting, uitgedrukt in %. Zij de nul-hypothese, dat de model-parameter van de variabele k gelijk is aan nul (H0: αk = 0) voor de hele populatie. Dan is p de waarschijnlijkheid, dat H0 wordt verworpen op grond van de steekproef (hier met N=33), hoewel de hypothese toch juist is.
M | r² | constante | groeivoet | reële rentevoet | |||
---|---|---|---|---|---|---|---|
a0 | p-waarde | a1 | p-waarde | a2 | p-waarde | ||
1 | 0.53 | 21.3 | 0 | 0.63 | 0.16 | ||
2 | 0.64 | 22.1 | 0 | 0.64 | 0.6 | -0.38 | 1.5 |
De p-waarde geeft aldus een goede indruk van het significantie niveau van de schatting. Bijvoorbeeld, bij M=1 is p < 0.16% voor alle ak, zodat de schatting significant is op het 1% niveau. Voorts is bij alle M de parameter a1 bepaald met een significantie op het 0.6% niveau. Naarmate meer variabelen worden toegevoegd aan het model, zal het indirecte effect in de variabele x1 verdwijnen. Aangezien x2 hier negatief werkt op y(t), neemt in dit geval de waarde van a1 toe met M. Het effect is slechts klein, omdat x1 en x2 nauwelijks correleren. Hun rx1,x2 is slechts 0.03 41. Blijkens de tabel 2 heeft de toevoeging van x2 aan het model tot gevolg, dat een extra 11% van y(t) kan worden verklaard.
Al met al ogen de schattingen in de tabel 2 indrukwekkend. En ze zijn intuïtief logisch. De investeringen nemen toe, wanneer de economie meer groeit. Zo vergroot 1% extra groei de investerings-quote met 0.64%. En ze nemen af, wanneer de reële rentevoet stijgt. Namelijk, 1% rente-daling vergroot de quote met 0.4%. Maar helaas is de tabel 2 te mooi om waar te zijn. Namelijk, de waarde van de Durbin Watson statistiek bedraagt 0.91 (voor M=2). Blijkens de tabellen van de toets is dat lager dan de kritische toetsings-waarde voor een 5% significantie niveau. Er moet worden geconcludeerd, dat er seriële correlatie is.
Kennelijk moet de Cochrane-Orcutt methode worden toegepast. De eerste iteratie verhoogt inderdaad de Durbin Watson statistiek naar 1.20. Helaas is ook dit niet genoeg. Volgens de toets-tabel wil deze waarde zeggen, dat men op het 5% significantie niveau niet weet, of er seriële correlatie is. En intussen heeft het model al vijf onafhankelijke variabelen, namelijk Δy(t) = y(t) − y(t−1), x1(t), x2(t), Δx1(t) = x1(t) − x1(t−1), en Δx2(t) = x2(t) − x2(t−1). Met andere woorden, het niveau van de investeringen hangt af van het niveau van de onafhankelijke variabelen, maar ook van de snelheden van hun veranderingen. Dat maakt het model complex. Een tweede iteratie blijkt al geen significante resultaten meer te geven.
De Gazet heeft tijdens haar bestaan tal van tijdreeksen gepresenteerd in grafiek-vorm. Analysen zijn vooral opwindend, wanneer zij ook niet-economische variabelen bevatten. Deze paragraaf onderzoekt de casus van de organisatie-graad van de Nederlandse vakbeweging, die is behandeld in een eerdere blog. Helaas blijkt ook deze analyse te eindigen in een mislukking. De organisatie-graad wordt nogmaals getoond in de figuur 9, in blauw (neer-geschaald op de y-as met een factor 5). Sinds ruwweg 1970 vertoont de organisatie-graad een dalende tendens. Dit wordt primair veroorzaakt door de individualisering. Ook de verandering van de economische structuur is ongunstig voor de vakbonden. De diensten-sector wordt steeds belangrijker, en daar is het lastig om werkers te organiseren. Het dal rond 1987 is wellicht te wijten aan het reputatie-verlies van de bonden door hun gedrag in de zeventiger jaren.
Hoewel de kromme socio-cultureel is bepaald, is toch een statistische analyse de moeite waard. Zij y(t) de organisatie-graad, en neem als onafhankelijke variabelen de economische groeivoet (x1(t), rood in de figuur 9), de werkloosheid (x2(t), groen), en een regering steunend op een centrum-linkse (x3(t)) of centrum-rechtse (x4(t)) coalitie. De statistische berekening is uitgevoerd met Quattro Pro voor de periode 1963-2004. Bijna alle geschatte parameters blijken significant te zijn op het 1% niveau. Enkel de waarde van a4 is iets minder significant, met een p-waarde van 1.5%. De schatting oogt dus overtuigend. Zij heeft de gedaante
(9) y'(t) = 31.3 + 0.77 × x1(t) − 1.41 × x2(t) + 5.11 × x3(t) + 3.16 × x4(t)
De twee eerste termen laten zien, dat vakbonden baat hebben bij een bloeiende economie. De laatste twee termen drukken uit, dat centrum-kabinetten ontmoedigend werken op de organisatie-graad. Dit politieke effect is vooral te wijten aan de Paarse kabinetten, die het toonbeeld van individualisme waren. Het is fascinerend om te zien, dat de partij-politiek hier doorwerkt in het vakbonds-leven. Helaas houdt de schatting van de formule 9 geen stand bij een nader onderzoek. Namelijk, de Durbin-Watson statistiek heeft een waarde DW=0.6, en dat is ver beneden de kritische grens voor seriële correlatie. Inderdaad heeft de inleiding van de paragraaf al geconstateerd, dat y(t) vooral reageert op langdurige socio-economische veranderingen. Het lukt ook niet om de DW te verhogen via de Cochrane-Orcutt methode. Het ogenschijnlijk fraaie resultaat van de formule 9 blijkt simpelweg een illusie te zijn, en de toepassing van een foutief statistisch model.
De voorgaande analyse van tijdreeksen is teleurstellend, omdat steeds weer de afhankelijke variabele een trend vertoont. Dan gelden de aannames van de statistische methoden niet. Uw blogger tast nog in het duister over de consequenties van deze bevindingen. Het kan zijn, dat men de statistische aanpak moet beperken tot gegevens-verzamelingen van dwars-doorsneden. Het kan ook zijn, dat uw blogger de juiste vaardigheden (nog) mist. De statistische analyse is een ambacht, dat moet worden aangeleerd door imitatie in groepsverband. Uw blogger is auto-didact. Dat is meestal geen probleem, maar in dit geval wel. Daarom moeten de berekeningen worden gezien als illustraties en goed-bedoelde pogingen, en niet als professionele werkstukken.