Zijn slotwoorden waren: ‘U zult zich wellicht afvragen of Henk Kiers geheel en al vrij is van tekortkomingen. Ik kan u verzekeren dat daar geen sprake van is. Hij heeft één belangrijke tekortkoming. Gelet op zijn prestaties is hij veel te jong. Wil hij ooit een kans maken op het winnen van bijvoorbeeld de senior Heymansonderscheiding, dan zal hij toch echt met een betere leeftijd voor de dag dienen te komen.’

De man die zichzelf als een ‘huurling van de psychologie’ beschouwt, heeft alle reden om naast zijn schoenen te lopen, maar de nuchtere Kiers lijkt hier weinig talent voor te hebben. Op een aanbieding om naar elders te vertrekken om hoogleraar te kunnen worden, zit hij naar eigen zeggen niet te wachten. ‘Ik heb het in Groningen prima naar mijn zin en zolang ik hier rustig mijn werk kan blijven doen, zal ik hier niet weg gaan.’ Kiers gebruikt de Heymansonderscheiding niet om carrière te maken, maar om het enthousiasme voor zijn specialisme uit te dragen.

‘Psychologen gebruiken dan wel statistiek, omdat ze er hun uitspraken harder mee kunnen maken, maar het liefst verdiepen zij er zich zo weinig mogelijk in. Men verwacht dat methodologen een soort kookboeken met recepten voor onderzoek afleveren. Men wil er zelf niet al te veel over nadenken. Toch is dat noodzakelijk, omdat je altijd de voor- en nadelen van een bepaalde aanpak moet afwegen. Statistiek kan weliswaar gebruikt worden om lijn te brengen in een grote hoeveelheid gegevens, maar dat wil niet zeggen dat je daarmee een definitief antwoord hebt gevonden. De onderzoeker zal altijd moeten aangeven wat de feiten zijn en hoe hij die interpreteert. Iedereen kan bijvoorbeeld een gemiddelde uitrekenen, maar dat wil niet zeggen dat dit getal altijd zinnige informatie geeft. Een statisticus zal daar ook niet altijd uitsluitsel over kunnen geven.’

Een baby van de ooievaar

Kiers denkt dat meer inzicht in statistische wetmatigheden voor iedereen nuttig is. ‘Een voorbeeld van een verkeerde interpretatie van onderzoeksgegevens stond onlangs in de Volkskrant. In een Engelse krant had de tabaksindustrie gefulmineerd tegen de Wereldgezondheidsorganisatie (WHO), omdat die een studie achtergehouden zou hebben dat meeroken niet ongezond is. Maar wat was er aan de hand? De onderzoekers hadden enige gegevens verzameld over het verband tussen meeroken en longkanker. In de steekproef bleek de kans op longkanker bij meerokers met zestien of zeventien procent verhoogd te zijn, maar het verschil met de controlegroep die niet aan de rook was blootgesteld, was niet statistisch significant. Dit wil zeggen dat niet uitgesloten kan worden dat het verschil tussen beide groepen aan toevallige factoren geweten kan worden. Voor het betrouwbaar vaststellen van een subtiel verschil heb je nu eenmaal een flinke steekproef nodig, maar in het genoemde onderzoek was de steekproef zo klein dat zelfs niet uitgesloten kon worden dat meeroken een beschermend effect had. De tabaksindustrie heeft alleen deze regel gezien en is meteen in de pen geklommen, maar dat kon alleen omdat zij niet konden of wilden begrijpen, hoe dergelijk onderzoek werkt.

Het feit dat een bepaald verband niet significant is, wil niet zeggen dat het verband niet bestaat. Andersom biedt significantie ook geen waarborg. Een leuk voorbeeld is dat de ooievaarsstand de laatste jaren heel aardig correleert met het aantal geboorten. Toch zal niemand het in zijn hoofd halen op grond van deze statistieken de gangbare opvattingen over de voortplanting overboord te zetten.

Het voorbeeld van de ooievaars ligt er natuurlijk dik bovenop, maar stel nu dat een arbeidspsycholoog wil evalueren of een training een positief effect heeft gehad op de bedrijfscultuur. Hij zou dan kunnen meten hoe het gesteld is met zaken als het ziekteverzuim, de tevredenheid met het werk en de werkdruk. Maar zelfs als er zich duidelijke verbeteringen hebben voorgedaan, heb je geen garantie dat dit door de training is veroorzaakt. Het kan altijd zijn dat dit op het conto geschreven moet worden van een derde variabele die niet bij het onderzoek is betrokken. De veranderingen kunnen te danken zijn aan de aanstelling van een nieuwe directeur, die zowel de trainingen heeft georganiseerd als andere verbeteringen heeft bewerkstelligd.

Bij de behandeling van psychische stoornissen kan iets soortgelijks spelen. Stel je wilt bepalen of een bepaalde vorm van psychotherapie of een nieuwe pil effectief is bij depressies. Dit lijkt een eenvoudige klus. Je begint met een meting die de ernst van de depressie vastlegt, je verzorgt een behandeling en na drie maanden doe je een nieuwe meting. Als de stemming van de patiënten op dat moment is verbeterd, lijkt de conclusie gerechtvaardigd dat de therapie is aangeslagen. Toch is deze conclusie voorbarig omdat men op deze manier de zogenaamde ‘regressie naar het gemiddelde’ over het hoofd ziet. Stemmingen zijn aan schommelingen onderhevig en alleen iemand die op het dieptepunt zit zal zich aanmelden voor een therapie. De kans is echter groot dat de slinger drie maanden later alweer omhoog is gezwaaid en je zal bij de tweede meting dus altijd een verbetering zien, ongeacht of de therapie nu werkelijk heeft geholpen of niet.’

Sterrenkunde als basis

Kiers beperkt zich voorlopig tot de standaardfouten op het terrein van de methoden en technieken. In principe krijgt elke psycholoog in zijn opleiding meer dan voldoende kennis van de statistiek mee om dergelijke fouten te vermijden. Toch blijft deze materie soms slecht hangen bij de minder exact aangelegde geesteswetenschappers. ‘Mij lagen de exacte vakken op de middelbare school al erg goed en ik ben dan ook begonnen met een studie sterrenkunde in Groningen. Dit was in de praktijk echter erg saai en aan het einde van het eerste jaar had ik bij wijze van spreken nog geen sterren gezien, maar alleen algemene inleidingen in de wis- en natuurkunde gehad. Het was een theoretische studie en de toepassing van de theorie lag niet snel in het verschiet.

Een jaargenoot van mij is toen overgestapt naar de psychologie en daar was ik zelf ook enthousiast over. Ik heb toen een tijdje twee studies gedaan. Toen ik had gezien dat er in de psychologie genoeg exacts te doen viel, ben ik omgezwaaid. Ik kwam toen snel in de methodologie terecht, omdat ik daar vanwege mijn achtergrond in de sterrenkunde een kleine voorsprong had. Bovendien kon ik op die manier in de keuken van het onderzoek kijken en dat vond ik eigenlijk interessanter dan de gerechten die uit die keuken kwamen. Hoe je onderzoek doet, is leuker dan het onderwerp van onderzoek zelf.

Het is bijvoorbeeld heel interessant hoe je dingen meet. Telkens stuit je er weer op dat de mens een uiterst lastig studieobject is, omdat hij soms liegt en bedriegt of sociaal wenselijke antwoorden geeft. Andere keren schiet ook simpelweg de zelfkennis tekort. Een meting in de psychologie zal dan ook altijd de nodige ruis bevatten. Ik werk nu ook wel eens samen met chemici en dan merk ik dat zij regelmatig meer dan 98 procent van de informatie in de verzamelde gegevens kunnen verklaren. Een psycholoog daarentegen mag al heel blij zijn als hij komt tot vijftig procent.

De psychologie bevindt zich altijd op drijfzand. Je blijft zitten met de fundamentele onvoorspelbaarheid van het menselijk gedrag en ik voorspel ook dat we nooit zullen komen tot een wiskundige omschrijving van het bewustzijn. Psychologische theorieën blijven allemaal vrij grove benaderingen. Het leuke van de statistiek is nu juist dat je af en toe wel tot een definitief antwoord kunt komen. Als je een wiskundig bewijs rond hebt, dan weet je dat een ander daar niet meer naar hoeft te kijken, omdat het niet meer anders kan zijn. De wiskunde biedt puzzels waar je een definitieve oplossing voor kunt geven.’

Kiers zelf heeft met behulp van wiskunde veel bijgedragen aan de ontwikkeling van de factoranalyse. Dit is een statistische techniek die gebruikt wordt om structuur in onderzoeksgegevens aan te brengen. Er wordt gekeken welke onderzoeksgegevens vaak in combinaties samen voorkomen. Iemand die graag bergen gaat beklimmen in zijn vakantie, zal bijvoorbeeld ook vaker houden van te hard rijden of parachutespringen. Deze samenhang kan benoemd worden als de factor sensatiezoeken. De factor is dus een onderliggende eigenschap die verklaart waarom de meetresultaten er op deze manier uitzien. De rapportcijfers van schoolleerlingen kunnen ook als voorbeeld dienen. Het ene kind is overal goed in, het andere faalt op alle gebieden en weer een ander heeft een talent voor een deel van de schoolvakken. Wie dit wil verklaren zal verwijzen naar factoren als de intelligentie en het doorzettingsvermogen van de leerlingen.

‘De factor intelligentie kan weer verder opgedeeld worden in twee onderliggende vaardigheden: performale en verbale. De performale factor voorspelt hoe goed iemand zal presteren bij praktische puzzels en de exacte vakken en de verbale factor heeft bijvoorbeeld betrekking op taal en inzicht. Deze factoren kan men echter op twee manieren weergeven. Je kunt zeggen dat intelligentie uit twee verschillende factoren bestaat, maar je kunt ook zeggen dat er een factor intelligentie is en een factor die het verschil tussen performaal en verbaal aangeeft. Beide omschrijvingen zijn even goed en leiden tot dezelfde conclusie, maar de eerste beschrijving is wel makkelijker te begrijpen. De eerste zal men daarom wel in de handleiding van psychologische tests tegenkomen, en de tweede niet.’ Moeilijk interpreteerbare factoren, worden omgezet in beter te hanteren grootheden en Kiers zelf heeft hier enkele rekenmethoden voor ontwikkeld.

De derde dimensie

De laatste jaren zijn er statistische technieken ontwikkeld die sneller verwijzen naar een eenduidige beschrijving van onderliggende factoren. Dit kan bijvoorbeeld met behulp van de drieweg-analyse. In de genoemde lofrede werd dit op de volgende manier uitgelegd. Wanneer metingen worden verricht bij dezelfde personen, op dezelfde variabelen, op een aantal verschillende tijdstippen (de drie dimensies), dan ontstaat een soort flatgebouw van gegevens. Op iedere etage van deze flat kan men een factoranalyse toepassen. Vervolgens zou men de factoren van de verschillende etages (tijdstippen) met elkaar kunnen vergelijken. Dit is echter tijdrovend en ingewikkeld. De drieweg-analyse, neemt alle etages in één keer door en geeft ook duidelijkheid over hoe het belang van de factoren op de verschillende etages verschuift.

Het is bijvoorbeeld denkbaar dat bij jonge kinderen de performale intelligentie veel zwaarder weegt dan de verbale intelligentie en dat het relatieve belang van die twee in de loop van de tijd opschuift. De drieweg-analyse kan beschouwd worden als een soort factoranalyse voor gevorderden, omdat het een derde dimensie in de berekeningen betrekt.

‘In zo’n driedimensionale brij van gegevens blijkt het ook mogelijk om tot eenduidige factoren te komen. Doorgaans zijn gegevens op verschillende manieren in factoren onder te brengen, maar doordat je een derde dimensie bij je berekeningen betrekt, is dat niet meer mogelijk. Ik heb dat overigens zelf voor een bepaald geval wiskundig bewezen. Ik heb samen met mijn hoogleraar Ten Berge zeker een halfjaar fulltime gewerkt om tot dit bewijs te komen en uiteindelijk kwamen we met een ingewikkeld, maar mooi wiskundig bewijs van dertig pagina’s voor de stelling dat een bepaalde klasse van rekenmodellen voor drieweg-analyse altijd unieke uitkomsten oplevert. Het feit dat dit lukte was in mijn beleving een hoogtepunt in mijn loopbaan. Je bent dan een hele tijd aan het puzzelen geweest zonder dat je enige garantie hebt dat het tot een resultaat leidt en je zit dan af en toe behoorlijk in je rats. Wij hebben elkaar ook beurtelings weer op gang geholpen, maar de doorbraak kwam toen ik half ziek thuis op de bank hing, nadat mijn verstandskiezen waren getrokken. Ik kon toen niet echt iets doen, maar plosteling zag ik een symmetrie in de puzzel. Dit bleek het begin van het stramien voor het hele bewijs. Het opschrijven is dan nagenieten. We moesten alleen nog stuctuur aanbrengen in de lastige en chaotische wiskunde. Het mooie is dat je een keihard resultaat hebt. Het is echt een stukje wetenschap dat af is. Er hoeft nooit meer iemand over na te denken.’

Het bewijs werd niet gevierd met een reisje naar de Bahama’s, maar Kiers vond het wel weer moeilijk om na dit succes aan iets nieuws te beginnen. Hij begint opnieuw te stralen als hij eraan terugdenkt, maar desgevraagd ontkent hij dat hij zich weer bij de tandarts zal melden als hij vastzit bij het rondkrijgen van de bewijsvoering. ‘Nee hoor, dat heb ik er niet voor over. Bovendien houd ik mij nu niet meer met dergelijke grote theoretische exercities bezig. Ik ben meer gericht op praktische toepassingen.’

De Big Five x Five

Deze praktische toepassingen heeft Kiers onder andere gevonden in de chemie. ‘Als je wilt bepalen welke stoffen in een bepaalde oplossing zitten, dan kun je daar een aantal metingen op los laten. Elke meting op zich kan beschouwd worden als een verdieping van het flatgebouw en de drieweg-analyse kan precies uitrekenen welke factoren, welke stoffen dus, deze meetgegevens veroorzaakt kunnen hebben.

De psychologie blijft echter nog een beetje achter bij het gebruik van deze nieuwe technieken. Velen lijken te denken dat de rekenmethoden te complex zijn en vrezen hun vingers te branden. Toch denk ik dat de nieuwe statistische technieken nieuwe wegen kunnen openen in het onderzoek. Neem bijvoorbeeld het persoonlijkheidsonderzoek. De laatste decennia is met behulp van factoranalyses veel vooruitgang geboekt. De vele duizenden woorden die wij gebruiken om iemands persoonlijkheid te beschrijven, blijken heel goed op vijf dimensies geplaatst te kunnen worden.’ We beoordelen anderen op extraversie, vriendelijkheid, zorgvuldigheid, emotionele stabiliteit en intellectuele autonomie (zie ook Psychologie, december 1997).

‘Deze vijf dimensies worden wel aangeduid als de Big Five en het is duidelijk dat hiermee de grote lijnen vast liggen. Tegelijkertijd is duidelijk dat de Big Five een ernstige vereenvoudiging inhouden, omdat de dimensies alleen aandacht besteden aan de onveranderlijke trekken van het individu. In het persoonlijkheidsonderzoek vraagt men dan ook dingen als: “Bent u zorgvuldig van aard?” Men besteedt vooral aandacht aan kenmerken die zich in alle situaties voordoen, maar men vergeet dat mensen zich in verschillende situaties heel anders kunnen opstellen.’ Iemand die op het werk anderen vol zelfvertrouwen tegemoet treedt, kan zich heel krampachtig gedragen in een informele sociale context. Andersom kan een echte versierder op het werk verlegen en onzeker zijn.

De belangstelling voor gebondenheid aan de situatie voegt een extra dimensie toe aan het persoonlijkheidsonderzoek. In het verleden kon men hier echter weinig mee, omdat de statistische technieken ontbraken om zo’n driedimensionale gegevensstructuur te ontrafelen. De drieweg-analyse maakt dit echter wel mogelijk en ik verwacht dat hier in de toekomst zeker vaker gebruik van gemaakt zal worden. Misschien krijgen we in de toekomst wel een Big Five x Five die beschrijft hoe iemand zich gewoonlijk gedraagt in een bepaald soort situatie. De kenmerkende reacties van een persoon zijn deels stabiel over alle situaties, maar ook deels situatiegebonden.’

Situatiegebonden aspecten

‘Een onderzoek dat een eerste stap zet in deze richting, is door de Belgische psycholoog Iven van Mechelen en mijzelf uitgevoerd. Wij hebben onderzocht welk soort angst in welke situatie optreedt. De proefpersonen moesten aangeven van welke symptomen zij last hadden als zij angstig waren. Ging hun hart sneller kloppen? Wilden zij het liefst door de grond zakken? Hadden ze een droge keel? Deden ze het bijna in hun broek? De situaties die angst opriepen verschilden ook sterk. Het ging dan om elf situaties, zoals het eerste avondje uit met een nieuwe geliefde, alleen zijn in een groot en donker bos of het toespreken van een zaal vol mensen. De derde dimensie bij dit onderzoek werd gevormd door de persoonlijkheid van de proefpersonen. Uit dit onderzoek komt bijvoorbeeld naar voren dat een bepaald soort mensen veel meer vermijdingsgedrag vertonen in situaties waarin zij beoordeeld worden door een publiek. Andere mensen ervaren wel opwinding en staan te trillen op hun benen, maar willen niet zo snel mogelijk weer weg. Een ander verschil is dat de angst in het bos vooral bestaat uit lichamelijke opwinding, terwijl spreken in het openbaar ook gevoelens oproept als misselijkheid en een vol gevoel in de maag.’

Een drieweg-analyse maakt het mogelijk de situatiegebonden aspecten de plaats te geven die hen toekomt in het persoonlijkheidsonderzoek. In die zin is het terecht dat het NIP een belangrijke psychologenprijs heeft uitgereikt aan een methodoloog. ‘Als je het zo bekijkt, dan is zo’n prijs voor een methodoloog misschien wel terecht. Toch was het voor mij een grote verrassing en ik ben er alleen maar heel blij mee.’

‘Noodzakelijk, maar net geen kwaad’, zo omschrijft de Groningse methodoloog Henk Kiers het imago van zijn vak onder psychologen. Toch won hij de junior Heymansonderscheiding van het Nederlands Instituut van Psychologen (NIP). ‘Ik had nooit verwacht dat ik voor deze prijs in aanmerking zou komen, omdat ik mij niet met het gedrag van mensen bezighoud, maar met het gedrag van statistische technieken.’ De methoden en technieken van het onderzoek lijken misschien een buitenbeentje, maar dit buitenbeentje bepaalt wel welk soort vragen de psychologie kan beantwoorden.[/wpgpremiumcontent]