PVV-Miep snapt statistiek wél

Onlangs verscheen dit filmpje op Dumpert.nl. Hierin figureert PVV-politica Lilian Helder die poogt in de Tweede Kamer te verdedigen dat het onderzoek waarin retrospectief wordt gekeken naar het nut van een taakstraf versus een vrijheidsstraf een niet valide manier van onderzoeken is. Helaas komt zij allerminst goed uit haar woorden en blijft ze hangen in eindeloos gehakkel “dat je persoon A niet met persoon B kunt vergelijken”. Dat ze later in haar betoog er ook nog eens appels, peren en koeien bijhaalt, doet haar betoog niet veel goeds. Maar dit betreft enkel de vorm waarin zij haar boodschap brengt. Een vorm die inderdaad te wensen overlaat. En daar wordt deze PVV-politica, toch geschoold in het recht, volledig op afgebrand. Het feit dat een PVV-politicus misschien ook nog wel eens de waarheid spreekt of iets zinnigs te melden heeft, zal ongetwijfeld een grote rol in deze onterechte hetze spelen.

Inmiddels rouleert het filmpje op internet op blogs en websites van serieuzere (kwaliteits)couranten zoals de NRC, waarin mevrouw Helder als een “domme PVV-miep” wordt afgeschilderd, al doen ze dat bij NRC in nettere bewoordingen. De PVV op deze manier in de hoek zetten is natuurlijk makkelijk scoren. Dat een serieuze krant voorbij gaat aan het feit dat mevrouw Helder wel degelijk een punt heeft valt toch een beetje tegen. Mevrouw Helder doelt in haar betoog namelijk op de slechte wijze waarop retrospectief onderzoek is uitgevoerd. En aan slecht uitgevoerd onderzoek mag je helemaal geen conclusies verbinden.

Randomized controlled trial
In de wetenschap is het de gouden standaard om een goede vergelijking te maken tussen twee zaken, wat kan variëren van het vergelijken van pil A met pil B tot het vergelijken van een taakstraf en een vrijheidsstraf, als je alle variabelen tot een absoluut minimum beperkt. Om dit te kunnen bereiken heeft het randomized controlled trial in het onderzoek de voorkeur om twee behandelingen, therapieën, methodes van aanpak en wat dies meer zij met elkaar te vergelijken. Om een taakstraf met een vrijheidsstraf te kunnen vergelijken is het noodzakelijk om twee groepen veroordeelden at random een taakstraf en een gevangenisstraf toe te wijzen, met een gelijkelijke verdeling (fify-fifty) van beider straffen. Vervolgens bekijkt de onderzoeker op een later punt hoe het de twee groepen is vergaan. Verder moeten de veroordeelden op alle punten overeenkomen: geslacht, leeftijd, afkomst, sociale omgeving, soort misdrijf et cetera et cetera. Dit laatste is al een ondoenlijke zaak. Een jongeman uit een klein dorp, die bij zijn ouders woont, en tijdens het uitgaan een andere jongen onder invloed van een lijntje coke op zijn gezicht slaat, is die wel vergelijkbaar met een stadsjongen, uit een eenoudergezin, die de nieuwe agressieve vriend van zijn moeder uit verdediging neerslaat? Theoretisch zouden ze op basis van misdrijf en leeftijd wel vergelijkbaar kunnen zijn en zo, in zojuist genoemde manier van onderzoeken, of een taakstraf of een vrijheidsstraf toebedeeld krijgen. Maar echt gelijk en verglijkbaar zijn ze niet.

Bovengenoemde wijze van onderzoeken in het strafrecht, de gerandomiseerde gecontroleerde trial, wordt bij mijn weten niet in het Nederlandse strafrecht uitgevoerd. Niet in het minst om de vele ethische bezwaren waar deze manier van onderzoek op stuit. Kunnen we, bij wijze van onderzoek, het lot van een veroordeelde overlaten aan de willekeur van het onderzoek? Dus rest het onderzoekers om het te doen met de gegevens die voorhanden zijn. Om vervolgens terug te kijken hoe het de gestraften vergaan is. Zo wordt er gekeken naar taakgestraften en hun levensverloop. Vielen ze terug in criminaliteit? Zo eveneens met degenen die van hun vrijheid beroofd werden.

Selectiebias
Die groepen zijn op voorhand, zelfs bij dezelfde soort misdrijf, niet gelijk. Maar ongelijke groepen zijn niet te vergelijken. Daarnaast speelt ook nog de selectie van wie een taak- en wie een vrijheidsstraf krijgt opgelegd een enorm belangrijke rol. Aangezien er geen onderzoekselement in het spel was bij het opleggen van de straf, heeft de rechter op basis van het individu gekozen voor ofwel een taak- ofwel een vrijheidsstraf. De kans is zeer groot dat de groep die een taakstraf krijgt, een groep is die geheel anders is dan zij die een vrijheidsstraf kregen. Mogelijkerwijs maatschappelijk stabieler, mogelijkerwijs nog nooit eerder in aanraking geweest met justitie, mogelijkerwijs een individu bij wie de rechter nog meer kans op maatschappelijk herstel ziet, etc. Kortom, bij het ‘selecteren’ van de groepen – wat onbewust optreedt door de keuzes die de rechters maken in hun strafzaken – ontstaan er twee totaal verschillende groepen veroordeelden. De groepen die al niet heel gelijk waren, worden nog ongelijker. In onderzoek noemen we dit selectiebias. Vervolgens wordt achteraf geprobeerd die twee groepen met elkaar te vergelijken. Maar door de initiële onvergelijkbaarheid van de groepen, aangevuld met een enorme berg ruis (de selectie-bias) die door de rechters wordt toegevoegd, is de vergelijking onmogelijk geworden.

Zo worden de appels met de peren vergeleken. En zolang de appels met de peren worden vergeleken, kunnen we geen enkele conclusie aan een onderzoek verbinden. En dat is waar mevrouw Helder van de PVV in haar betoog op doelt. Haar – helaas zwak geformuleerde betoog – getuigt dat zij juist wél kennis heeft van onderzoek en statistische methoden. Iets waar ze zelfs bij de kwaliteitskranten onvoldoende weet van lijken te hebben.

Angela Carper beweert geen criminoloog of strafrechtdeskundoloog te zijn, maar denkt wel met enige kennis van wetenschap en onderzoek iets zinnigs te kunnen zeggen over het betoog van PVV-politica Helder. Angela Carper is forensisch arts en verslavingsarts en schrijft over haar werkzaamheden op www.csidokter.nl

Tags: Lilian Helder, statistiek

PVV-Miep snapt statistiek wél

Wat is TPO?

Over TPO.nl