Het aantal mensen dat in Nederland verblijft zonder geldige papieren, zogenoemde ongedocumenteerden, verandert steeds. Mensen komen en gaan. Hoe weet je hoeveel er ongeveer in Nederland zijn? Daarvoor gebruikt hoogleraar statistiek Peter van de Heijden al 25 jaar hetzelfde model, gebaseerd op de ‘vangst- en hervangstmethode’, volgens hem de meest wetenschappelijke manier om schattingen op dit vlak te kunnen maken. Waarom lijken de schattingen dan te botsen met wat hulpverleners in de praktijk waarnemen en zijn er geen betere methoden?
Hoogleraar statistiek Peter van der Heijden (zie kader onderin) ontwikkelde ongeveer 25 jaar geleden samen met zijn medewerker Maarten Cruyff en hoogleraar medische statistiek Hans van Houwelingen de gebruikte methode, die ook het ‘beknotte Poisson Regressiemodel’ wordt genoemd. Het ministerie van Justitie en Veiligheid verleende destijds subsidie voor de ontwikkeling ervan. Van der Heijden gebruikt dit model nu voor de vijfde keer om in opdracht van het WODC schattingen te maken van de omvang van ongedocumenteerden in Nederland.
Wat maak het ‘beknotte Poisson Regressiemodel’ bijzonder?
‘De kern van onze methode is dat we het deel van de ongedocumenteerden dat onzichtbaar is, kunnen bijschatten op het deel dat wél zichtbaar is, op basis van politiegegevens. De politie registreert mensen die ze aanhouden en niet over de verplichte papieren beschikken. Ze registeren ook of dat bij een persoon vaker gebeurt. Dát zijn de data die wij gebruiken, met allerlei variabelen: waar komt iemand vandaan, hoe oud is de persoon, geslacht en waar is die aangehouden? Op basis van die data en variabelen kun je patronen ontdekken. Het statistische model kan vervolgens doorberekenen hoeveel ongedocumenteerden er in totaal zijn. [In het rapport hebben we het model uitgebreid beschreven, op pagina 14 tot en met 18.]
Het blijven wel schattingen, de werkelijke cijfers kunnen afwijken, de cijfers zijn niet heilig. Maar je kunt wel zien wat de trend is. Varianten van dit model gebruiken we ook voor het schatten van het aantal slachtoffers van mensenhandel (voor Nationaal Rapporteur Mensenhandel en Seksueel Geweld), het aantal daklozen (voor het CBS), drugsverslaafden (voor het Trimbos-instituut) en recent voor het aantal ransomware-aanvallen in Nederland. Het is een internationaal erkende methode en wij hebben hierover ook een handboek geschreven voor de United Nations Office on Drugs and Crime.’
Beeld: © WODC
Wat zeggen de cijfers van de laatste meting?
‘De kern is dat het aantal in de afgelopen jaren niet is veranderd en gemiddeld lijkt te schommelen rond de 20.000 mensen, tussen bandbreedtes. Al zijn bepaalde deelgroepen wel wat gestegen, zoals mensen uit Noord- en Zuid-Amerika en andere gedaald, bijvoorbeeld Noord-Afrikanen. Maar dat gaat steeds op en neer. Voor de liefhebbers van statistiek: het model kan bepaalde groepen onderschatten als niet goed voldaan is aan bepaalde aannamen, maar als die schendingen van die aannamen over de jaren heen identiek zijn, dan kun je wel de trend vertrouwen. En die trend is dus dat het aantal in de laatste jaren constant is.
Over een langere periode, vanaf het jaar 2000, zie je dat het aantal fors is gedaald. Dat komt onder meer doordat er strenger beleid wordt gevoerd en meer landen zijn toegetreden tot de EU, waardoor de inwoners van deze landen makkelijker legaal in Nederland kunnen werken en dus niet meer illegaal hier zijn.’
Verschillende mensen uit het werkveld vinden de schattingen te laag. Zij hebben andere ervaringen. Hoe verklaart u dat?
‘Ik kan me voorstellen dat mensen in de praktijk het anders ervaren. Maar we hebben alle rapporten die we maar konden vinden methodologisch bekeken. [Zie het rapport, pagina’s 10 tot en met 12.] Het is niet goed te achterhalen hoe ze aan de aantallen komen die in die rapporten worden genoemd.
Daarnaast zeggen mensen uit de praktijk dat ze meer ongedocumenteerden in hun omgeving zien. Maar als bijvoorbeeld wordt gezegd dat x mensen gebruiken maken van schoolgeld voor ongedocumenteerden, zegt dat niet zoveel als je niet kunt checken of deze mensen ook werkelijk vallen onder de groep ongedocumenteerden, want dat kunnen deze partijen niet controleren. Het is voor wetenschappelijk, controleerbaar onderzoek niet te gebruiken. Om getallen goed te kunnen schatten heb je systematisch verkregen data nodig.
Over wie we overigens een minder goed beeld hebben, zijn ongedocumenteerde kinderen. Het is aannemelijk dat die niet zo snel door de politie worden aangehouden, maar het kan ook dat er gewoon niet veel zijn. Mogelijk zijn voor het maken van betere schattingen data bruikbaar van ongedocumenteerde kinderen die naar school gaan, maar die data worden gezien als erg gevoelig en zijn niet verkrijgbaar. We hebben ook lagere schattingen voor vrouwen, maar denken wel dat die valide zijn, dus dat die er ook daadwerkelijk minder zijn.
We leggen er overigens in ons rapport de nadruk op dat het niet om absolute getallen gaat, maar om schattingen met bandbreedtes, en dat vooral naar de trend gekeken moet worden.’
Er zijn ook andere methoden beschikbaar, waarom gebruikt u die niet?
‘Alles draait om de data die je tot je beschikking hebt en of die ook betaalbaar zijn. In België kunnen ze bijvoorbeeld een andere methode gebruiken omdat ze daar sterftecijfers van ongedocumenteerden bijhouden, maar dat gebeurt in Nederland niet. Dus dat weten we niet.
Ook de ETHOS-methode en de Negatieve Binomiale Regressie hoor ik vaak voorbijkomen in discussies. De ETHOS-methode telt als het ware mensen op straat, je telt dus alleen wat je ziet. Deze methode wordt wel voor het schatten van daklozen gebruikt. Voor bepaalde groepen daklozen leidt dat tot een valide schatting, omdat deze groepen daklozen als zodanig door hun uiterlijk herkenbaar zijn. Dat geldt niet voor ongedocumenteerden, daarvoor is deze methode niet bruikbaar. Ik zit overigens in een internationale werkgroep over deze methode om daklozenschattingen in de VS te maken.
De Negatieve Binomiale Regressie - wie wij zelf hebben ontwikkeld - geeft in de praktijk te grote marges en is daarom niet geschikt om beleid op te baseren. Het is wel grappig dat ik dit regelmatig hoor, want dit model is nog nooit gebruikt.’
Wat is er veranderd in de methode door de tijd of gaat er wat veranderen?
‘Kijk, het probleem zijn de data die je hebt, die zijn relatief betrouwbaar maar tegelijkertijd vrij mager eigenlijk. Er is niet veel informatie beschikbaar, maar die informatie die er is, is van relatief goede kwaliteit. Je kunt proberen complexere modellen te maken. Maar dan ga je eigenlijk met een Formule 1-wagen over karrensporen rijden. Waarbij die Formule 1-wagen dan de statistische methode is en de karrensporen zijn de data. Dit is een uitspraak van een docent die ik ooit had.
Het fijne is hier dus dat we al 25 jaar relatief betrouwbare data hebben, waardoor je de schattingen over de jaren kunt vergelijken. Hoewel de data ook wel zijn verbeterd. Bijvoorbeeld door betere biometrie en betere registratie-mogelijkheden bij de politie. De kwaliteit van de data is omhoog gegaan en dat komt de schattingen ten goede.’
Wil je meer weten over de laatste metingen en hoe beleid die kan gebruiken? Lees meer in het nieuwsbericht met daarin een link naar het volledige rapport: Nieuwe schattingen beschikbaar over het aantal vreemdelingen zonder verblijfsvergunning.
Beeld: © Peter van der Heijden