Tools die onthullingen in open data moeten voorkomen onderzocht

Het ministerie van Justitie en Veiligheid wil datasets zoveel als mogelijk en proactief publiek beschikbaar te stellen. Het motto hierbij is ‘openbaar tenzij’. Veel van de datasets betreffen privacygevoelige data: over justitiabelen, vluchtelingen of rechtzoekende burgers. Openbaarmaking moet daarom op een verantwoorde, privacybeschermende wijze gebeuren.

Het WODC onderzocht Statistical Disclosure Control-technieken en -tools (SDC-technieken en -tools), waarmee identificerende en gevoelige gegevens zoveel mogelijk worden verwijderd of verhuld, terwijl de bruikbaarheid zo veel mogelijk behouden blijft.

De SDC-technieken en tools die het WODC onderzocht kunnen gebruikt worden om de te publiceren dataset zodanig te transformeren dat de kans op privacy-onthullingen kleiner wordt. Daarnaast helpen ze bij het maken van de afweging tussen enerzijds privacy en anderzijds bruikbaarheid. Het rapport laat zien dat het gebruik van SDC-technieken en -tools complex is; gebruikers hebben hier vaak aanvullende begeleiding bij nodig.

Lees het volledige rapport: On statistical disclosure control technologies for protecting personal data in tabular data sets (Cahier, 2020-17).

Kennis verspreiden

De onderzoekers wijzen erop dat het nodig is om kennis over SDC-technieken en –tools breder te verspreiden. De kennis is nu voornamelijk aanwezig in het SDC-onderzoeksdomein, maar is ook van belang voor databeheerders en data-analisten, voor bestuurders die verantwoordelijk zijn voor privacy- en/of databeleid en voor professionals die datalabs en andere datagedreven samenwerkingsverbanden opzetten.

Onderzoek naar nieuwe ontwikkelingen

Voortdurend onderzoek is nodig om op de hoogte te blijven van ontwikkelingen op dit gebied. In de onderzoekslijn van het WODC zal binnenkort nog een publicatie verschijnen over een procedure voor de praktische inzet van de onderzochte privacybeschermingsmethoden en het inbedden ervan in (overheids-)organisaties. Ook wil het WODC onderzoek gaan doen naar hoe tekstuele gegevens (bijvoorbeeld dossiers) beschermd kunnen worden.