Het groeiend belang van datagedreven werken en de daarmee gepaard gaande uitdagingen zijn volop onderwerp van maatschappelijke discussie. Het actuele toekomstbeeld is dat allerlei soorten beslissingen en besluiten van experts, bedrijven en maatschappelijke organisaties vaker ondersteund of overgelaten worden aan artificial intelligence-systemen (AI). AI-systemen zijn in staat om gedurende hun gebruik te leren, waardoor ze zich steeds meer aanpassen aan de context en de mensen die daarbinnen leven en handelen. Voorbeelden van opkomende AI-systemen zijn taalmodellen, zoals ChatGPT of GPT-NL. Er is daarbij een centrale rol weggelegd voor algoritmes. Een algoritme is een reeks instructies bedoeld om op basis van beschikbare data vanuit een begintoestand een bepaald doel te bereiken. AI-systemen beperken zich in principe niet tot een specifieke toepassing in een bepaald domein, maar (kunnen) juist domeinoverschrijdend werken.
In de kennislijn Digitale Rechtsstaat staan de korte en lange termijn consequenties van (verantwoorde) ontwikkeling van datagedreven werken centraal. Hoe kunnen deze systemen binnen het werkveld van justitie en veiligheid worden ingevoerd, waarbij de menselijke waarden gerespecteerd worden en blijven. Dat vraagt om kennis- en competentieontwikkeling op het snijvlak van technologie (big data, AI, wiskunde) en het werkveld van justitie en veiligheid.
Onze focus ligt op digitalisatie (Eng: digitalisation), een sociaal-technisch proces waarin digitale technologieën en gegevens worden gebruikt (of ontwikkeld) om tot nieuwe activiteiten te komen. Of om te leiden tot veranderingen in bestaande activiteiten. Ons onderzoek spitst zich toe op de eigenschappen waaraan algoritmes zouden moeten voldoen en de wijze waarop met de resultaten van algoritmes moet worden omgegaan. Ter ondersteuning van beleid kijken we ook naar de implementatie van specifieke algoritmes.
We houden ons bezig met twee typen onderzoek. Aan de ene kant onderzoek naar (de ontwikkeling van) verantwoorde data-gedreven systemen en diensten. Dit richt zich op de voor- en nadelen en mogelijkheden van opkomende of nieuwe technologieën, data governance in smartomgevingen zoals de justitiële ketens, en de toepassing van kunstmatige intelligentie op een verantwoordelijke manier (denk aan privacy en fairness). Het tweede type onderzoek focust zich op de toepassing van datagedreven systemen voor de justitiële ketens. Het gaat hier om de (door)ontwikkeling en actualisering van prognosemodellen voor de justitiële ketens, zie ook Prognosemodel Justitiële Ketens (PMJ).
Medewerkers
- Debora Moolenaar (kennislijncoördinator)
- Floris ter Braak
- Mortaza Bargh
- Ben Tims
Specifieke onderwerpen
Vijf onderzoeken uitgelicht
Today, our environment and the objects therein are equipped with an increasing number of devices such as cameras, sensors, and actuators, which all together produce a huge amount of data. Furthermore, we observe that citizens generate data via social media applications running on their personal devices. Smart cities and societies are seeking for ways to exploit these vast amounts of data. In this paper, we argue that to take full advantage of these data, it is necessary to set up data governance properly, which includes defining, assigning, and allocating responsibilities. A proper setting up of data governance appears to be a challenging task since the data may be used irresponsibly, thoughtlessly and maliciously, resulting in many (un)wanted side effects such as violation of rules and regulations, human rights, ethical principles as well as privacy and security requirements. We elaborate on the key functionalities that should be included in the governance of a data ecosystem within smart cites, namely provisioning the required data quality and establishing trust, as well as a few organizational aspects that are necessary to support such a data governance. Realizing these data governance functionalities, among others, asks for making trade-offs among contending values. We provide a few solution directions for realizing these data governance functionalities and making trade-offs among them.
S. Choenni, M.S. Bargh, T. Busker and N. Netten, “Data governance in smart cities: Challenges and solution directions”. In Journal of Smart Cities and Society, vol. 1, no. 1, pp. 31-51, 2022, IOS Press.
https://content.iospress.com/articles/journal-of-smart-cities-and-society/scs210119
Contactpersoon: Mortaza Bargh
Data collection for studying social phenomena is not only costly but is also, at best, a time-consuming and tedious task. Therefore, tools that may ease the task of data collection will speed up these studies and improve their efficiency. In this contribution, we argue that in some cases Large Language Models (LLMs) may serve as a tool to generate data for studying social phenomena. The rationale is that LLMs absorb a vast amount of data from various types and sources; and embed (an abstraction of) the data in models. Querying these models generates synthetic data that can be considered as a good approximation of the data on which they are trained. The methodological and practical issues involved in our rationale are discussed in this paper. By means of a use case, we illustrate how synthetic data can be generated (or collected) from GPT and how the data can be used for studying stereotypical views on social groups
S. Choenni, T. Busker, and M.S., Bargh, “Generating synthetic data from large language models”. In Proceedings of the 15th International Conference on Innovations in Information Technology (IIT), Nov 14 – 15, 2023. UAE, IEEE.
https://ieeexplore.ieee.org/document/10366424
Contactpersoon: Mortaza Bargh
Data reusability has become a distinct characteristic of scientific, commercial, and administrative practices nowadays. However, an unlimited and careless reuse of data may lead to privacy breaches and unfair impacts on individuals and vulnerable groups. Data content adaption is a key aspect of preserving data privacy and fairness. Often, such content adaption affects data utility adversely. Further, the interaction between privacy protection and fairness protection can be subject to making trade-offs because mitigating privacy risks may adversely affect detecting unfairness and vice versa. Therefore, there is a need for research on understanding the interactions between data utility, privacy and fairness. To this end, in this contribution, we use concepts from causal reasoning and argue for adopting an integrated view on data content adaption for data driven decision support systems. This asks for considering the operation context wholistically. By means of two cases, we illustrate that, in some situations, local data content adaption may lead to low data quality and utility. An integrated wholistic approach, however, may result in reuse of the original data (i.e., without content adaption, thus in higher data utilization) without adversely affecting privacy and fairness. We discuss some implications of this approach and sketch a few directions for future research.
M.S. Bargh and S. Choenni, “Towards an Integrated Approach for Preserving Data Utility, Privacy and Fairness”, In proceedings of International Conference on Multidisciplinary Research (MyRes), 8-9 December 2022, Mauritius.
https://myres.net/conferences/index.php/myres/article/view/24/25
Contactpersoon: Mortaza Bargh
Dit rapport beschrijft de ramingen van de capaciteitsbehoefte van de justitiële ketens tot en met 2029. Het gaat daarbij om ramingen van de instroom en uitstroom van diverse ketenpartners binnen de justitiële ketens (aantallen te behandelen zaken e.d.) en de capaciteitsbehoefte bij intramurale voorzieningen (aantal plaatsen in justitiële inrichtingen). De ramingen zijn ‘beleidsneutraal’. Dat wil zeggen dat de ramingen uitgaan van gelijkblijvend beleid en zijn gebaseerd op ontwikkelingen in de justitiesector tot en met 2022. Deze ramingen vormen de basis voor de begroting 2025.
De ramingen zijn gemaakt met het Prognosemodel Justitiële Ketens (PMJ). Het PMJ bestaat uit twee onderdelen, namelijk een model voor de veiligheidsketen en een model voor het civiel- en bestuursrechtelijke deel van de justitiële keten. Het startpunt voor het PMJ zijn ontwikkelingen in de samenleving die geheel of grotendeels buiten de invloedssfeer van Justitie liggen. Dergelijke ontwikkelingen kunnen gevolgen hebben voor het ontstaan van criminaliteit en rechtsproblemen en daarmee voor het beroep op de justitiële ketens. Te denken valt bijvoorbeeld aan de mogelijke gevolgen van ontwikkelingen in sociale cohesie, maatschappelijke ongelijkheid, botsing van culturen en welvaart. Op basis van de beschikbare criminologische, rechtssociologische en economische theorieën zijn de mogelijk relevante maatschappelijke fenomenen benoemd. Bij deze fenomenen zijn zo veel mogelijk kwantificeerbare achtergrondfactoren gezocht. De zo in kaart gebrachte ontwikkelingen kunnen grofweg in vier categorieën worden ingedeeld, namelijk demografische, economische, maatschappelijke en overige ontwikkelingen. Het PMJ beschrijft de kwantitatieve verbanden tussen deze ontwikkelingen en de criminaliteit en de kwantitatieve verbanden tussen deze ontwikkelingen en het beroep op rechtshulp en rechtspraak. Tevens brengt het PMJ de samenhangen tussen de ontwikkelingen in criminaliteit en het beroep op rechtshulp en rechtspraak en de ontwikkelingen in de rest van de justitiële ketens in beeld.
B. Tims, D.E.G. Moolenaar, A.G. Kriege, B. van der Pol (2024). “Capaciteitsbehoefte Justitiële Ketens t/m 2029. Beleidsneutrale ramingen.” WODC/Rvdr, cahier 2024-10.
Capaciteitsbehoefte Justitiële Ketens t/m 2029 (wodc.nl)
Contactpersoon: Ben Tims
Beleidsmakers willen graag meer inzicht in de (maatschappelijke) kosten van criminaliteit, rechtshandhaving en conflictbeslechting. Daarom is het belangrijk om inzicht te hebben in de toekomstige trends op dit gebied, zodat de best mogelijke beleidsmatige en financiële beslissingen kunnen worden genomen. Hiervoor kan gebruik worden gemaakt van prognosemodellen. Voor het beleidsterrein van Justitie is reeds enige tijd geleden het Prognosemodel Justiele Ketens (PMJ) ontwikkeld. In dit rapport wordt onderzocht in hoeverre het haalbaar en nuttig is om nieuwe ontwikkelingen op het gebied van data en algoritmen toe te passen in het PMJ.
Uit eerdere externe evaluaties blijkt dat het PMJ goed in elkaar zit en dat gebruikers geen behoefte hebben aan een radicaal ander model. Maar het huidige PMJ is ontworpen in een periode waarin de beschikbaarheid van microdata beperkt was en een aantal technieken vaak wel theoretisch bekend waren, maar niet konden worden geïmplementeerd vanwege beperkingen in computertechnologie. Daarom is het zinvol om nu te onderzoeken of er in de afgelopen jaren ontwikkelingen zijn geweest op het gebied van data en prognosetechnieken, die meer of andere inzichten kunnen bieden. Daarbij is onder andere gekeken naar machine learning technieken.
Machine learning modellen zijn vooral datagedreven en dus vooral gebaseerd op correlaties en niet zozeer op causale verbanden, dit in tegenstelling tot econometrische modellen. Een recente ontwikkeling is de groeiende aandacht voor causale en uitlegbare machine learning technieken, de zogenoemde ‘explainable artificial intelligence’ (XAI). Daarmee groeien de machine learning modellen en de econometrische modellen naar elkaar toe. Dit lijkt ook de meest belovende ontwikkelingsrichting voor het PMJ te zijn, maar XAI is op dit moment nog wel een kennisgebied in ontwikkeling. Uit het onderzoek komen een aantal algoritmes naar voren die gegeven de aard van de data, het doel van PMJ en de randvoorwaarden, veel belovend zijn. In een vervolgonderzoek zullen een aantal pilots met deze algoritmes worden uitgevoerd om te kijken of deze algoritmes ook daadwerkelijk tot een hogere voorspelkwaliteit leiden.
Moolenaar, D.E.G.; Braak, F. ter; Tims, B.; Bargh, M.S. (2024). “Voorspellen voor de justitiële ketens - Een verkenning van verschillende technieken”. WODC, cahier 2024-04.
Voorspellen voor de justitiële ketens (wodc.nl)
Contactpersoon: Debora Moolenaar
Alle onderzoeken van de Kennislijn Digitale Rechtsstaat zijn te vinden in de repository.