Handvatten voor webharvesting erfgoedinstellingen

De culturele erfgoedsector in Nederland heeft de ambitie om websites en andere webcontent voor volgende generaties te verzamelen en bewaren. Dat kan met webharvesting, waarbij kopieën worden gemaakt van het Nederlandse web. Naast praktische en technische uitdagingen, komen daar ook juridische en beleidsmatige vraagstukken bij. Het Instituut voor Informatierecht (IVIR) van de Universiteit van Amsterdam heeft, in opdracht van het WODC, onderzocht welke handvatten er zijn om de rechtszekerheid rondom webharvesting te waarborgen.

Met webharvestingssoftware, zogenaamde ‘webcrawlers’, kunnen kopieën van (delen van) het internet worden gemaakt. Samen met het proces van archivering zorgt dit ervoor dat webcontent voor het publiek beschikbaar blijft, bijvoorbeeld voor wetenschappelijk onderzoek. Het geeft daarmee invulling aan grondrechten zoals de vrijheid van meningsuiting, de informatievrijheid en het recht op wetenschap. Maar webharvesting kan andere grondrechten juist aantasten, denk hierbij aan auteursrecht, recht op privacy en recht op gegevensbescherming.

Nationale domeincrawls

Culturele erfgoedinstellingen verzamelen en archiveren nu op kleine schaal online content door steeds toestemming te vragen aan de rechthebbenden. Dat is erg tijdrovend en bovendien is het niet altijd duidelijk wie de rechthebbende is. Deze instellingen willen die activiteiten graag uitbreiden en een nationale domeincrawl uitvoeren. Daarbij wordt regelmatig het Nederlandse deel van het internet massaal en systematisch verzameld en gedownload. Vooraf toestemming vragen voor het binnenhalen van content is op deze schaal dan niet meer uitvoerbaar.

Depotverplichting of brede consensus

Er zijn verschillende manieren om dit op te lossen, blijkt uit het onderzoek. Zo kennen Denemarken, het Verenigd Koninkrijk, Frankrijk en Duitsland een wettelijke bewaarplicht voor alle publicaties (depotverplichting). Dat zorgt ervoor dat ook webcontent deel uitmaakt van de collectie van culturele erfgoedinstellingen. Een van de nadelen van deze optie is dat vanwege auteursrecht en gegevensbescherming zo’n archief niet voor het hele internetpubliek toegankelijk is te maken. Het webarchief in Portugal doet dit wel, en voert een nationale domeincrawl uit die qua volume, frequentie en toegankelijkheid omvangrijker is dan de harvestingsactiviteiten in andere landen. Het Portugese systeem rust in de eerste plaats op een brede maatschappelijke consensus, waaronder impliciete toestemming van rechthebbenden. Daarnaast voorkomen een embargoperiode en een efficiënt notice and takedown-systeem onwenselijkheden, zoals inbreuk of onrechtmatig archiefmateriaal.

Voorkeur voor gecentraliseerd systeem

Uit het onderzoek blijkt dat de Nederlandse erfgoedinstellingen weinig animo hebben voor een wettelijke bepaling die hen verplicht (een deel van) het Nederlandse webdomein te archiveren. Ze geven de voorkeur aan een decentraal systeem, waarin alle Nederlandse erfgoedinstellingen in meer of mindere mate aan webharvesting kunnen doen, bijvoorbeeld door het maken van een beredeneerde selectie. Maar gelet op juridische consequenties en om fragmentatie in de sector te voorkomen, past mogelijk beter een systeem waarin de wetgever de taak voor webharvesting opdraagt aan enkele centrale erfgoedinstellingen, zoals de Koninklijke Bibliotheek, Beeld en Geluid en het Nationaal Archief. De kleinere erfgoedinstellingen kunnen dan bij één van de centrale instellingen verzoeken tot archivering indienen.
De onderzoekers hebben ook de mogelijkheden op het gebied van het privacy- en gegevensbeschermingsrecht in kaart gebracht. En zij bieden aanknopingspunten voor een juridische oplossing voor onrechtmatige en illegale inhoud die bij een nationale domeincrawl als “bijvangst” in een webarchief terecht kan komen.