Open data klinkt als een belofte. Maar steeds vaker voelt het als een risico. Niet omdat instellingen minder open wíllen zijn, maar omdat de wereld waarin die data circuleert fundamenteel is veranderd. Juridische claims, privacy, geopolitiek, AI-training, commerciële extractie, hybride dreiging: het zijn geen randverschijnselen meer, maar dagelijkse realiteit voor iedereen die data beheert. Ook erfgoeddata.
De ongemakkelijke vraag is daarom niet langer: hoe maken we meer data open?
De vraag is: hoe houden we data open zonder naïef te zijn over misbruik, machtsverhoudingen en verantwoordelijkheid?
In een wereld waarin openheid niet meer onschuldig is, wordt toegangsbeleid geen technische bijzaak, maar een bestuurlijke kernvraag. En precies daar schuurt het idee van een erfgoed-dataspace met het klassieke open-data-denken.
Open is niet onvoorwaardelijk
In deze serie over dataspaces liet ik in het eerste blog zien wat een dataspace is en welk probleem het probeert op te lossen. In tweede blogbouwde ik die opzet uit met meerdere partijen en concrete transacties.
Voordat ik verder ga met nieuwe experimenten, stel ik hier een fundamentelere vraag: wat betekenen toegangsvoorwaarden voor een infrastructuur die zichzelf “open data” noemt? Wat gebeurt er met openheid zodra je juridische, ethische, technische en geopolitieke grenzen serieus neemt?
Je vindt de vorige experimenten in de P-322 Github dataspace-experiments repository.
Hoe open is open?
Die spanning formuleerde ik in een eerder blog als volgt:
Meer grip op de toegang tot data. Met zo min mogelijk afbreuk aan het open karakter van erfgoed en samenleving.
Dat is een hele uitdaging.Misschien gaat een dataspace daarom wel over het weerbaar maken van open infrastructuur.
Het voelt misschien onnatuurlijk om in een open ecosysteem over toegangsbeleid te praten. Toch is het iets dat we al lang doen. We publiceren veel onder voorwaarden en noemen dat "open". We schrijven tekst, maken audio en video en daar hangen we een Creative Commons-licentie aan; en voor software zijn we als publieke sector voorstander van open source licenties.
Alle licenties stellen voorwaarden.
Zelfs bij de meest open Creative Commons-licentie - CC0 Universeel - blijven er (naar Nederlands recht) voorwaarden bestaan waar je als maker geen afstand van kan doen. Dat zijn natuurlijke rechten die je als mens altijd hebt. Bijvoorbeeld het recht op naamsvermelding bij je werk, de bescherming tegen ernstige verminking van dat werk, misleidende toeschrijving, of de aantasting van je eer en naam. Met CC0 beloof je hooguit dat je deze "morele rechten" niet zal uitoefenen.
Maar als puntje bij paaltje komt en iemand maakt misbruik van je werk: dan kun je je recht laten gelden.
Open is nooit onvoorwaardelijk geweest.
Toegangsbeperkingen
Als open nooit onvoorwaardelijk is geweest, volgt daar iets praktisch uit: bronhouders móéten keuzes maken over toegang. Niet als uitzondering, maar als structureel onderdeel van hun taak.
Die keuzes gaan niet alleen over juridische plicht of technische noodzaak. Ze raken ook financiering, schaalbaarheid, ethiek, reputatie, maatschappelijke verantwoordelijkheid en ja, ook geopolitieke realiteit. Met andere woorden: toegangsvoorwaarden zijn zelden een ideologisch statement tegen openheid, maar meestal een poging om openheid werkbaar te houden.
In de praktijk zie je dat instellingen om verschillende — vaak tegelijk geldende — redenen voorwaarden stellen aan toegang tot data. Hieronder werk ik de belangrijkste redenen uit. Niet om ze te rechtvaardigen of af te keuren, maar om zichtbaar te maken welk bestuurlijk en technisch krachtenveld achter “open data” schuilgaat.
Geen data zonder betaling
Bronhouders hebben verschillende redenen om een toegangsbeleid in te richten. De meest voor de hand liggende reden is: de financiële exploitatie van data. Een archief dat foto's laat maken van documenten, kan met de fotograaf het recht op verkoop van die beelden afspreken. Het maken van foto's kost immers geld. Voor bestuurders is het aantrekkelijk om via een nieuwe geldstroom minder afhankelijk te worden van subsidies.
Toch doen we dat in de sector weinig. Niet alleen omdat het organisatie vergt - want dat is te regelen - maar het lijkt ook niet zo binnen de cultuur te passen. Open data en infrastructuur betekenen voor velen "zonder betaling".
Ik heb daar geen mening over, maar vraag me wel af dat een bewuste keuze is.
We vinden het in Nederland wél gewoon om voor een bezoek aan een museum of theater te betalen. Voor het studeren aan een universiteit rekenen we ook collegegeld. Maar een archief of bibliotheek moeten voor ons gevoel dan vaak weer gratis zijn.
Ik snap dat het onvergelijkbare grootheden zijn: maar we zijn wel gewend om voor publieke diensten te betalen. Waar staan data en infrastructuur in dat spectrum?
Elders in de (semi)publieke sector zijn organisaties te vinden die de aan hun toevertrouwde data en infrastructuur uitbaten om zo een deel van hun kosten dekken: het Kadaster, de Kamer van Koophandel, Logius. en SURF zijn daar voorbeelden van.
Er zijn best argumenten te bedenken om dat ook in het erfgoed te doen. Het leveren van een stabiele data infrastructuur waar derden betrouwbaar gebruik van maken kost nu eenmaal geld dat ergens betaald moet worden. Dat zijn kosten die nu bij de bronhouder blijven hangen.
Een dataspace stelt je in staat om die keuze te maken.
Geen data omdat het juridisch niet (altijd) mag
Ook als open 'gratis' betekent, dan kan dat nog steeds niet onvoorwaardelijk betekenen. Er is immers data die we juridisch niet zomaar met iedereen mogen delen.
Er zijn beperkingen in de archiefwet waardoor informatie (nog) niet zonder stevig toegangsbeleid mag worden gepubliceerd. Nu betekent dat voor gebruikers een fysiek bezoek aan het archief; en een heel ingewikkelde weg voor wetenschappers en journalisten om met digitale middelen onderzoek te doen.
Een andere beperking geldt voor gegevens die door de auteurswet worden beschermd. In de tijd dat ik directeur bij de KNAW was, ondersteunde ik een groep wetenschappers die met taaltechnologie moderne Nederlandse literatuur onderzocht. Op die boeken rust een copyright. Die mag je niet zomaar open delen.
Tot slot de olifant waar we direct allemaal aan denken: de Algemene Verordening Privacy (AVG). Als er persoonsgegevens in (kunnen) staan dan mag de data niet zomaar open beschikbaar worden gesteld.
Het is vast niemand ontgaan dat er nogal wat te doen is over het Centraal Archief Bijzondere Rechtspleging (CABR) dat bij het Nationaal Archief in Den Haag ligt. Het CABR bevat de dossiers van mensen die na de Tweede Wereldoorlog zijn onderzocht op beschuldiging van collaboratie.
Lang niet al die dossiers zijn van mensen die zijn vervolgd, en lang niet iedereen die is vervolgd, is ook veroordeeld. In die dossiers staan veel persoonlijke gegevens. Niet alleen van de verdachten maar ook van familie, buren, vrienden, getuigen, en anderen. Het archief is cruciaal voor de verwerking van het verleden, zowel voor onderzoekers als nabestaanden.
Maar het is niet uit te sluiten dat er in de dossiers jonge kinderen worden genoemd, die nu nog leven.
De Autoriteit Persoonsgegevens gaf daarom een formele waarschuwing aan het de minister en het Nationaal Archief om de geplande online publicatie van de dossiers niet door te zetten. Daardoor moest het archief het lange pad inzetten: de demissionaire minister van OCW probeert nu een wijziging in de archiefwet door de kamer te loodsen zodat publicatie van het CABR toch mogelijk wordt.
Dat wil je niet voor iedere collectie moeten regelen.
In geen van deze gevallen betekent het dat de data niet beschikbaar mag zijn. De wet stelt alleen strikte voorwaarden. Dat betekent vaak dat het met de bestaande data infrastructuur niet kan.
Een dataspace stelt je in staat om streng toegangsbeleid te vertalen naar technologie.
Een archief kan met een dataspace gesloten gegevens onder voorwaarden aan journalisten beschikbaar te stellen.
Een uitgeverij of bibliotheek kan auteursrechtelijke werken met bijvoorbeeld geselecteerde onderzoekers delen.
En ook het fysieke toegangsbeleid tot de CABR-leeszaal van het Nationaal Archief kan je met een dataspace naar digitaal beleid vertalen.
Geen data omdat het technisch niet kan
Dan zijn er technische voorwaarden. Het is een open deur maar: de capaciteit van data infrastructuur wordt bepaald door het beschikbare budget. Niet alleen processorkracht, geheugen, en opslag kosten geld; ook voor de kennis om een infrastructuur schaalbaar in te richten, moeten organisaties vaak diep in de buidel tasten.
Het probleem met data infrastructuur is dat het zelden continu in gebruik is. Maar als meerdere gebruikers er tegelijkertijd een beroep op doen, dan kan de belasting snel oplopen.
Een veel gehoorde klacht in de sector is de "onbetrouwbaarheid van SPARQL".
Dat is dit probleem: SPARQL als endpoint is helemaal niet zo onbetrouwbaar. Maar meerdere gebruikers die zélf niet de meest efficiënte queries schrijven en die naar je server sturen, kunnen zo'n forse belasting opleveren dat het ding omgaat.
Daar is SPARQL misschien iets gevoeliger voor, maar dit geldt eigenlijk voor alle infrastructuur.
Het is een duivelsdilemma. Wat kies je dan? Zware machinerie om meerdere inefficiënte gebruikersverzoeken tegelijkertijd af te handelen? Dat kost wat. Terwijl die capaciteit misschien het grootste deel van de dag niets staat te doen. Of lichte en goedkope servers die omvallen als er data wordt opgevraagd?
Hoewel ik het natuurlijk wat overdrijf, is dit wel de basis van het probleem.
En ja, natuurlijk kun je infrastructuur inrichten die flexibel capaciteit toevoegt als dat nodig is, en uitschakelt als er geen beroep op wordt gedaan - maar daarmee ben je eigenlijk alleen de impact van die keuze aan het dempen. Je bouwt meer marge in. We noemen dat schaalbare infrastructuur en ook dat is niet gratis. Dat vergt stevige IT kennis en daar betaal je ook voor.
Een dataspace stelt je in staat om de toegang tot de open servers te beheren.
Je kunt je beleid flexibel inrichten door bijvoorbeeld een wachtrij op te zetten. Een gebruiker krijgt dan wel een sleutel, maar die is gedurende een tijdsblok geldig. Dan moet het dataverzoek worden verzonden en heeft de server geplande capaciteit voor de afhandeling.
Of je richt je dataspace connector zo in dat de datasystemen van de bronhouder zich met de beschikbare capaciteit door de wachtrij heenwerken. Als een verzoek is afgehandeld dan neemt het systeem contact met de gebruiker op zodat die de data kan ophalen.
Dit soort mechanismen zijn geen standaardinstelling van een dataspace, maar sluiten wel nauw aan bij het transactie- en contractmodel waarop dataspaces zijn gebaseerd. Ze vereisen dus vooral een bewuste architectuurkeuze, geen afwijking van het principe.
Geen data omdat we het "juiste" willen doen
Ik heb in eerdere blogs al eens gesproken over de ethische en morele aspecten die zijn verbonden aan het delen van erfgoeddata.
We denken al snel aan afbeeldingen van slachtoffers van oorlogsgeweld, vervolging, of natuurrampen. Of de museale objecten die ik in het project Koloniale Collecties tegen waarin menselijke resten zijn verwerkt.
Maar wat doe je met foto's van objecten uit andere culturen die om religieuze redenen niet getoond mogen worden?
Wat als dat alleen geldt voor vrouwen?
Of alleen voor zwangere vrouwen?
Waar trek je de grens?
Verschillende bronhouders maken daarin andere keuzes. En dat moeten we vooral zo houden. Sommigen zullen voorstander zijn van een radicaal open data beleid en de verantwoordelijkheid bij de gebruiker leggen. Anderen kiezen ervoor om bepaalde data alleen onder voorwaarden beschikbaar te stellen.
Een dataspace maakt die keuze niet zo zwart-wit: open beschikbaar of totaal ontoegankelijk. Het stelt iedere bronhouder zelf in staat om een toegangsbeleid te formuleren.
In een dataspace kan de bronhouder zelfs kiezen iedereen toegang te geven, maar alleen na acceptatie van een "waarschuwing". Dat is vergelijkbaar met wat nieuwszenders bij sommige video's doen: "Let op - deze beelden kunnen als schokkend worden ervaren".
De consumerende systemen kunnen op die waarschuwingen anticiperen, en zelf kiezen hoe ze dat hun gebruikers aanbieden.
Nu nog geen data: het data embargo
Binnen de academische sector is het een veel gehoorde opmerking: "Natuurlijk is mijn data open, maar pas nadat mijn onderzoek is gepubliceerd".
Probleem is dat een dataset vaak niet onder een enkele publicatie ligt. Sommige datasets zijn goed voor een hele wetenschappelijke carrière, of liggen onder het werk van een flinke onderzoeksgroep die er het (financiële) voortbestaan aan dankt.
Kortom: er bestaat een data-embargo.
Maar een embargo betekent niet automatisch dat er sprake is van gesloten data. Volgens de definities is een data-embargo tijdelijk en heeft het een geplande openstelling. Maar ja: dertig jaar is ook tijdelijk.
Je kunt ook niet zeggen dat het tegen de wetenschappelijke FAIR-principes (Findable, Accessible, Interoperable en Reusable) in gaat. FAIR zegt namelijk niet zoveel over open. FAIR gaat over hoe data technisch goed beheerd zijn.
Voor het open karakter van data wordt daarom naast FAIR vaak verwezen naar het Open Science beleid geformuleerd voor Europese wetenschappelijke subsidietrajecten, zoals Horizon Europe.
“What is open science? Open science is an approach to research based on open cooperative work that emphasizes the sharing of knowledge, results and tools as early and widely as possible. It is mandatory under Horizon Europe, and it operates on the principle of being ‘as open as possible, as closed as necessary’.”
- Europese Commissie, Open Science beleid (link)
Ook Open Science staat dus niet gelijk aan onvoorwaardelijk open.
In een dataspace kunnen universiteiten en erfgoedpartners hun eigen databeleid omzetten naar technische toegangsvoorwaarden waardoor het mogelijk wordt om data onder embargo met elkaar uit te wisselen.
Geen data omdat we dat zeggen (de middelvinger naar big tech)
Bestuurders en beleidsmakers hebben meestal weinig bezwaren tegen het principe van open data.
Natuurlijk moeten er afwegingen worden gemaakt over kosten, technologie, compliance, ethiek, en embargo's - maar dat zijn kaders waarbinnen de data open is.
Maar soms worden de redenen irrationeel waarom we data wel open maar niet helemaal open beschikbaar willen stellen.
Wat George Orwell over dieren schreef: "All animals are equal, but some animals are more equal than others", geldt ook voor gebruikers. Niet alle gebruikers zijn gelijk.
Geen probleem: een midden-en-kleinbedrijf van vaderlandse bodem dat collectiesoftware maakt en daarvoor toegang wil tot de data van je instelling.
Geen probleem: een grote onderneming die binnen een publieke raamovereenkomst met je data een dienstplatform voor erfgoeddata maakt.
Geen probleem: een multinational die er specialistische scansoftware mee traint.
Maar over-my-dead-body: een big tech gigant met de jaaromzet van om en nabij een middelgrote Europese economie die AI komt trainen.
Het is een eerlijk sentiment dat in veel beleidskamers klonk waarin ik de afgelopen twee jaar als adviseur heb mogen plaatsnemen. Het voelt onprofessioneel en tegelijkertijd zo begrijpelijk. En dat is goed. Emotie hoort er tenslotte ook bij. Normaal gesproken probeer je van feitelijke observaties naar beleid te werken. Als het gaat om AI dan was de discussie eerder: we willen dit gewoon niet, en hoe vertalen we dat naar een rationeel besluit dat ook nog werkbaar is?
Nu denk ik: met een dataspace zou je het oplossen. Je stelt toetsbare voorwaarden aan de data-transactie waarmee je dit soort activiteiten verstoort.
Geen data want we zijn geen vrienden (meer)
De wereld is nogal heftig in beweging. Ik schrijf dit blog op 26 januari 2026. Vorige week vielen we over de dreiging richting Groenland. Een week eerder was het een eenzijdig vredeskader (een akkoord durf ik het niet te noemen) voor Oekraïne, en de week daarvoor stonden we met open mond te kijken naar Venezuela. Over het conflict in Gaza hebben we het niet meer. En tegen de tijd dat deze tekst in februari verschijnt, zijn we waarschijnlijk twee geopolitieke crises verder.
Het is tijd om op eigen Europese benen te staan. Het is tijd om als EU in een wereld van grootmachten zelf ook een blok van betekenis te zijn.
Moeten we dat nog wel even gaan doen.
Dataspaces spelen hier misschien wel hun grootste rol. Een transactie binnen een dataspace is niet voor niets gemodelleerd op een contractonderhandeling binnen een gemeenschappelijke markt. Toegang tot die markt is de grootste Europese troef. Je zou dataspaces kunnen zien als de opbouw van een Europese digitale markt. Het gaat dan niet meer alleen om een vrij verkeer van mensen, goederen en diensten, maar ook om een vrij verkeer van data. Daar horen ook de wetenschappelijke-, publieke-, en erfgoeddata bij.
Die dataruimte moet beheerd en beschermd worden tegen invloeden van binnen en buiten. Een dataspace maakt onze data weerbaar.
Ik heb wel eens eerder gesproken over de relatie tussen Nederland en onze voormalige koloniën zoals Indonesië en Suriname. De restitutie van erfgoedobjecten naar die landen is niet alleen een morele verplichting, het is ook een uitstekende manier om de relatie te versterken en nauwere (handels)betrekkingen aan te gaan.
Maar met fictieve claims en misinformatie over koloniale objecten zijn die relaties eenvoudig te beschadigen, of kan er onrust binnen de Nederlandse samenleving worden veroorzaakt. Dat is een schoolvoorbeeld van hybride oorlogsvoering. En eentje waar onze sector totaal niet op is voorbereid.
Het is niet moeilijk om te bedenken wie daarvan zou profiteren.
Dit geldt niet alleen voor koloniaal erfgoed. Ik kan me vergelijkbare dreigingen ook voorstellen bij data uit de Tweede Wereldoorlog, het CABR, Joods erfgoed, Islamitisch erfgoed, en de Nederlandse volkscultuur. Er zijn partijen die baat hebben bij polarisering en graag stoken in de Zwarte Piet discussie, het verwijderen van standbeelden, of om het even welke andere discussie over onze identiteit.
Met een dataspace zet je een muur om je data en bepaal je als bronhouder zelf wat open betekent, voor wie, en waarvandaan.
Wat betekenen toegangsvoorwaarden voor open data?
Als open data niet onvoorwaardelijk is, dan volgt daar iets ongemakkelijks uit: openheid is geen eigenschap meer van een dataset, maar van een afspraak. Het is niet langer genoeg om te zeggen dat data “open” is. We moeten expliciet maken onder welke omstandigheden, voor wie, en met welk doel die openheid geldt. Dan verschuift open data van een ideaal naar een vorm van bestuurlijke verantwoordelijkheid.
Toegangsvoorwaarden maken openheid concreet. Ze dwingen instellingen om hun aannames expliciet te formuleren. Wie mag deze data gebruiken? Voor welk type gebruik? Binnen welke juridische, ethische en geopolitieke kaders? Wat vroeger impliciet bleef, wordt nu onderwerp van beleid. Dat is geen verarming van openheid, maar een meer volwassen variant. Openheid wordt daarmee geen alles-of-niets-keuze, maar een schaal waarop instellingen bewuste posities innemen.
Die verschuiving is niet vrijblijvend. Zodra je voorwaarden stelt, erken je dat open data ook machtsverhoudingen kent. Wie voorwaarden formuleert, bepaalt wie wel en niet meedoet. Dat maakt toegangsbeleid onvermijdelijk politiek, ook als het technisch wordt verpakt. Juist daarom is het belangrijk dat die voorwaarden niet verstopt raken in techniek of contracten, maar zichtbaar onderdeel worden van het publieke gesprek over erfgoed, kennis en infrastructuur.
Voor erfgoedinstellingen betekent dit dat open data niet langer alleen gaat over beschikbaar stellen, maar ook over beschermen, afwegen en verantwoorden. Openheid als een vorm van zorg: zorg voor personen, gemeenschappen, historische contexten en maatschappelijke gevolgen. Het is een manier om ruimte te geven zonder naïef te zijn over misbruik, druk en realiteit.
In dat licht zijn toegangsvoorwaarden geen beperking van open data, maar een manier om openheid vol te houden in een wereld die minder open is geworden. In het volgende blog laat ik zien hoe dit soort bestuurlijke keuzes in een dataspace technisch worden vertaald naar identiteiten, policies en contractonderhandelingen. Niet om openheid af te bouwen, maar om het weerbaar te maken.