“Mede onder invloed van o.a. politieke ontwikkelingen en het streven naar duurzaamheid is de noodzaak gegroeid om die afzonderlijke databronnen aan elkaar te kunnen koppelen”

Rijkswaterstaat over de grote meerwaarde van metadata

Rijkswaterstaat (RWS), de uitvoeringsorganisatie van het ministerie van Infrastructuur en Waterstaat, werkt aan een veilig, leefbaar en bereikbaar Nederland. Dat doen ze door de rijkswegen, -vaarwegen en –wateren te beheren en te ontwikkelen. Om haar taken goed te kunnen uitvoeren, zijn onomstotelijk de juiste gegevens nodig. RWS beschikt over enorm veel data. Voorheen was die echter vaak onoverzichtelijk, onduidelijk en onvindbaar. Vandaar dat in 2020 is gestart met het opzetten van een Centraal Toegangspunt Data (CTD). Het CTD moet alle RWS-data via één loket – een datawebshop – vindbaar, begrijpelijk en toepasbaar maken voor iedere RWS-collega, partners én burgers. 

Kasper Kisjes is senior adviseur datamanagement bij het kernteam CDO (Chief Data Officer) van RWS en Product Owner van het CTD. Data vormt daarmee zijn corebusiness: “Vanuit allerlei behoeften zijn in de loop der tijd los van elkaar verschillende datasystemen ontstaan op diverse plekken binnen de organisatie, zonder overkoepelend plan dat ervoor zorgt dat deze op elkaar aansluiten”, vertelt Kasper Kisjes. “Mede onder invloed van o.a. politieke ontwikkelingen en het streven naar duurzaamheid is de noodzaak gegroeid om die afzonderlijke databronnen aan elkaar te kunnen koppelen, zodat verschillende soorten informatie met elkaar kunnen worden gecombineerd. Door al die data op één locatie inzichtelijk en overzichtelijk te maken, zijn mensen binnen RWS in staat om veel betere beslissingen te nemen omdat ze simpelweg meer informatie tot hun beschikking hebben.” 

Drie grote nieuwe bronnen van data 

Dat er ongelooflijk veel data wordt gegenereerd en verzameld door RWS is een feit. Van onderhoudsgegevens van bruggen, sluizen en tunnels, en informatie over het verkeer dat over de wegen stroomt tot alle scheepsbewegingen en hun lading, én gegevens over de waterstand en de waterkwaliteit. “De huidige tijd is natuurlijk sowieso steeds meer data-gedreven. Deze trend wordt nog eens versterkt door drie nieuwe grote bronnen van data. Ten eerste neemt Talking Traffic een grote vlucht. Slimme auto’s zorgen voor een constante stroom van data die met ons als wegbeheerder wordt uitgewisseld. Ten tweede heb je het Internet of Things: al onze bruggen, sluizen en tunnels zijn bijvoorbeeld volgestopt met sensoren, waarmee aanzienlijk meer dan vroeger wordt gemeten. Ten derde hebben we steeds meer satellietgegevens tot onze beschikking. Al die nieuwe datastromen moet je echter wel aan de bestaande bronsystemen kunnen knopen om er iets mee te kunnen.” 

Eerst extern, nu ook intern 

De afgelopen jaren heeft RWS, na het CBS de grootste leverancier van open data in Nederland, al flinke stappen gezet in het ontsluiten van datasets voor het publiek (zie www.data.overheid.nl), mede als gevolg van bijvoorbeeld de Wet Open Overheid. Nu is RWS hoofdzakelijk bezig om intern alles op orde te krijgen. De uitdaging ligt volgens Kasper vooral in het vindbaar en begrijpelijk maken van al die data. “Zeker het laatste wordt nog wel eens vergeten. Degenen die de data inwinnen, snappen deze wel maar je wilt dat ook andere mensen binnen de organisatie er mee aan de slag kunnen. Om dat te bereiken, moet de data niet alleen centraal toegankelijk zijn, maar moet deze ook op een goede manier worden beschreven.” En daar spelen metadata een belangrijke rol in, feitelijk de ‘vlaggetjes’ die ervoor zorgen dat jij de informatie kunt vinden die je op dat moment nodig hebt. “Ook bij de open data valt er op dat gebied nog veel te winnen.” 

Op een gestructureerde manier metadata verzamelen 

Eind 2018 heeft RWS AbelTalent en nog twee andere bedrijven in de arm genomen. “We waren aan het zoeken naar een consistente, gestructureerde manier om al die data te beschrijven, die aansloot op de behoefte van de gebruikers. De genoemde bedrijven hebben ieder een aantal datasets omschreven. Zo hebben we uiteindelijk in nauwe samenspraak een metadata-model ontwikkeld, bestaande uit verschillende categorieën. In 2020 hebben we aan de hand van dit model een nieuwe slag gemaakt in het verzamelen van metadata, samen met AbelTalent. Daarbij ging het o.a. om het opstellen van een korte beschrijving, het toevoegen van relevante trefwoorden (in de taal van de gebruiker) én het koppelen van de data aan bedrijfsobjecten en -aspecten. Het laatste is voor ons van belang omdat we ook de mogelijkheid willen bieden om de data op een visuele manier te doorzoeken: als je in het ‘visuele datalandschap’ bijvoorbeeld op de dijk klikt, zie je precies welke data RWS allemaal over zijn dijken beschikbaar heeft.” 

Verschillende gebruikers, verschillende routes 

“Het lastige is dat je verschillende gebruikers hebt, met ieder hun eigen perspectief. Je moet dus proberen te bedenken via welke routes zij bij de gegevens moeten kunnen komen die voor hen relevant zijn. Een professional van AbelTalent heeft de meest voor de hand liggende routes nu ingevoerd, hierna moet het verder gaan groeien. Momenteel zitten we midden in het ontwikkeltraject van de genoemde visuele zoekomgeving. Daarnaast zijn we druk bezig met het selecteren van het meest geschikte systeem voor metadata. De metadata die vooralsnog in Excel-bestanden zijn vastgelegd, moeten uiteindelijk in dit systeem gaan belanden. Ook met het verzamelen van metadata zijn we zeker nog niet klaar, maar er ligt nu een goede basis waarmee we andere mensen kunnen laten zien waar het naar toe moet gaan. Daar hebben we met z’n allen keihard voor gewerkt. Het heeft ons ook intern geholpen om het draagvlak voor het CTD te vergroten, simpelweg omdat we hiermee hebben bewezen dat het wel degelijk kan!”