PIDapalooza 2019

  • Verslag

Op 23 en 24 januari vond in Dublin de conferentie PIDapalooza 2019 plaats. Ze werd georganiseerd door California Digital Library, ORCID, Crossref en DataCite. Doel van deze conferentie? De nieuwe uitdagingen en ontwikkelingen op het vlak van persistente identificatie en persistente URI's op het web bespreken op internationaal niveau, en kennis en ervaringen uitwisselen. In het kader van het lopende project 'Een duurzaam beheersmodel voor de CultURIze-tool' nam onze meemoo-collega Alina Saenko deel als spreker.

Het volledige programma van PIDapalooza 2019 is online beschikbaar. De conferentie was grotendeels gericht op wetenschappelijke onderzoekers en universiteiten. Hieronder geven we een samenvatting van de thema's die het meest relevant zijn voor de cultureelerfgoedsector.

Over URI's, PID's en PID-schema's

Gareth Murphy (European Spallation Source ESS) vertelde hoe onderzoek over neutronen ongelooflijk grote hoeveelheden metadata genereert die van persistente identificatie moeten worden voorzien om refereerbaar te zijn. Hij vermeldde hierbij ook dat na bevraging bleek dat er bij hun doelgroep van hergebruikers vraag was naar leesbare en herkenbare persistente URI's om er sneller hun weg in te kunnen vinden.

Paul Walk (DCMI) vertelde over de oplossing die wordt voorzien om persistente identifiers (PIDs) standaard op te nemen in een Dublin Core XML-bestand, de minimumset aan metadata die internationaal wordt gehanteerd als de standaard voor beschrijving van objecten. De persistente URI van elke Dublin Core property zal opgenomen worden als een 'id' attribute van die property (bijvoorbeeld: <dc:creator id="http:// ...">). Dit heeft implicaties voor collectiebeheersystemen die beweren dat ze het Dublin Core minimum volgen in hun metadataschema. Het opnemen van persistente URI's in de minimale metadatabeschrijving van een object wordt dus een verplicht onderdeel, en zal mogelijk moeten worden gemaakt in elk dergelijk collectiebeheersysteem.

Leigh Dodds (Open Data Institute) besprak samen met het publiek het voorstel voor het documenteren en beschrijven van PID-schema's. Welke informatie zou een persoon of een machine moeten kunnen verkrijgen om in te schatten of een PID-schema duurzaam genoeg is? Als bijvoorbeeld een erfgoedinstelling een PID-systeem opstelt om de objecten uit haar collectie te identificeren, zouden in de documentatie van dat systeem onder andere de volgende elementen opgenomen moeten worden: beschrijvende informatie (o.a. naam van het systeem, datum van lancering en voorbeelden van gebruik), beheersinformatie (o.a. instelling verantwoordelijk voor het beheer en toekenningswijze van PIDs) en technische informatie. Het voorsteldocument van Open Data Institute is beschikbaar op Google Docs. Iedereen kan voorstellen toevoegen.

Tijdens de eerste dag werd ook het internationale PID-Forum gelanceerd. Alle geïnteresseerden kunnen zich daar registreren en gesprekken voeren of volgen over verschillende inhoudelijke en technische thema's rond persistente identificatie.

Keynote: wat zijn de succesfactoren voor een duurzaam systeem van persistente URI's?

Opmerkelijk was de keynote van Henry S. Thomson (professor Web Informatics aan de University of Edinburgh) waarin hij een analyse maakte van de succesfactoren van een duurzaam systeem van persistente URI's. Hij maakte een vergelijking met de binominale nomenclatuur als een van de duurzaamste en nog altijd gebruikte systemen van persistente identificatie van concepten. Volgens de spreker zou elk opgericht PID-systeem (ook door een erfgoedinstelling) aan de volgende noden van de gebruikers moeten voldoen:

  • de nood aan verstaanbare, herkenbare en duidelijke communicatie over concepten die wereldwijd begrepen kunnen worden;

  • de nood aan het duurzaam delen en verkrijgen van content over die concepten waarmee je daarna ook effectief iets kan doen;

  • de nood aan het verkrijgen van een status van betrouwbaarheid voor je data of je afgeleide onderzoek als je gebruik maakt van een duurzaam identificatie- en referentiemiddel.

Over het ARK-protocol en de uitdagingen van een PID-systeem

John Kunze (University of California) vertelde over de voorgeschiedenis en de toekomst van het ARK-protocol voor persistente URI's. Volgens hem volgde het ARK-PID-systeem altijd de redenering dat de resolvingfunctie op een Apache-server voldoende moet zijn om een systeem voor persistente URI's op te starten. Hij vertelde daarnaast over de generieke resolverservice die ARK aanbiedt op n2t.net. Andere toekomstplannen voor ARK kan men op de website ARKsintheopen.org raadplegen.

Juha Hakala (National Library of Finland) vertelde over de uitdagingen waar elk PID-systeem vroeg of laat komt voor te staan, zoals de aanpak van de resolvingfunctie, de keuze van de juiste syntax, en de onafhankelijkheid van bestaande technologie en protocollen. Volgens de spreker was geen enkel PID-systeem per se beter dan een ander, maar moeten we de ervaringen en voor- en nadelen van bepaalde keuzes met elkaar delen zodat we in de toekomst betere en duurzamere PID-systemen kunnen opzetten.

Je kan de slides van de presentatie van meemoo-medewerker Alina Saenko over de PID-projecten (2013-2016) en de CultURIze-tool consulteren. Bekijk hieronder de presentatie.