Digitaal archiveren

Auteur(s):

Nastasia Vanderperren
5/2019

JHOVE Hack Week

  • Verslag

Van 8 tot 12 april 2019 vond de JHOVE Hack Week plaats. Dit event werd georganiseerd door de Open Preservation Foundation (OPF) met als doel JHOVE te verbeteren in het belang van zijn gebruikers. JHOVE is een opensourcetool voor bestandsidentificatie en -validatie voor digitale preservering. Meemoo-medewerker Nastasia Vanderperren nam deel.

Van Hack Days naar Hack Weeks

OPF organiseerde reeds Hack Days in 2016 en 2017. In 2019 werd het format uitgebreid om meer mensen de kans te geven deel te nemen, en organiseerden ze een Hack Week. Het opzet van deze week was om via kleine en snelle fixes de JHOVE-issue-lijst op GitHub te reduceren en het eenvoudiger te maken om toekomstige releases te plannen. Daarvoor werden ontwikkelaars met Java-skills gezocht. Deelnemers die hun eerste stappen in Java zetten, konden ook meedoen. Zij werden gekoppeld aan een meer ervaren ontwikkelaar zodat ze in duo konden werken.

Deze eerste week, gericht op ontwikkeling, werd in september 2019 gevolgd door een tweede Hack Week. Deze was gericht op het aanmaken van nieuwe documentatie.

Deelname meemoo

Onze collega Nastasia nam deel aan deze Hack Week. In het kader van haar opleiding toegepaste informatica was het voor haar interessant om meer ervaring op te doen in Java Development, naast een deelname aan hack-projecten. DPF Manager, de TIFF-validator die ontwikkeld werd tijdens het PREFORMA-project, zal geïntegreerd worden in JHOVE. In functie daarvan was het voor ons interessant om voeling te krijgen met de JHOVE-code. Nastasia hield zich hoofdzakelijk bezig met het oplossen van kleine issues in functie van de verbetering van de leesbaarheid en kwaliteit van de code.

Terugblik op de week in een blogpost van Carl Wilson

Carl Wilson, Technical Lead van de Open Preservation Foundation, gaf in een blogpost een overzicht van de bijdragen en ging kort in op een probleem dat werd vastgesteld met de JHOVE TIFF-module. OPF bedankt daarbij ook alle organisaties en personen die hebben bijgedragen voor hun werk. Samen wordt dit werk ongeveer op één à twee maanden geraamd. Het was een mooi voorbeeld van een opensourcesamenwerkingsproject. Hieronder de vertaalde blogpost:

"De uitgevoerde taken hadden grotendeels betrekking op reeds lang uitstaande ‘technische achterstand’ (technical debt).

Door deze issues op te lossen werd de kwaliteit van de code verbeterd en geconsolideerd in v1.22. Veel van de aanpassingen voegden geen nieuwe kenmerken toe aan JHOVE maar verbeterden de betrouwbaarheid, zodat nieuwe ontwikkelingen eenvoudiger worden.

De problemen die werden aangepakt tijdens de hack week zijn:

  • verbeteren van de kwaliteit en leesbaarheid van de code;

  • verbeteren van de informatie die afgeleverd wordt door de PNG-module;

  • verbeteren van de informatie die afgeleverd wordt door de JPEG2000-module;

  • verbeteren van de PDF-validatie;

  • onderhoud van de code en het verbeteren van de Java-documentatie.

Enkele reviews en integratie van de nieuwe code in de bestaande code zouden nog lopen tot 10 mei 2019, waarna alles in principe afgerond is."

Een minder positief bericht was dat er destijds een probleem was in de TIFF Module v 1.9.1. releases in JHOVE v 1.22. Dit is een neveneffect van wijzigingen in het TIFF-informatierapport gecombineerd met wijzigingen aan de structuur van een foutmelding. Het probleem zorgde voor een fout in TIFF-validatie, waarvoor OPF naar een oplossing zoekt.