Van topstukken tot gezichtsherkenning: het jaareinde in met GIVE

12 dec 2022

December, dat is… stilaan aftellen naar het nieuwe jaar. Uitbollen zit er voor ons met het Gecoördineerd Initiatief voor Vlaamse Erfgoeddigitalisering (GIVE) niet in, want eind 2023 moet het project rond digitalisering en automatische metadatering afgerond zijn.

Niet veel tijd om te lezen? Deze update in ‘t kort: we kozen een aanpak voor gezichtsherkenning, de digitalisering van kranten en glasplaten schiet bijna van start, en we gingen op plaatsbezoek bij de beheerders van topstukken.

In beeld: Reading a newspaper at the train station, collectie Fortepan, foto door Lipovits Károly, licentie: CC BY-SA 3.0

In het Topstukkenluik zullen er zo’n 250 topstukken door onze handen gaan. Stuk voor stuk krijgen de werken een hoogwaardige digitale reproductie. Wat een werk tot topstuk maakt? 

Voorbereidende plaatsbezoeken

Na de selectie van veertig werken uit papier of perkament, zoals poortersboeken, muziekpartituren, koorboeken, fragmenten, een dagboek ..., stomen we alles klaar voor digitalisering. Projectleider Lobke reisde de afgelopen maanden heel Vlaanderen af om de logistieke puzzel te leggen en had het met de erfgoedbeheerders over:

  1. mogelijke voorbehandelingen en aandachtspunten bij digitalisering;

  2. een geschikte locatie waar gedigitaliseerd kan worden;

  3. welke metadata meegaan;

  4. de stappen naar ontsluiting toe.

En hierna? We plannen de laatste plaatsbezoeken en bereiden alles voor op de digitalisering op 11 locaties. 

Projectleider Lobke op plaatsbezoek in de Antwerpse Onze-Lieve-Vrouwekathedraal, in beeld het Gulden Boek van de Kapel van het Venerabel

Bonus!

Dit project trok de aandacht van OKV, een tijdschrift vol kunst- en erfgoednieuws. We praatten hen bij in een interview. Benieuwd naar het resultaat?

(Gigapixel)fotografie en 3D-scanning verlopen gezwind

  • Bijna de helft van de topstukken uit 2D-materiaal (zoals schilderijen, tekeningen en prenten) is gefotografeerd. Het merendeel hiervan zijn werken in bewaring bij musea - opnames in kerken houden we voor de wintermaanden, dan is het rustiger en gunstiger qua licht.

  • Alvast één derde van de topstukken waarvan we een gigapixelopname voorzien, werd tot in het kleinste detail gefotografeerd. Het proces bekijk je in onderstaand filmpje, bij Panorama Zeeland van Museum Plantin-Moretus:

En daarnaast? Terwijl we onze lijst verder afvinken, bereiden we de archivering van de digitale objecten en hun metadata voor. We voeren ook een kwaliteitscontrole uit met behulp van de Rijksmuseum Image Processing Tool.

Sinds onze vorige update bereikte de krantenregistratie een nieuwe mijlpaal: samen met onze projectpartner vzw Vlaamse Erfgoedbibliotheken registreerden we ruim 80.000 kranten en onderwierpen we de geregistreerde gegevens aan uitvoerige controles. Nog héél even en we kunnen van start met digitaliseren, want afgelopen week schakelde het project een tandje hoger. We klopten de vorm af waarin de metadata bij de kranten zullen instromen (het XML-bestand), en zetten de laatste voorbereidende stappen. Zo liggen we op koers om 2023 al digitaliserend in te zetten!

Bij Picturae staat de opstelling alvast klaar, en in de kasten ligt een voorraad kranten geduldig te wachten op het einde van het kerstverlof…

Digitaliseringsopstelling bij Picturae

Kast met te digitaliseren kranten bij Picturae

Welke rol kan machine learning spelen in de cultureelerfgoedsector? In drie trajecten (gezichtsherkenning, spraakherkenning en entiteitsherkenning) onderzoeken we hoe we metadata semi-automatisch kunnen verrijken en archiefmateriaal vlotter vindbaar maken. Ben jij een contentpartner van meemoo met interesse in het topic? Het verslag van iedere bijeenkomst van de werkgroep vind je op het partnerportaal.

Waar we staan?

Na maanden van analyse werd de knoop in oktober doorgehakt: we bouwen het systeem voor gezichtsdetectie en -herkenning zélf, en werken hiervoor verder op de resultaten van het onlangs afgeronde FAME-project en het daaropvolgende onderzoekstraject. Zo garanderen we het opschalen van de verwerking van videomateriaal. Het systeem is momenteel al volop in ontwikkeling.

Voor het spraakherkenningsluik kiezen we deze maand een leverancier. Het systeem hierachter integreren we begin volgend jaar in onze architectuur, hierna gaat de verwerking van audio naar transcripties van start. Op deze gegenereerde teksten laten we vervolgens entiteitsherkenning (NER) los. Later meer hierover.

In beeld: Bart De Wever, foto van Michiel Hendryckx, CC BY-SA 3.0, via Wikimedia Commons.

Ethisch en juridisch luik aangescherpt

Met artificiële intelligentie dien je voorzichtig om te springen. Daarom bouwen we samen met onze partners aan een robuuste ethische en juridische omkadering. We gingen in zee met Kenniscentrum Data en Maatschappij (KDM), die in drie workshops rond ethiek in dialoog gaan met stakeholders in het project. Samen met IFORI sleutelen we aan een juridisch kader.

Dat er een nood is om naast audiovisueel materiaal ook fotomateriaal te digitaliseren, staat al even op onze radar. Met dit glasplatenproject zetten we een eerste stap. Sinds februari zijn onze contentpartners volop in de weer met het registreren en verpakken van zo’n 170.000 plaatjes. Onlangs bereikten we de mijlpaal van meer dan 100.000 glasplaten, goed voor 70% van het totaal!

Lantaarnplaatjes, glasnegatieven en -positieven, plaatjes met verschillende afmetingen, in kleur of zwart-wit… De collectie is immens divers. Iedere glasplaatvariant krijgt technische afspraken op maat, maar tegelijkertijd willen we het digitaliseringsproces uniform en controleerbaar houden. En dat proces schiet snel van start, want vorige week rondden we de testfase af!

P.S. Leuke nazindering van het persmoment: we kropen in onze pen voor een Inspiratie-artikel in de nieuwste META. Abonnees vinden het artikel hier.

In beeld: in de Boekentoren wordt alles in gereedheid gebracht voor de in situ digitalisering.

In beeld: projectleider Axelle in META.

De GIVE-projecten worden gerealiseerd met de steun van het Europees Fonds voor Regionale Ontwikkeling en kaderen binnen het relanceplan Vlaamse Veerkracht van de Vlaamse overheid.

We halen de pagina op, even geduld...