Het GIVE-project zet de eindsprint in
19 sep 2023
Sinds juli 2021 scharen we ons samen met tal van partners achter het Gecoördineerd Initiatief voor Vlaamse Erfgoeddigitalisering (GIVE). De eindmeet is in zicht, want over drie maanden rondt het project af. Voordat we de balans opmaken van 2,5 jaar digitaliseren en metadateren, praten we je graag nog eens bij. Klaar voor een goedgevulde terug- en vooruitblik in dit zesde (!) GIVE-bulletin?
Veilig verpakt en op transport
Het GIVE-krantenproject Primeur (in samenwerking met de Vlaamse Erfgoedbibliotheken) en het GIVE-glasplatenproject zijn massadigitaliseringsprojecten, wat betekent dat we een groot volume materiaal over organisaties heen verwerken. Duizenden glasplaten en kranten ter plekke bij de beheerders digitaliseren, dat leidt ons te ver. Daarom zetten we ze gebundeld op transport, naar onze digitaliseringspartners.
Digitalisering in de eindfase
180.000 glasplaten, 257 topstukken en 630.000 krantenpagina's: da’s een hele boterham om blad voor blad en stuk voor stuk hoogwaardig te digitaliseren. Deze zomer zaten we opnieuw niet stil:

Krantendigitalisering: bijna aan de eindmeet
Sinds januari voorziet onze digitaliseringspartner iedere krantenpagina van een digitale versie. Ondanks de hoge stapels zetten ze er vaart achter: we overschreden zelfs al drie vierde van het totaal.
Hoe Picturae geduldig iedere pagina vastlegt:
Zie je geen filmpje? Controleer even je cookie-instellingen, dan kunnen we deze inhoud ook aan jou tonen. Je cookie-instellingen aanpassen kan onderaan deze pagina. Klik op 'verander uw toestemming' vlak boven de tabel en vink 'voorkeuren' en 'statistieken' aan.
Topstukken digitaliseren op 97%
Zeldzame en onmisbare kunstwerken, manuscripten, tekeningen, sculpturen, … Op het einde van de rit zullen er bijna 260 topstukken door onze handen zijn gegaan. Nog 8 stuks te gaan, en dan zijn alle topstukken binnen dit project gedigitaliseerd! Het is trouwens alle hens aan dek bij zo’n dagje digitaliseren. Loop mee in de Sint-Leonarduskerk van Zoutleeuw.
Alle glasplaten gedigitaliseerd
De digitalisering van meer dan 180.000 glasplaten schoot in januari dit jaar uit de startblokken. Inmiddels zijn alle glasnegatieven, -positieven en lantaarnplaatjes voorzien van een digitaal evenbeeld. Twee derde in Nederland, de overige glasplaten in de Boekentoren en het FOMU. De verhuis van de mobiele digitaliseringsstudio naar die laatste locatie vond trouwens plaats in augustus. Wij gingen mee achter de schermen.
Audio en video vlot doorzoekbaar maken: een update
In het GIVE-project maken we een hele hoop Vlaams erfgoed beter toegankelijk, doorzoekbaar en herbruikbaar. Naast het digitaliseren van nieuwe werken, gaan we ook aan de slag met het materiaal dat zich wél al in het meemoo-archiefsysteem bevindt: duizenden uren aan beeld en geluid uit vorige digitaliseringsoefeningen en digitale instroom. Informatieschatten van jewelste, die door een tekort aan beschrijvende gegevens moeilijk doorzoekbaar zijn. Voor die verrijking integreren we 3 methoden binnen de artificiële intelligentie (AI) met onze systemen. Waar we inmiddels staan, en waarom eind september zo’n kantelmoment is?
Spraakherkenning voor een eerste keer losgelaten
Met de Software-as-a-Service (SaaS) toepassing Speechmatics vertalen we de audiobestanden in het meemoo-archiefsysteem naar transcripties. Dit kant-en-klare model inzetten op Vlaams - en veelal Nederlandstalig - archiefmateriaal, is natuurlijk niet zo rechtlijnig. De lentemaanden stonden dan ook in het teken van integratie, tuning en testing. En dat loonde! Tussen juni en juli doorliep het systeem alle 160.000 uur audio. De resultaten:
Zo’n twee derde werd succesvol voorzien van transcripties.
Eén zesde van de bestanden bevat geen spraak.
Van de overige bestanden kon Speechmatics de gesproken taal niet met voldoende zekerheid achterhalen. In de komende maanden broeden we op een goede aanpak voor deze lading.
Toepassing voor entiteitsherkenning gekozen
De knoop is doorgehakt! Na grondige vergelijkingen kozen we voor de SaaS-toepassing TextRazor. Hiermee halen we relevante plaatsnamen, persoonsnamen, organisatienamen en andere entiteiten uit de prille transcripties. Die toevoegingen maken de zoektocht naar archiefmateriaal opnieuw een stukje toegankelijker. In augustus drukten we de startknop in. De verwerking is nu halfweg, en eind september kennen we de resultaten.
Bonus: TextRazor voert niet alleen de Named Entity Recognition (NER) uit, maar verbindt de gevonden entiteiten ook aan publiek beschikbare autoriteiten, zoals Wikidata.
Gezichten in detectiefase
Wat als je met één zoekopdracht kan achterhalen in welke video’s een bepaalde publieke persoon voorkomt? Dat maken we mogelijk met het gezichtsherkenningsluik. Hierin bouwen we zélf een toepassing, die ook na afloop van het project bruikbaar blijft.
Resultaten en opgedane kennis
De resultaten bewonderen? We maken de gedigitaliseerde kranten, topstukken en glasplaten na een uitvoerige kwaliteitscontrole stelselmatig toegankelijk op onze platformen en, indien mogelijk, op de platformen van onze deelnemende partners. Ook de gegenereerde metadata stomen we klaar voor vlot hergebruik. Dit vraagt nog wat werk, daarom zullen we in de tussentijd enkele mooie pareltjes uitlichten, en onze opgedane kennis delen. Want zit de kracht van dit straf staaltje samenwerken ‘m niet in de details? Binnenkort meer hierover!
Blijf op de hoogte van alles GIVE:
De GIVE-projecten worden gerealiseerd met de steun van het Europees Fonds voor Regionale Ontwikkeling en kaderen binnen het relanceplan Vlaamse Veerkracht van de Vlaamse overheid.
Bronvermelding visual digitalisering:
Lantaarnplaatje uit de collectie van het Speelgoedmuseum
Het gulden boek van de Kapel van Venerabel, deel I, Kapel van het Allerheiligste Sacrament in de Kathedraal van Antwerpen, 1631/1840
Krant De Werker, 1932, uit de collectie van Amsab-ISG