Het GIVE-project zet de eindsprint in

19 sep 2023

Sinds juli 2021 scharen we ons samen met tal van partners achter het Gecoördineerd Initiatief voor Vlaamse Erfgoeddigitalisering (GIVE). De eindmeet is in zicht, want over drie maanden rondt het project af. Voordat we de balans opmaken van 2,5 jaar digitaliseren en metadateren, praten we je graag nog eens bij. Klaar voor een goedgevulde terug- en vooruitblik in dit zesde (!) GIVE-bulletin?

transport

Het GIVE-krantenproject Primeur (in samenwerking met de Vlaamse Erfgoedbibliotheken) en het GIVE-glasplatenproject zijn massadigitaliseringsprojecten, wat betekent dat we een groot volume materiaal over organisaties heen verwerken. Duizenden glasplaten en kranten ter plekke bij de beheerders digitaliseren, dat leidt ons te ver. Daarom zetten we ze gebundeld op transport, naar onze digitaliseringspartners.

Mei vorig jaar vertrokken de eerste transporten naar GMS en Picturae, dit najaar vinden de laatste ritten plaats. Nu de digitalisering op zijn einde loopt, zorgen we dat de kranten en glasplaten veilig teruggebracht worden naar hun beheerders.

Hoe we zo'n transport veilig laten verlopen

Glasplaten en kranten zijn best kwetsbare dragers. We nemen dan ook de nodige maatregelen om ze zo optimaal mogelijk te vervoeren. Onze digitaliseringspartners voeren het transport uit met de grootste zorg, en in optimale klimatologische omstandigheden. De fragiele glasplaten verpakken onze partners in maar liefst drie lagen: een zuurvrij papiertje, kartonnen doos en een stevige container. Zo verloopt alles zonder barsten of scheuren.

In beeld: transport glasplaten in het MAS, foto door meemoo, CC BY-SA

digitalisering

180.000 glasplaten, 257 topstukken en 630.000 krantenpagina's: da’s een hele boterham om blad voor blad en stuk voor stuk hoogwaardig te digitaliseren. Deze zomer zaten we opnieuw niet stil:

Krantendigitalisering: bijna aan de eindmeet

Sinds januari voorziet onze digitaliseringspartner iedere krantenpagina van een digitale versie. Ondanks de hoge stapels zetten ze er vaart achter: we overschreden zelfs al drie vierde van het totaal.

Hoe Picturae geduldig iedere pagina vastlegt:

Zie je geen filmpje? Controleer even je cookie-instellingen, dan kunnen we deze inhoud ook aan jou tonen.

Pas je cookie-instellingen hier aan

Zie je geen filmpje? Controleer even je cookie-instellingen, dan kunnen we deze inhoud ook aan jou tonen. Je cookie-instellingen aanpassen kan onderaan deze pagina. Klik op 'verander uw toestemming' vlak boven de tabel en vink 'voorkeuren' en 'statistieken' aan.

Topstukken digitaliseren op 97%

Zeldzame en onmisbare kunstwerken, manuscripten, tekeningen, sculpturen, … Op het einde van de rit zullen er bijna 260 topstukken door onze handen zijn gegaan. Nog 8 stuks te gaan, en dan zijn alle topstukken binnen dit project gedigitaliseerd! Het is trouwens alle hens aan dek bij zo’n dagje digitaliseren. Loop mee in de Sint-Leonarduskerk van Zoutleeuw.

Naast het fotograferen en 3D-scannen van schilderijen, prenten en sculpturen uit musea en kerken, digitaliseren we in het GIVE-Topstukkenproject ook topstukken uit papier en perkament. Alle 40 werken op onze lijst zijn inmiddels afgevinkt. Er liggen dus heel wat cijfers en weetjes op je te wachten! Een tipje van de sluier: wist je dat visdraad een handige kompaan is bij het digitaliseren van werken die niet uit zichzelf open en vlak blijven liggen? Probeer hem maar te spotten op de foto hiernaast!

In beeld: digitalisering van Manuale pietatis van Marcus Cruyt, uit 1524, f1v, licentie: publiek domein

Alle glasplaten gedigitaliseerd

De digitalisering van meer dan 180.000 glasplaten schoot in januari dit jaar uit de startblokken. Inmiddels zijn alle glasnegatieven, -positieven en lantaarnplaatjes voorzien van een digitaal evenbeeld. Twee derde in Nederland, de overige glasplaten in de Boekentoren en het FOMU. De verhuis van de mobiele digitaliseringsstudio naar die laatste locatie vond trouwens plaats in augustus. Wij gingen mee achter de schermen.

metadataproject

In het GIVE-project maken we een hele hoop Vlaams erfgoed beter toegankelijk, doorzoekbaar en herbruikbaar. Naast het digitaliseren van nieuwe werken, gaan we ook aan de slag met het materiaal dat zich wél al in het meemoo-archiefsysteem bevindt: duizenden uren aan beeld en geluid uit vorige digitaliseringsoefeningen en digitale instroom. Informatieschatten van jewelste, die door een tekort aan beschrijvende gegevens moeilijk doorzoekbaar zijn. Voor die verrijking integreren we 3 methoden binnen de artificiële intelligentie (AI) met onze systemen. Waar we inmiddels staan, en waarom eind september zo’n kantelmoment is?

Spraakherkenning voor een eerste keer losgelaten

Met de Software-as-a-Service (SaaS) toepassing Speechmatics vertalen we de audiobestanden in het meemoo-archiefsysteem naar transcripties. Dit kant-en-klare model inzetten op Vlaams - en veelal Nederlandstalig - archiefmateriaal, is natuurlijk niet zo rechtlijnig. De lentemaanden stonden dan ook in het teken van integratie, tuning en testing. En dat loonde! Tussen juni en juli doorliep het systeem alle 160.000 uur audio. De resultaten:

  • Zo’n twee derde werd succesvol voorzien van transcripties.

  • Eén zesde van de bestanden bevat geen spraak.

  • Van de overige bestanden kon Speechmatics de gesproken taal niet met voldoende zekerheid achterhalen. In de komende maanden broeden we op een goede aanpak voor deze lading.

Nieuwtje: dankzij een upgrade van Speechmatics konden we ook transcripties genereren voor andere talen dan het Nederlands. In totaal genereerden we transcripties voor meer dan 20 talen.

Toepassing voor entiteitsherkenning gekozen

De knoop is doorgehakt! Na grondige vergelijkingen kozen we voor de SaaS-toepassing TextRazor. Hiermee halen we relevante plaatsnamen, persoonsnamen, organisatienamen en andere entiteiten uit de prille transcripties. Die toevoegingen maken de zoektocht naar archiefmateriaal opnieuw een stukje toegankelijker. In augustus drukten we de startknop in. De verwerking is nu halfweg, en eind september kennen we de resultaten.

Bonus: TextRazor voert niet alleen de Named Entity Recognition (NER) uit, maar verbindt de gevonden entiteiten ook aan publiek beschikbare autoriteiten, zoals Wikidata.

Gezichten in detectiefase

Wat als je met één zoekopdracht kan achterhalen in welke video’s een bepaalde publieke persoon voorkomt? Dat maken we mogelijk met het gezichtsherkenningsluik. Hierin bouwen we zélf een toepassing, die ook na afloop van het project bruikbaar blijft.

Waar we staan in het stappenplan:

  • We zetten de laatste puntjes op de i en konden deze zomer van start met stap één: gezichtsdetectie. Deze fase loopt nog tot begin oktober.

  • Hierna kunnen we de gedetecteerde gezichten linken aan een referentieset. Deze set kan je zien als een databank gevuld met foto’s van publieke personen, samengesteld met onze contentpartners. Alle herkende personen linken we trouwens ook aan Wikidata.

  • Om grotere volumes te kunnen verwerken, schaalden we deze gezichtsherkenning recent nog op.

Bron: LIBERAS

resultaten

De resultaten bewonderen? We maken de gedigitaliseerde kranten, topstukken en glasplaten na een uitvoerige kwaliteitscontrole stelselmatig toegankelijk op onze platformen en, indien mogelijk, op de platformen van onze deelnemende partners. Ook de gegenereerde metadata stomen we klaar voor vlot hergebruik. Dit vraagt nog wat werk, daarom zullen we in de tussentijd enkele mooie pareltjes uitlichten, en onze opgedane kennis delen. Want zit de kracht van dit straf staaltje samenwerken ‘m niet in de details? Binnenkort meer hierover!

Blijf op de hoogte van alles GIVE:

De GIVE-projecten worden gerealiseerd met de steun van het Europees Fonds voor Regionale Ontwikkeling en kaderen binnen het relanceplan Vlaamse Veerkracht van de Vlaamse overheid.

Bronvermelding visual digitalisering:

  • Lantaarnplaatje uit de collectie van het Speelgoedmuseum

  • Het gulden boek van de Kapel van Venerabel, deel I, Kapel van het Allerheiligste Sacrament in de Kathedraal van Antwerpen, 1631/1840

  • Krant De Werker, 1932, uit de collectie van Amsab-ISG

We halen de pagina op, even geduld...