Nieuwe Tijdingen redt historische kranten van het verval

Sinds 2021 zetten we samen met de Vlaamse Erfgoedbibliotheken onze schouders onder het driejarige project "Nieuwe Tijdingen. Landelijk programma voor het behoud van het Vlaamse krantenerfgoed". Het project werkt toe naar een massadigitaliseringsprogramma voor de bedreigde historische kranten in Vlaamse erfgoedcollecties. Hiervoor werken we samen met 45 erfgoedbewarende organisaties. Samen stippelen we de weg uit naar een grootschalige reddingsoperatie.

Vlaanderen heeft een schat aan collecties die niet verloren mogen gaan. Zo willen we dat erfgoed veilig stellen voor de toekomst door het te digitaliseren en vervolgens duurzaam te bewaren en beheren. In het verleden werkten we hierover al samen met de Vlaamse Erfgoedbibliotheken in het project Nieuws van de Groote Oorlog en in het project Abraham 2020.

Uitdaging

De digitalisering van ons krantenerfgoed is broodnodig. Hoe zorgvuldig je een krantencollectie ook bewaart, de verzuring van papier is een onomkeerbaar en onvermijdelijk proces dat met de tijd ieder vel papier treft. Veel kranten vallen gewoonweg uit elkaar, en dat terwijl ze een rijke geschiedkundige bron zijn. Alleen digitalisering kan de inhoud van dit waardevolle erfgoed redden.

© Vlaamse Erfgoedbibliotheken / Metamorfoze - Foto: Yvo Wennekes

© Vlaamse Erfgoedbibliotheken / Metamorfoze - Foto: Yvo Wennekes

Onze rol

Nieuwe Tijdingen vloeit voort uit het project Abraham 2020. Nieuw leven voor oud nieuws. Binnen dat project werd Abraham, de catalogus van Belgische kranten, verder uitgebouwd. Een catalogus van het Vlaamse krantenerfgoed is immers onontbeerlijk voor de start van een massadigitaliseringsproject. We onderzochten samen met de Vlaamse Erfgoedbibliotheken de haalbaarheid van een gecoördineerde aanpak voor de digitalisering van het Vlaamse krantenerfgoed met als eerste resultaat Nieuwe Tijdingen, dat dienst zal doen als voorbereidingstraject.

Als hoofdpartner van Nieuwe Tijdingen staat meemoo mee in voor het overkoepelend beheer van het project. Verder zorgen we voor de intake en duurzame bewaring van gedigitaliseerde kranten samen met onze bestaande contentpartners. Ze worden opgeslagen in het meemoo-archiefsysteem. Op termijn maken we raadpleging van de gedigitaliseerde kranten van diverse collectiebeheerders mogelijk op ons ontsluitingsplatform hetarchief.be.

Aanpak

In drie jaar tijd werken we rond vier lijnen: een digitaliseringsprogramma, de optimalisatie van bestaande content, een performante interface en expertisedeling. Aan het einde van het project landen we op een vijfjarenplan voor grootschalige digitalisering. Daar kan mee na afloop van Nieuwe Tijdingen mee gestart worden van zodra de nodige financiële middelen vrijkomen.

Eerste fase - 2021

In het eerste jaar van het project lag de focus op de ontwikkeling van een praktische blauwdruk voor het landelijke programma.

Planning voor het digitaliseringsprogramma

Om een duidelijk beeld te krijgen van de omvang van het aantal kranten, stelden we een selectielijst op. Die zal als basis dienen voor de grootschalige digitalisering. Zo kunnen we inschatten hoeveel tijd en geld we nodig zullen hebben voor het reddingsprogramma, en ook welke samenwerkingen we zullen aangaan. Om collectiebeheerders te helpen bij de selectie ontwikkelde Vlaamse Erfgoedbibliotheken de online selectietool Courant.

Bestaande content optimaliseren

Daarnaast verkennen we hoe we de doorzoekbaarheid van reeds gedigitaliseerde kranten kunnen verbeteren met nieuwe technieken, bijvoorbeeld via het converteren van de scans naar machineleesbare tekst door middel van Optical Character Recognition (OCR). In deze fase hebben we de OCR-kwaliteit van een representatieve staal getest. Wat blijkt? Er is ruimte voor verbetering van de huidige beschikbare OCR-tekst.

Interface en auteursrechtelijke aspecten

We willen de gedigitaliseerde kranten op een bruikbare manier online publiceren en ter raadpleging aanbieden. Daarom onderzochten we in deze fase hoe de interface van het digitale krantenarchief eruit hoort te zien. Daarnaast maakten we een analyse van de auteursrechtelijke mogelijkheden om ook recentere (nog auteursrechtelijk beschermde) kranten op te nemen op hetarchief.be.

Tweede fase - 2022

Digitaliseringsprogramma

In deze fase verzamelden we concrete informatie in Courant. De collectiebeheerders gingen aan de slag met de titelselectie, rekening houdend met drie basiscriteria: 

  1. De publicatie moet de kenmerken van een krant hebben.

  2. De krant moet gepubliceerd zijn binnen de huidige grenzen van Vlaanderen of elders zijn uitgegeven voor een Vlaams doelpubliek.

  3. De krant mag nog niet gedigitaliseerd zijn.

In de herfst van 2022 hadden al meer dan 30 instellingen informatie aangeleverd, goed voor ruim 3,7 miljoen dringend te digitaliseren pagina's.

In beeld: Adjunct-directrice Mevrouw Donkers bij het krantenarchief van de Oprechte Haarlemsche Courant, Cees de Boer, CC0, via Wikimedia Commons.

In beeld: Adjunct-directrice Mevrouw Donkers bij het krantenarchief van de Oprechte Haarlemsche Courant, Cees de Boer, CC0, via Wikimedia Commons.

Optimalisatie bestaande content

In deze fase bouwden we ook voort op de resultaten van het OCR-onderzoek. Hiervoor namen we het Zwitserse bedrijf Odoma onder de arm. Zij stonden in voor een uitgebreide evaluatie van de kwaliteit van de OCR van gedigitaliseerde krantencollecties in Vlaanderen én brachten het verbeterpotentieel in kaart. Meer daarover ontdek je in dit artikel. Aan de hand van de resultaten konden we bepalen welke kranten(collecties) baat hebben bij verbetering.

Verder werkten we aan een workflow om:

  • een kopie van de gedigitaliseerde krantenpagina's waarop we opnieuw OCR willen toepassen uit het meemoo-archiefsysteem te halen;

  • de nieuwe en verbeterde OCR vervolgens ook weer in het meemoo-archiefsysteem op te nemen. 

Ontwikkeling infrastructuur

In fase 1 hadden we de functionele vereisten voor de interface al helder. Daarmee zullen gebruikers de gedigitaliseerde kranten kunnen raadplegen. In de tweede fase onderzochten we vervolgens de mogelijkheden om de gedigitaliseerde kranten in hetarchief.be te integreren met andere online (kranten)platforms, en stelden we een plan van aanpak op.

Derde fase - 2023

Digitaliseringsprogramma

In het laatste projectjaar operationaliseren we een goed werkend proces voor massadigitalisering, op kleine schaal. Aansluitend bij het GIVE-krantenproject Primeur gaan we aan de slag met de digitalisering van een pilootbatch. Het gaat om ca. 65.000 krantenpagina's van 8 partners die bij het Nederlandse bedrijf Picturae onder de scanner gelegd worden. De pilootorganisaties zijn van uiteenlopende aard, zo zijn we zeker dat ook kleinere en regionale collecties vertegenwoordigd zijn in dit landelijke programma. Het gaat om Stadsarchief Tielt, het Stedelijk Museum Hoogstraten, het Bakkerijmuseum in Veurne en partners van de Erfgoedcel Waasland (gemeentearchief Beveren, gemeentearchief Temse, de heemkundige kring d’Euzie, stadsarchief Lokeren en de Openbare Bibliotheek van Sint-Niklaas).

Na afloop van Nieuwe Tijdingen kan het reddingsprogramma dan op volle kracht vooruit, van zodra de nodige financiële middelen beschikbaar komen.

Optimalisatie bestaande content

In fase 3 voeren we een piloot uit waarin we de OCR van 50 à 100.000 krantenpagina’s willen optimaliseren. Zo kunnen we de gekozen methode operationaliseren, de haalbaarheid van de workflow testen en het financiële plaatje voor de latere grootschalige digitalisering scherpstellen.

De gedigitaliseerde kranten van onze contentpartners nemen we op en bewaren we duurzaam in het meemoo-archiefsysteem. Een uitdaging? Niet alle digitale krantencollecties voldoen aan de standaarden van ons archiefsysteem. Daarvoor zoeken we een oplossing. Vanaf 2024 zullen de gedigitaliseerde kranten dan ontsloten worden via het gebruikersplatform hetarchief.be.

Interface

In deze fase gaan we aan de slag met de ontwikkeling van de kranteninterface, als onderdeel hetarchief.be. De lancering is voorzien voor 2024.

Partners

  • Vlaamse Erfgoedbibliotheken (coördinator)

  • meemoo (hoofdpartner)

  • 45 partnerorganisaties:

    Staatsbibliothek zu Berlin / Stiftung Preußischer Kulturbesitz, Metamorfoze, Histories vzw, Ghent Centre for Digital Humanities - Vakgroep Geschiedenis (Universiteit Gent), KBR, Erfgoedbibliotheek Hendrik Conscience, Universiteitsbibliotheek Antwerpen, Openbare Bibliotheek Brugge, Bibliotheek Hasselt Limburg, KU Leuven Bibliotheken - Bijzondere Collecties, Universiteitsbibliotheek Gent - Boekentoren, Aartsbisschoppelijk Archief te Mechelen, ADVN - archief voor nationale bewegingen, Amsab-Instituut voor Sociale Geschiedenis, AMVB, Archief van de Collegiale O.-L.-Vrouwekerk Aarschot, Koninklijke Heemkring Ascania vzw, den AST, DIVA, Documentatiecentrum Triverius Brakel, KADOC-KU Leuven, Documentatie- en Onderzoekscentrum voor Religie, Cultuur en Samenleving, Lokaal Bestuur Koksijde, Liberas, Memorial Museum Passchendaele 1917, Museum van Deinze en de Leiestreek, Musea Stad Ieper (In Flanders Fields Museum en Yper Museum), Gemeentebestuur Opwijk - ‘t Opwijks Archief, Openbare Bibliotheek Oostende, Stadsarchief Aalst, Stads- en OCMW-archief Brugge, Stadsarchief Diest, Stadsarchief Kortrijk, Stadsarchief Leuven, Stadsarchief Lokeren, Stadsarchief Tongeren, Stadsarchief Tielt, Stedelijk Museum Hoogstraten, Erfgoedcel Denderland, Erfgoeddienst k.ERF,Erfgoedcel Land van Dendermonde, Erfgoedcel Leie Schelde, Interwaas / Erfgoedcel Waasland, zuidwest, Cultuurregio Pajottenland & Zennevallei, CO7

We halen de pagina op, even geduld...