Importeren

Duurzame bewaring begint al voor het importproces, namelijk bij de formaatkeuze van de archiefmasters. Dat zijn de kopieën in de hoogst mogelijke kwaliteit die door meemoo duurzaam bewaard worden. De keuze die we daar bij onze eigen digitaliseringsprojecten in maken is belangrijk voor de verdere, veilige bewaring van archiefmateriaal en bereiden we dus goed voor.

Technische kwaliteitseisen

Belangrijk is dat een bestand zoveel mogelijk informatie bevat, in een zo hoog mogelijke resolutie gemaakt is en geen of enkel lossless compressie bevat. Tegelijkertijd willen we ook een formaat dat goed gedocumenteerd is en waarvoor brede technologische ondersteuning bestaat. Ook voor digitale instroomprojecten zorgt meemoo voor ondersteuning bij de selectie van het formaat. Je leest hier meer over in onze documentatie voor contentpartners (vergeef ons dus het jargon).

Het importproces

Het importproces werkt op basis van een pakket aan data (audio-, video- of fotobestanden) en metadata, die in een vooraf bepaalde structuur moeten aangeboden worden aan het archiefsysteem. In OAIS-termen noemen we dit een SIP-pakket (Submission Information Package).

Bestanden importeren vraagt om een reeks acties, die elk uiteindelijk tot de correcte opslag van materiaal op de archiefinfrastructuur leiden. Het resultaat van elke actie wordt telkens opgeslagen als preserveringsmetadata bij het bestand en dus ook duurzaam bewaard. Zo kunnen we over deze processen rapporteren en zijn alle acties die op archiefmateriaal uitgevoerd worden gedocumenteerd.

Hiervoor gebruiken we de PREMIS-standaard, waarbij we opslaan welke gebruiker of welke applicatie welke actie uitvoerde op welk bestand. Omdat we ook tijdens digitalisering alle stappen bijhouden, kunnen we alle acties die uitgevoerd werden op een bestand nagaan. Zo kunnen we de authenticiteit en de herkomst van een digitaal bestand garanderen.

Schermafbeelding van een reeks PREMIS events, die later opgeslagen worden als metadata

Leesbaarheid van de bestanden

Belangrijk bij de import is dat een bestand leesbaar blijft. Daarom worden bestanden op een aantal manieren gecontroleerd:

  • Bij elke transfer van het bestand controleren we of het bestand bit voor bit identiek is aan het aangeleverde bestand. Hiervoor werken we met een checksum of controlegetal, die samen met het audio-, video- of fotobestand aangeleverd wordt als metadata.

  • Om te weten welke types formaten zich in het archief bevinden en na te gaan of die formaten nog voldoende ondersteund worden, wordt het formaat van elk bestand via een file-identificatietool geïdentificeerd. We gebruiken de Pronom ID om het resultaat als metadata op te slaan.

  • Archiefmasters zijn vaak heel grote bestanden: een gedigitaliseerde krantenpagina is snel 100MB, een marathonuitzending van de VRT kan tot 500GB groot zijn. Om de beelden toch makkelijk te kunnen ontsluiten via het internet worden, naast de archiefmaster, raadplegingsbestanden in een lage resulotie aangemaakt. Daarvoor moet de archiefmaster gelezen en geïnterpreteerd kunnen worden. Een succesvolle omzetting is dus ook een bijkomende garantie op leesbaarheid van het bestand. Indien de omzetting faalt, wordt het verder opgevolgd door een van onze medewerkers en/of door de contentpartners zelf.