Best practices voor de archivering van sociale media in Vlaanderen en Brussel

Welke bronnen zullen toekomstige wetenschappers bij onderzoek naar onze tijd raadplegen? Sociale media zijn niet meer weg te denken in het antwoord op deze vraag. Toch worden ze nog weinig gearchiveerd, vooral omdat er over het archiveren van zulke - bij uitstek vluchtige - content weinig kennis is.

Meemoo lanceerde in 2020 een bevraging naar de archivering van content rond de coronacrisis op websites en sociale media. Vanaf 2021 zetten we een stap verder door in dit project verder expertise op te bouwen rond het capteren en archiveren van individuele social media accounts.

Schermafbeelding van het webarchief van de Twitteraccount van PACKED

Uitdaging

De expertise over de archivering van sociale media is vandaag beperkt, zowel bij archiefinstellingen als bij meemoo zelf. Sociale media worden nochtans steeds vaker gebruikt om audiovisueel materiaal te delen. Bij de primaire content wordt op socialemediaplatformen vooral tekstuele context gecreëerd, die op zijn beurt een nieuwe vorm van digitaal geboren erfgoed vormt.

Sociale media vervullen bovendien een erg belangrijke rol in het communiceren over diverse maatschappelijke onderwerpen, en dat door een brede waaier aan actoren. De kanalen hebben dan ook belang als bron voor (wetenschappelijk) onderzoek, maar worden nog steeds weinig gearchiveerd.

Enkele jaren geleden was dezelfde vaststelling over websites het vertrekpunt voor het PROMISE-project rond website-archivering (2017-2019), en nu loopt het BESOCIAL-project (2019-2022). Onze grote nationale instellingen zoals Rijksarchief en Koninklijke Bibliotheek zijn de aangewezen spelers om hier samen met universiteiten strategieën en praktijken rond te ontwikkelen.

Onze rol

Voor de Vlaamse en Brusselse cultureelerfgoedsector is meemoo goed geplaatst om in samenwerking met archiefinstellingen kennis rond dit thema samen te brengen en te delen, en zo de deskundigheid in de gehele sector mee te verhogen. KADOC-KU Leuven betrok als aanvrager van de projectsubsidie samen met ons nog een dertiental andere partners bij het project.

Dit project sluit aan bij vier van de vijf kennisdomeinen van meemoo, nl. preservering van andere en nieuwe formaten, metadata, rechten en privacy en digitale strategie.

In de eerste fase (1/9/2020 - 31/8/2021) van het project lag de focus op het ontwikkelen van best practices om individuele socialmedia-accounts te capteren en te archiveren. Ook gebeurde er voorbereidend onderzoek voor fase twee. We vervulden een belangrijke rol vervullen in:

  • de voorbereiding van de captatie van individuele accounts;

  • de captatie van de individuele accounts in een reeks pilootprojecten;

  • de instroom en preservering van de gecapteerde accounts;

  • het voorbereidend onderzoek voor het capteren van sociale media met behulp van API'S en tools voor derde partijen, wat in een volgende fase verder wordt uitgewerkt;

  • het projectmanagement, de communicatie en disseminatie.

Na een hoop voorbereidend werk tijdens de eerste projectfase ligt de focus in de tweede fase (1/9/2021 - 31/8/2022) voor meemoo op:

  • de verdere voorbereiding op en uitvoering van de captatie van (individuele) accounts en social media streams op basis van een trefwoord (event based activity streams) met behulp van API’s en betalende tools voor derden;

  • de voorbereiding en ontwikkeling van een duurzaam juridisch model voor de captatie en archivering van sociale media;

  • de evaluatie en vergelijking van methodieken, inclusief voorbereiding;

  • het voorbereiden van fase drie: toegang tot en hergebruik van gearchiveerde social media;

  • het projectmanagement, de communicatie en disseminatie.

Aanpak

Afbakening

De uitdagingen op technisch en juridisch vlak zijn complex en er is weinig praktijkervaring in België. Daarom kozen we in dit project om enkel een selectie van de meest gebruikte kanalen te onderzoeken, in het bijzonder Facebook, Instagram en Twitter. De resultaten zullen een basis vormen voor uitbreiding naar andere kanalen in de toekomst.

Pilootprojecten

Het project wordt uitgewerkt aan de hand van concrete use cases. Op basis van de noden van verschillende doelgroepen worden de data van een selectie van sociale mediakanalen gecapteerd, gearchiveerd en uiteindelijk ter beschikking gesteld in de verschillende fasen van het project. We selecteerden elf uiteenlopende pilootprojecten om een zo groot mogelijke variatie aan noden te vatten en ervoor te zorgen dat de resultaten van het project relevant zijn voor een zo groot mogelijke groep van actoren. Naast de partners in de pilootprojecten worden ook partners met bijkomende expertise betrokken in een klankbordgroep van het project, met name Algemeen Rijksarchief, KBR en UGent.

Workflows

In de pilootprojecten ontwikkelen we workflows. Een workflow is een protocol met een beschrijving van:

  • de achtereenvolgende stappen waarmee een bepaald proces wordt uitgevoerd (bv. captatie, ingest of preservering); 

  • welke tools en systemen daarbij gebruikt worden;

  • welke actoren een taak of verantwoordelijkheid hebben in de workflow.

Concreet ontwikkelen we in de eerste fase workflows voor: 

  • de captatie van individuele socialemediaprofielen; 

  • de ingest en preservering van individuele socialemediaprofielen.

Begin 2021 testten we gedurende drie maanden de werkbaarheid van enkele gratis opensourcetools. Daarnaast gebruikten we de exportfuncties van de socialemediaplatformen zelf. We kozen de tools met de beste resultaten en ontwikkelden hier aanpakken rond, die verder getest werden in de pilootprojecten. Onze expertise staat nu online ter beschikking op CEST in de vorm van workflows en handleidingen.

In maart 2021 gingen de pilootprojecten van start waarin onze contentpartners aan de slag gingen met deze workflows en ze evalueerden. Daarnaast testte een meemoo-stagiaire de verschillende workflows uit op het oude Twitter- en YouTube-account van PACKED. Het resultaat van haar stage lees je hier.

Conclusies na projectfase 1? Binnen het gamma aan gratis open source tools bestaat niet één tool die alle verschillende types sociale media kan capteren. Wel zijn er enkele werkbare opties, afhankelijk van de precieze noden van gebruikers. Voor fase 2 selecteerden we enkele betalende tools. Verdere tests zullen uitwijzen of er betalende tools zijn die een aantal van de problemen van de gratis tools kunnen oplossen.

Best practices

De rapportering over de pilootprojecten vormde de grondstof voor de ontwikkeling van goede praktijken die vervolgens gepubliceerd werden op CEST, TRACKS en de kennisplatformen van de betrokken partners. Ook over het voorbereidend onderzoek in functie van het capteren van sociale media met behulp van API’s en tools voor derde partijen publiceerden we een rapport met de resultaten. Dat rapport vormt de vertrekbasis voor de uitvoering van fase 2. In deze tweede projectfase wordt bijkomend aandacht gegeven aan het capteren van social media streams op basis van trefwoord.

Studiedagen

Aan het einde van het traject voorzien we een afsluitende studiedag waarin we de resultaten van het project delen met aandacht voor verdere concrete stappen tot samenwerking in de sector. De resultaten uit fase 1 zijn een eerste stap naar deze studiedag. De tussentijdse resultaten uit fase 1 en 2 zullen eerder al gedeeld worden op relevante studiedagen van derden in de sector.

Partners

  • KADOC-KU Leuven (coördinator van het project, samen met meemoo);

  • KBR (expert bibliotheek, en partner in het onderzoeksproject BESOCIAL);

  • Algemeen Rijksarchief (expert publiek archief, en partner in het onderzoeksproject BESOCIAL);

  • UGent (expert digital humanities, en partner in het onderzoeksproject BESOCIAL);

  • Centrum Kunstarchieven Vlaanderen / M HKA (contentprovider);

  • partners Overleg Landelijke Archieven Vlaanderen (contentproviders):

    • ADVN;

    • Amsab-ISG;

    • AMVB;

    • CAVA;

    • Letterenhuis;

    • Liberas;

    • VAi;

  • Instituut voor Mediastudies KU Leuven (IMS) (contentprovider en expert digital humanities).

Heb je een vraag?
Contacteer Rony Vissers
Manager Expertise