Best practices voor de archivering van sociale media in Vlaanderen en Brussel

Welke bronnen zullen toekomstige wetenschappers bij onderzoek naar onze tijd raadplegen? Sociale media zijn niet meer weg te denken in het antwoord op deze vraag. Toch worden ze nog weinig gearchiveerd, vooral omdat er over het archiveren van zulke - bij uitstek vluchtige - content weinig kennis is. Ook evolueren sociale media en bestaande archiveringstools voortdurend, creëren de platformen zelf technische obstakels die archivering bemoeilijken of zelfs onmogelijk maken, is het juridisch kader complex en ontoereikend...

Meemoo lanceerde in 2020 een bevraging naar de archivering van content rond de coronacrisis op websites en sociale media. Vanaf 2021 zetten we een stap verder door in dit project verder expertise op te bouwen rond het capteren en archiveren van individuele socialemedia-accounts en het archiveren van hashtags.

Schermafbeelding van het webarchief van de Twitteraccount van PACKED

Uitdaging

De expertise over de archivering van sociale media is vandaag beperkt, zowel bij archiefinstellingen als bij meemoo zelf. Sociale media vervullen echter een erg belangrijke rol in het communiceren over diverse maatschappelijke onderwerpen, en dat door een brede waaier aan actoren. De kanalen hebben dan ook belang als bron voor onderzoek. Toch worden ze nog steeds weinig gearchiveerd.

Enkele jaren geleden was dezelfde vaststelling over websites het vertrekpunt voor het PROMISE-project rond website-archivering (2017-2019), en van 2019 tot september 2022 liep het BESOCIAL-project rond het archiveren en bewaren van sociale media in België. Onze grote nationale instellingen, zoals o.a. de Koninklijke Bibliotheek zijn de aangewezen spelers om hier samen met universiteiten strategieën en praktijken rond te ontwikkelen.

Onze rol

Voor de Vlaamse cultureelerfgoedsector is meemoo goed geplaatst om in samenwerking met archiefinstellingen kennis rond dit thema samen te brengen en te delen, en zo de deskundigheid in de gehele sector mee te verhogen. KADOC-KU Leuven betrok als aanvrager van de projectsubsidie samen met ons nog een dertiental andere partners bij het project.

In de eerste fase (1/9/2020 - 31/8/2021) van het project lag de focus op het ontwikkelen van best practices om individuele socialemedia-accounts te capteren en te archiveren. Ook gebeurde er voorbereidend onderzoek voor fase twee. We vervulden een belangrijke rol in:

  • de voorbereiding van de captatie van individuele accounts;

  • de captatie van de individuele accounts in een reeks pilootprojecten;

  • de instroom en preservering van de gecapteerde accounts;

  • het voorbereidend onderzoek voor het capteren van sociale media met behulp van API'S en betalende tools, wat in de tweede fase verder wordt uitgewerkt;

  • het projectmanagement, de communicatie en disseminatie.

In de tweede fase (1/9/2021 - 31/8/2022) lag de focus voor meemoo op:

  • de uitvoering van de captatie van (individuele) accounts en socialemediastreams op basis van een trefwoord (event based activity streams) met behulp van API’s en betalende tools;

  • onderzoek naar het juridisch kader voor de captatie en archivering van sociale media;

  • het voorbereiden van fase drie: toegang tot en hergebruik van gearchiveerde sociale media;

  • het projectmanagement, de communicatie en disseminatie.

In de derde en laatste fase (1/9/2022 - 31/8/2023), verleggen we onze focus van het eigenlijk archiveren naar het ontsluiten, via:

  • onderzoek naar hoe we de toegang tot en het hergebruik van de gearchiveerde sociale media kunnen realiseren;

  • een gebruikersonderzoek en onderzoek naar tools om aan de verwachtingen te kunnen voldoen;

  • onderzoek naar juridische aspecten;

  • uitwerking van pilootprojecten betreffende toegang en hergebruik;

  • het projectmanagement, de communicatie en disseminatie.

We ronden deze fase - en het hele project - af met een studiedag waarin we de bevindingen van de drie fase delen.

Aanpak

Afbakening

De uitdagingen op technisch en juridisch vlak zijn complex en er is weinig praktijkervaring in België. Daarom kozen we in dit project om enkel een selectie van de meest gebruikte kanalen te onderzoeken, in het bijzonder Facebook, Instagram en Twitter. De resultaten zullen een basis vormen voor uitbreiding naar andere kanalen in de toekomst.

Pilootprojecten

Het project wordt uitgewerkt aan de hand van concrete use cases. Op basis van de noden van verschillende doelgroepen worden de data van een selectie van socialemediakanalen gecapteerd, gearchiveerd en uiteindelijk ontsloten in de verschillende fasen van het project. We selecteerden elf uiteenlopende pilootprojecten om een zo groot mogelijke variatie aan noden te vatten en ervoor te zorgen dat de resultaten van het project relevant zijn voor een zo groot mogelijke groep van actoren. Naast de partners in de pilootprojecten worden ook partners met bijkomende expertise betrokken in een klankbordgroep van het project, met name KBR en UGent.

Workflows

In het project ontwikkelen we workflows voor: 

  • de captatie van individuele socialemedia-accounts; 

  • de ingest en preservering van individuele socialemediaprofielen;

  • de archivering van hashtags.

Hiervoor testten we de werkbaarheid van enkele tools (gratis en betalend). Daarnaast gebruikten we de exportfuncties van de socialemediaplatformen zelf. We kozen de tools met de beste resultaten en ontwikkelden hier aanpakken rond, die verder getest werden in de pilootprojecten. Onze opgedane expertise vind je op CEST in de vorm van workflows en handleidingen (voor de open source tools). In de pilootprojecten evalueerden onze contentpartners deze workflows. Daarnaast testte een meemoo-stagiaire in projectfase 1 de verschillende workflows uit op het oude Twitter- en YouTube-account van PACKED. Het resultaat van haar stage lees je hier.

Conclusies? Binnen het gamma aan gratis open source tools bestaat niet één tool die alle verschillende types sociale media kan capteren. Wel zijn er enkele werkbare opties, afhankelijk van de precieze noden van gebruikers. Verdere tests met commerciële tools wezen uit dat ook betalende varianten geen totaaloplossing bieden. Daarom zochten we naar een geschikte tool op maat van ieder socialemediaplatform, in plaats van naar één tool voor alle platformen. Daarnaast merkten we op dat de invloed van socialemediaplatformen en wat zijn achter de schermen doen enorm groot is en een effect heeft op de werking van de captatietools. Webpreserver en Archive-It kwamen uit de bus als twee werkbare opties.

Best practices

De rapportering over de pilootprojecten vormde de grondstof voor de ontwikkeling van goede praktijken die vervolgens gepubliceerd werden op CEST, TRACKS en de kennisplatformen van de betrokken partners, zoals de website van KADOC en de FARO-projectendatabank. Ook over het voorbereidend onderzoek in functie van het capteren van sociale media met behulp van API’s en betalende tools publiceerden we een rapport met de resultaten. Dat rapport vormde de vertrekbasis voor de uitvoering van fase 2.

In deze tweede projectfase werd bijkomend aandacht gegeven aan het capteren van socialemediastreams op basis van trefwoord. Naast KADOC en meemoo voerden ook projectpartners ADVN, Amsab-ISG, AMVB, CAVA, Liberas, M HKA en VAi een reeks pilootprojecten uit waarbij socialemediastreams werden gecapteerd op basis van trefwoorden. Ze hadden hierbij aandacht voor de gebruiksvriendelijkheid van de geteste tools, en voor de kwaliteit van de captatie zelf.

Studiedagen

Aan het einde van het traject voorzien we een afsluitende studiedag waarin we de resultaten van het project delen met aandacht voor verdere concrete stappen tot samenwerking in de sector. De tussentijdse resultaten en ervaringen deelden we eerder al op relevante studiedagen van derden in de sector en met onze Nederlandse collega's.

Partners

  • KADOC-KU Leuven (coördinator van het project, samen met meemoo);

  • KBR (expert bibliotheek, en partner in het onderzoeksproject BESOCIAL);

  • Algemeen Rijksarchief (expert publiek archief, en partner in het onderzoeksproject BESOCIAL);

  • UGent (expert digital humanities, en partner in het onderzoeksproject BESOCIAL);

  • Centrum Kunstarchieven Vlaanderen / M HKA (contentprovider);

  • partners Overleg Landelijke Archieven Vlaanderen (contentproviders):

    • ADVN;

    • Amsab-ISG;

    • AMVB;

    • CAVA;

    • Letterenhuis;

    • Liberas;

    • VAi;

  • Instituut voor Mediastudies KU Leuven (IMS) (contentprovider en expert digital humanities).

Heb je een vraag?
Contacteer Rony Vissers
Manager Expertise
We halen de pagina op, even geduld...