Gerelateerde projecten


OpenRefine community workshop: datacleaning, andere functionaliteiten en meet the team

26 apr 2022 | Gent

Wil je grote kuis houden in je collectiedata, maar weet je niet waar te beginnen? Met de tool OpenRefine kan je datasets bewerken en opschonen. Op 26 april organiseren we een OpenRefine community workshop in samenwerking met Collectie van de Gentenaar in het kader van Cultural Data Lab. Je leert er alle basishandelingen van de OpenRefine software én ontdekt een preview van de geplande functionaliteit (beschikbaar vanaf herfst 2022) waarmee je beelden in bulk kan opladen naar Wikimedia Commons.

OpenRefine is een gratis open source software. De tool is krachtig genoeg om grote datasets (tot wel honderdduizenden records) te:

  • manipuleren;

  • transformeren tussen verschillende formaten;

  • koppelen met externe databronnen en kennisbanken, waaronder Wikidata.

Wereldwijd wordt OpenRefine gebruikt door medewerkers van erfgoedinstellingen, onderzoekers, datajournalisten en in vele projecten rond Linked Open Data. Ook in de Wikimedia-gemeenschap is het een populaire tool. Bovendien is OpenRefine bijzonder privacyvriendelijk: de software draait als een server op je eigen computer en de gebruikersinterface bevindt zich in je browser. Je bewerkt je data lokaal, en deelt enkel datasets met anderen als je daar zelf voor kiest.

Wat gaan we doen?

Tijdens deze workshop leer je alle basishandelingen van OpenRefine: data analyseren, filteren, transformeren, clusteren, en koppelen met Wikidata. We gaan ook dieper in op dataverrijking. Daarnaast bekijken we functionaliteiten voor het uploaden van gestructureerde metadata en geven we een preview van uploaden in bulk naar Wikimedia Commons. Na de workshop ben je in staat om zelfstandig met OpenRefine aan de slag te gaan.

In beeld: 'Indische gaststudenten', Bundesarchiv, 1985,CC BY-SA 3.0 de

Praktisch

Waar en wanneer?

De OpenRefine workshop vindt plaats op 26 april 2022 (12.30u tot 16.45u) in zaal De Verwondering in de Krook (Miriam Makebaplein 1, 9000 Gent). Hoe je daar geraakt, lees je hier. De voertaal is Engels.

Programma

  • 12:30-13:30: datacleaning met OpenRefine (door Sandra Fauconnier)

  • 13:30-14:30: dataverrijking met OpenRefine (door Sandra Fauconnier)

  • 14:30-14:45: pauze

  • 14:45-15:45: nieuwe ontwikkelingen Wikimedia Commons: gestructureerde metadata opladen met OpenRefine, crowdsourcing en querying.

  • 15:45-16:15: preview van bulkupload naar Wikimedia Commons met OpenRefine (door Lozana Rossenova)

  • 16:15-16:45: koffie + Q&A

Over de docenten

Sandra Fauconnier

Sandra Fauconnier is kunsthistorica met ruim 20 jaar ervaring in internet- en videoprojecten in de culturele sector. Ze werkte o.a. bij het Nederlands Instituut voor Mediakunst (tegenwoordig LIMA), als projectleider van ARTtube (een videoplatform van Nederlandse en Vlaamse musea) en bij de Wikimedia Foundation. Ze is ook actief bewerker van Wikimedia-projecten (vooral Wikidata en Wikimedia Commons). Momenteel is ze directeur van OpenRefine.

In beeld: 'Sandra Fauconnier', Victor Grigas, CC BY-SA 3.0

Lozana Rossenova

Lozana Rossenova is digitaal ontwerper en onderzoeker, gevestigd in Berlijn. Ze is momenteel een Associate Researcher bij het Open Science Lab in TIB Hannover, waar ze werkt aan het NFDI4Culture-project voor een nationale onderzoeksinfrastructuur van cultureelerfgoeddata. Lozana is vooral geïnteresseerd in het werken met open source en communitygedreven benaderingen van digitale infrastructuren. Ze werkte uitgebreid met Wikibase voor het beheer van linked open data, en geassocieerde Wikimedia-gemeenschappen voor haar PhD-onderzoek met Rhizome (New York) en het Centre for the Study of the Networked Image (Londen). Ze is medeoprichter van de Wikibase Stakeholder Group en lid van de stuurgroep van OpenRefine. Momenteel geeft ze ook ontwerpadviezen aan het OpenRefine-project.

In beeld: 'Lozana Rossenova'

We halen de pagina op, even geduld...