23 augustus 2018

Na intussen anderhalf jaar werken rond het gebruik van Wikimediaplatformen om podiumkunstenerfgoed een bredere zichtbaarheid te geven, legde PACKED vzw zich de afgelopen maanden ook toe op een aantal tests binnen de beeldende kunsten. We zagen kansen en mogelijkheden in de online agenda van De Witte Raaf, het tijdschrift over recente en hedendaagse kunst, en vroegen hen om de metadata van die agenda vrij te geven voor publicatie op Wikidata. De Witte Raaf stemde daarmee in. Na aanlevering werden de data door PACKED-medewerker Olivier Van D'huynslager opgeschoond en gestructureerd met behulp van de data wrangler OpenRefine 3.0, een gratis en volledig opensourcesoftware waarmee je gemakkelijk grote hoeveelheden data kunt visualiseren, analyseren, manipuleren en corrigeren. Mede door de gegevens die we eerder al van kunstenwerken publiceerden, resulteert deze actie in een mooie set aan verrijkte linked open data.

1. Analyse van de dataset

Met behulp van OpenRefine analyseerde PACKED-medewerker Olivier Van D'huynslager de door De Witte Raaf aangeleverde metadata grondig, en beoordeelde hij ze naar hun capaciteit voor verrijking. Reeds 487 instellingen (tentoonstellingslocaties) bleken over een Wikidatarecord te beschikken, de andere 912 niet. Op basis van die vaststelling hebben we besloten om enkel verder te gaan met de eerste groep instellingen, dus met reeds gekoppelde locaties. Samen zijn ze goed voor 16.312 tentoonstellingen. De overige (nog ongekoppelde) instellingen zijn verbonden aan 10.432 tentoonstellingen. Dat lager aantal is te wijten aan de aard van de instellingen. Het zijn immers vaak kleinere instellingen, zoals culturele centra en (commerciële) galeries. De eerste groep (grotere) instellingen bevat ook Vlaamse musea zoals S.M.A.K., MSK, Mu.ZEE en KMSKA. Dat zijn musea waar PACKED vzw reeds mee samenwerkte, o.a. in het project Linked Open Data publicatie met Wikidata.

2. Voorbereiding van de dataset

Met behulp van de geëxporteerde data van De Witte Raaf konden we elk tentoonstellingsrecord koppelen aan minstens één kunstenaar en/of auteur. Het betreft in totaal 3.267 (unieke) namen (kunstenaars), waarvan 2.134 reeds gekoppeld konden worden aan een Wikidatarecord. De Wikidatarecords voor de overige 1.117 namen heeft PACKED-medewerker Olivier Van D'huynslager met het oog op volledigheid zelf aangemaakt in het kader van dit project. Meer details over de voorbereiding van de dataset vind je hier.

Bij het voorbereiden van de nieuwe records moest een onderscheid worden gemaakt tussen enerzijds tentoonstellingen met het werk van samenwerkingsverbanden van kunstenaars en anderzijds tentoonstellingen met meerdere individuele kunstenaars die elk hun eigen werk toonden. Enig onderzoek was nodig om daarbij fouten te vermijden. Na het aanmaken van de kunstenaars was de laatste controlerende stap na te gaan of er al dan niet reeds Wikidatarecords bestonden voor de tentoonstellingen. Reeds bestaande tentoonstellingen (bv. Documenta IX) werden gekoppeld, andere (bv. Museum for a Small City) werden nieuw aangemaakt in Wikidata.

3. Verrijking van de dataset aan de hand van externe databases en geocoding

Voor het verrijken van de dataset hebben we beroep gedaan op zowel data afkomstig uit de gekoppelde Wikidatarecords als uit externe databanken zoals VIAF. Aan de bestaande Wikidatrecords hebben we VIAF-codes gekoppeld als die koppeling nog ontbrak. In totaal hebben we 1.455 VIAF-identificatiecodes gekoppeld. Op gelijkaardige wijzen konden vanuit OpenLibrary heel wat publicaties (tentoonstellingscatalogi) gekoppeld worden.

OpenRefine lanceerde onlangs met zijn update naar versie 3.0 de mogelijkheid voor het binnentrekken van metadata uit gekoppelde records. Daardoor is het mogelijk om aan elk van de tentoonstellingen een adres en/of geografische coördinaten te koppelen. Indien die coördinaten nog niet in Wikidata zijn opgenomen, is het mogelijk om aan de hand van een specifieke GREL-functie de API van Google Maps aan te spreken en vervolgens de geografische coördinaten te koppelen. Voor een uitgebreide beschrijving van die handeling kun je terecht op deze link. Het koppelen van coördinaten - of geocoding - maakt het nadien mogelijk om Wikidatarecords te plotten op een kaart.

4. Samenstellen en upload van de dataset

Aan de hand van Wikibaseschema's binnen OpenRefine kunnen al deze metadata van zowel bestaande als nieuw aan te maken records in één keer worden uitgevoerd. Zodra het schema is opgesteld, gaat OpenRefine per record na welke velden dienen te worden ingevuld. Voor dit project ontwikkelde PACKED-medewerker Olivier Van D'huynslager een template die als richtlijn kan dienen bij het uploaden van data met betrekking tot tentoonstellingen. Het sjabloon correspondeert met het gebruikte Wikibaseschema in OpenRefine. Het is opgebouwd uit de volgende items, en correspondeert met properties uit Wikidata:

  • type tentoonstelling (P31 - "is een"): variërende tussen (kunst)tentoonstelling, biënnale, triënnale, festival, wedstrijd, etc.;
  • locatie (P276): de locatie van de tentoonstelling;
  • geografische coördinaten (P625): de geografische coördinaten van de locatie;
  • organisator (P664): betreffende de instelling die de tentoonstelling produceerde (kan verschillen van locatie);
  • onderdeel van: in het geval van een biënnale, triënnale, etc. verwijst men hier naar het overkoepelend item (bv. Manifesta 12 is onderdeel van Manifesta);
  • land (P17): het land waar de tentoonstelling plaatsvindt;
  • hoofdonderwerp (P921): het hoofdonderwerp van de tentoonstelling: in het geval van een retrospectieve verwijst men naar een artiest, en in het geval van een thematische tentoonstelling naar een thema of motief;
  • datum begin (P580): de begindatum van de tentoonstelling (dag van vernissage);
  • datum einde (P582): de einddatum van de tentoonstelling (dag van finissage);
  • adres (P969): het adres van de locatie;
  • curator/conservator (P1640): de curator van de tentoonstelling.

Door het uploaden van die data gebeurde er een verrijking op drie verschillende niveaus: niet enkel op niveau van de individuele tentoonstellingen, maar evenzeer op dat van de tentoonstellende instelling en de deelnemende kunstenaars. Ze verwijzen immers alle drie naar elkaar. Met behulp van tools zoals Wikidata Graph Builder, RAW Graphs en SQID kunnen de verbindingen en verwijzingen op verschillende manieren worden gevisualiseerd.

5. Tentoonstellingen aan kunstwerken koppelen

Tenslotte werd een extra verrijking gerealiseerd door tentoonstellingen aan data over kunstwerken te koppelen. Door data uit verschillende bronnen aan elkaar te koppelen, leggen we de basis voor een tentoonstellingshistoriek van kunstwerken op Wikidata. Zelfs internationaal is dat onontgonnen terrein op Wikidata. We namen als voorbeeld de tentoonstelling Museum for a Small City, een tentoonstelling die tussen 2013 en 2014 in S.M.A.K. liep en gecureerd werd door Richard Venlet. De informatie over welke werken op welke tentoonstellingen stonden werd aangeleverd uit de Adlibdatabank van S.M.A.K. PACKED vzw werkte in een eerder traject al samen met S.M.A.K. rond de publicatie van open data over kunstwerken in de collectie. Doordat een aantal van de kunstwerken deel uitmaakte van deze tentoonstelling, konden we de data zinvol verrijken en hergebruiken door ze aan één of meerdere tentoonstellingen te koppelen. Als resultaat kan je enerzijds nagaan welke werken deel uitmaakten van een tentoonstelling, en anderzijds op welke tentoonstellingen een bepaald werk stond. Ook opent dit soort ontsluiting en koppeling van data mogelijkheden voor onderzoek over een hele collectie: wanneer een hele collectie geregistreerd is en aangevuld is met tentoonstellingsdata, kan dat een inzicht geven in het bereik van een collectie, verschillende tendenzen in tentoongestelde werken, welke werken veel reizen, waarheen ze reizen,...

Voor meer informatie en om zelf aan de slag te gaan met archiefmateriaal van jouw organisatie, mail naar info@packed.be.