Cata 2020 in 3 uitdagingen


Op 13 juni organiseerden we een infosessie over Cata 2020, het vernieuwingstraject voor Open Vlacc. We praatten de aanwezigen bij over de doelstelling van het project, de strategische uitgangspunten die we daarbij in het achterhoofd willen houden en de plaats die Open Vlacc krijgt binnen de Gemeenschappelijke Basisinfrastructuur Digitale Bibliotheek.

Je kan de
presentatie van de infosessie hier bekijken.

Voor wie er niet bij kon zijn, geven we graag wat meer tekst en uitleg over de uitdagingen waar we met het project voor staan - en dan vooral die die door de aanwezigen als belangrijkste werden geïdentificeerd.

 Uitdagingen

We willen de data in Open Vlacc makkelijker onderhoudbaar

We zijn niet alleen bezig met de aanmaak van nieuwe records, minstens even belangrijk is het bewaken van de consistentie van de databank. En dat onderhoud is niet zo eenvoudig omdat onze data soms vreemd gestructureerd is.
We illustreren dit met twee voorbeelden:

1. We beschrijven nu alles op ‘publicatie’ niveau: elke “editie” van een “werk”, is een volledig nieuwe beschrijving. Dat impliceert dat als je beslist om een onderwerp toe te voegen aan een publicatie, vb “collaboratie” aan Het Verdriet van België, dit niet in één klik kan. De huidige Open Vlacc biedt twee mogelijkheden. De ongecompliceerde behelst het openklikken van de 39 vlaccbeschrijvingen (incl Pools, braille,...) van het werk, en elke beschrijving apart het onderwerp geven.
De technisch onderlegde mogelijkheid bestaat om alle beschrijvingen op een lijst te zetten en in bulk het onderwerp toe te voegen. Daarbij moet je dan maar hopen dat alle beschrijvingen voorzien zijn van een originele titel: anders komen ze niet in je selectie.
Slotsom: er is redundantie in onze beschrijvingen en inkoherentie tussen de beschrijvingen, en dat hangt samen met de manier waarop we de data hebben gestructureerd.

2. Bij sommige auteurs voegen we leefdata toe, bijvoorbeeld om Michael Jackson de popster en Michael Jackson de bier- en whiskeykenner uit elkaar te kunnen houden.
Auteurs bestaan eigenlijk twee keer in Vlacc: één keer in de auteursindex, om dus als auteur of medewerker aan een publicatie te kunnen worden toegekend, en één keer in een onderwerpenindex, voor publicaties
over de persoon in kwestie.
Als er leefdata moeten worden toegevoegd voor een ontdubbeling, dat moet dat opnieuw twee keer gebeuren. En dan komen we terecht in eenzelfde verhaal als hierboven: het is tijdrovend, als het goed gaat zorgt het voor redundantie en als het fout gaat zorgt het voor incoherentie. 

We willen dergelijke problemen oplossen door te evolueren naar een systeem met veel meer duidelijke ‘entiteiten’ die verschillende functies kunnen vervullen binnen het systeem. Een persoon kan kan auteur zijn of onderwerp, een land kan onderwerp zijn of deel van een SISO-code. Entiteiten mogen maar één keer bestaan, zodat ze ook maar één keer onderhouden moeten worden.

Wat we bovenal nodig hebben, en dit is de grootste uitdaging voor het project, is een andere structuur van onze metadata, weg van de digitale steekkaarten die we nu maken, zodat we bijvoorbeeld onderwerpen niet toekennen aan een specifieke publicatie maar aan alle publicaties ineens, door een soort bovenliggend niveau te maken. Met andere woorden, het werk ‘Verdriet van België’ zoals we dat maken in de catalogus, zou eigenlijk in de Vlacc moeten bestaan. Zodat je ook niet kan vergeten om iedere keer je originele titel op exact dezelfde manier in te voeren; je moet ‘m maar één keer invoeren.
Zo vermijden we de redundantie en incoherentie tussen beschrijvingen.

We willen Open Vlacc meer vraaggestuurd

Open Vlacc heeft al sinds haar ontstaan de ambitie om door tijdig titelbeschrijvingen te voorzien, lokale bibliotheken toe te laten hun collectieprocessen efficiënter te organiseren, en met name te vermijden dat bibliografische beschrijvingen lokaal moeten aangemaakt worden. We hebben de afgelopen jaren een evolutie doorgemaakt naar een Open Vlacc die actiever op zoek gaat naar welke beschrijvingen bibliotheken nodig hebben, maar omdat Open Vlacc niet ‘praat’ met de bibliotheeksystemen, blijft het kunst- en vliegwerk. Dit zou de basis van de centrale catalografie moeten zijn, en niet iets dat we achteraf proberen fiksen.  

Het Bibliotheeksysteem vormt in die zin een kans: er komt één systeem waarmee we een koppeling willen maken, om zo snel zicht te krijgen op bestellingen, voorlopige beschrijvingen van bibliotheken en aantal bibs die een beschrijving nodig hebben.

We willen nog veel meer evolueren in de richting van een systeem waarbij bibs basisbeschrijvingen zelf kunnen aanmaken, maar voor de vervollediging kunnen rekenen op Open Vlacc. Een beschrijving kan zo een soort levenscyclus doorlopen: als een bib bestelt moet er een minimale beschrijving zijn. Bij de verwerking van het boek, moet er genoeg info zijn om een etiket mee aan te maken. Verdere verrijking voor de webcatalogus is belangrijk, maar kan later nog.

We willen relaties tussen verwante publicaties in Open Vlacc beheren

Dat werkniveau bestaat eigenlijk al, maar dan ergens anders.

We hebben op de bibliotheekwebsites de afgelopen jaren een geavanceerd systeem van clusteren van edities en versies van publicaties uitgewerkt. Het bezit van de edities in dezelfde taal en hetzelfde materiaal worden daardoor gegroepeerd, de andere ‘versies’ (andere taal, ander materiaal) worden gesuggereerd.

De groepering van “verwante” publicaties gebeurt door nabewerkingen in het systeem dat de publieksinterface opbouwt; zoals we hierboven illustreerden zijn dit in Open Vlacc allemaal losse beschrijvingen, die alleen aan elkaar hangen door het feit dat ze een originele titel en een originele auteur delen.
Die manier van werken, met een post-processing die bestaat uit het delen van twee identieke velden, heeft als nadeel dat je als catalograaf de gevolgen van wat je doet (of verzuimt te doen) bij het invoeren niet kan overzien en pas achteraf, meestal per toeval, ziet waar het misloopt. Bijvoorbeeld omdat je geen originele titel ingeeft of hier een schrijffout in maakt.

We willen in de toekomst in de databank zelf kunnen vastleggen hoe beschrijvingen op de publieksinterface getoond zal worden. Het “klaarzetten’” van de data wordt dus in veel grotere mate de verantwoordelijkheid van Vlacc zelf.

Overigens geldt deze problematiek ook voor de verrijkende metacontent (covers, flapteksten, recensies). Deze wordt - opnieuw - pas in de publieksinterface toegevoegd aan de beschrijvingen, waardoor je ook hier achteraf, en alleen toevallig, merkt dat er iets mis is. Wij willen dat je minstens bij de invoer en het onderhoud ziet wat de gekoppelde gegevens zijn, en idealiter ook vanuit Vlacc fouten kan aanpassen of ook content kan toevoegen, die dan wordt weggeschreven naar de andere systemen.

Hoe gaat het verder?

Het projectteam werkt in het najaar verder aan het bestek. We werken toe naar een aanbesteding begin 2019.
Dit najaar organiseren we nog workshops en infosessies over het project.

Blijf op de hoogte van de stand van zaken van het project via het nieuws op deze site of via de Open Vlacc nieuwsbrief.

Vragen? Lisbeth.vandoorne@cultuurconnect.be

wat verwacht je van vlacc