Verslag Verkenningsmomenten Krantendigitalisering

In augustus en september organiseerden de Vlaamse Erfgoedbibliotheken en meemoo twee online verkenningsmomenten over de digitalisering van historische kranten. Tijdens deze gesprekken polsten we bij de sector naar de belangrijkste noden en wensen rond dit thema.
De verkenningsmomenten vonden plaats in het kader van het project Abraham 2020. Een van de oorspronkelijke doelstellingen van Abraham 2020 was om een selectie historische Vlaamse kranten te digitaliseren. Met de ontvangen subsidie konden we echter niet zo ver springen. In overleg met de Vlaamse overheid hebben we het digitaliseringsluik van het project daarom geheroriënteerd naar de ontwikkeling van een visie voor een grootschalig en duurzaam Vlaamse digitaliseringsprogramma voor historische kranten. We doen dat in nauwe samenwerking met meemoo, het Vlaams instituut voor het archief.
Bij het ontwikkelen van deze visie gaan we uiteraard participatief te werk, zodat we optimaal op de behoeften van de sector kunnen inspelen. Daarom organiseerden we twee verkenningsmomenten over krantendigitalisering. Zevenendertig erfgoedprofessionals van 33 collectiebeherende instellingen en erfgoedcellen namen hieraan deel. Met een interactieve enquête polsten we naar hun specifieke behoeften en noden. Wat waren de voornaamste bevindingen?
Nood aan een gecentraliseerd programma
Een belangrijke eerste vaststelling was dat de vraag naar een gecentraliseerd programma voor de digitalisering en online ontsluiting van kranten heel concreet aanwezig is.
Opmerkelijk is dat alle deelnemers die al gedigitaliseerde kranten hebben geïnteresseerd zijn om die (ook) op een centraal platform te ontsluiten. Verder gaven de deelnemers die kranten wensen te digitaliseren aan dat ze dat liefst binnen een gemeenschappelijk project zouden willen realiseren. Ten slotte toonde bijna alle deelnemers interesse om deze gedigitaliseerde kranten (ook) op een centraal platform te ontsluiten.
OCR-verbetering is een meerwaarde
Tijdens de verkenningsmomenten legden we enkele opties voor pilootprojecten voor, waaronder een project voor OCR-verbetering. OCR (Optical Character Recognition) is een proces waarbij afbeeldingen van gedrukte teksten geautomatiseerd worden omgezet naar lees- en bewerkbare tekst. Dat maakt zoeken in gedigitaliseerde kranten beduidend makkelijker en efficiënter. Maar deze teksten bevatten vaak nog veel fouten, wat de doorzoekbaarheid en het (her)gebruik van deze bronnen behoorlijk hindert.
Er zijn verschillende manieren om de OCR te verbeteren. Enerzijds kan dat aan de hand van een geautomatiseerde machine-learning technology, in samenwerking met een externe partner of leverancier. Anderzijds is er de mogelijkheid tot het manueel transcriberen van de kranten door engagement van de erfgoedgemeenschap en gebruik van een transcriptie-tool.
De meerderheid van de deelnemers geeft aan dat zij de verbetering van de bestaande OCR-teksten een nuttige inspanning zouden vinden, en tonen een duidelijke voorkeur voor een geautomatiseerd proces.
Papier prioritair voor digitalisering
We polsten bij de deelnemers ook of ze een pilootproject voor de digitalisering van kranten op microfilm zinvol zouden vinden. Dat kost namelijk minder dan de digitalisering van papieren kranten. De deelnemers geven echter duidelijk aan dat digitalisering van papieren kranten voorrang moet krijgen, al vindt 74% van hen het op zich zinvol dat kranten op microfilm worden gedigitaliseerd.
De noden van het doelpubliek als uitgangspunt
Welke doelgroepen willen de collectiebeherende organisaties bereiken met hun gedigitaliseerde kranten? De deelnemers geven aan dat uiteenlopende doelpublieken belangrijk zijn. Amateur- en wetenschappelijke onderzoekers staan bovenaan, op korte afstand gevolgd door drie andere groepen: studenten, het brede publiek en docenten. Journalisten staan op de laatste plaats. Ongeveer de helft van de deelnemers vermeldde dat ook een ‘andere’ doelgroep voor hen relevant is. Daar ging het dan meestal over directe collega’s of collega's van andere erfgoedinstellingen.
We vroegen de collectiebeheerders wat volgens hen nodig is om hun doelgroepen optimaal gebruik te laten maken van gedigitaliseerde kranten. Een gebruiksvriendelijke interface en nuttige zoekfuncties zijn duidelijke must-haves. Twee-derde van de deelnemers vermeldde noden rond zoeken. Daaraan gekoppeld is de behoefte aan goede OCR, die door een kwart van de deelnemers wordt aangehaald. En de helft benadrukt gebruiksvriendelijkheid. Nog een must-have voor bijna de helft van de deelnemers is een goede downloadmogelijkheid voor artikelen, pagina’s, volledige kranten of metadata.
Naar een programma voor het behoud van het Vlaamse krantenerfgoed
De verkenningsmomenten laten zien dat er daadwerkelijk behoefte is aan het digitaliseringsprogramma dat de Vlaamse Erfgoedbibliotheken en meemoo aan het ontwikkelen zijn. In de komende jaren willen we daarom samen met collectiebeheerders werken aan een gedetailleerde blauwdruk voor het programma, de creatie van de basisinfrastructuur voor gedeelde ontsluiting en de operationalisering van digitaliseringsprocessen op landelijke schaal. Een subsidieaanvraag voor zo’n project is momenteel in de maak.
Beschik je over historische kranten en ben je geïnteresseerd om samen te werken aan onze initiatieven? Stuur dan zeker een mail naar Sophia Rochmes, projectleider Abraham 2020, via sophia@vlaamse-erfgoedbibliotheken.be.