318.000 pagina's nieuws van de Groote Oorlog

Stapel dozen met kranten

Op vraag van het VIAA voerde de Vlaamse Erfgoedbibliotheek de eerste, inventariserende fase uit voor 'Nieuws van de Groote Oorlog', het digitaliseringsproject voor Belgische kranten uit de Eerste Wereldoorlog.

Bij de dertien deelnemende bewaarinstellingen werden de periodieke publicaties uit 1914-1918 in kaart gebracht. Aanvankelijke schattingen gingen uit van 90.000 pagina's. Na vier maanden tellen bleken dat er 318.000 te zijn. Dankzij een budgetverhoging kunnen die toch allemaal worden gedigitaliseerd.

Inventarisatie en materiaalanalyse

Projectmedewerker Tuur Van Hove vertrok van de gegevens in Abraham - Catalogus van Belgische kranten, een databank van de Vlaamse Erfgoedbibliotheek waarin het krantenbezit van bijna honderd bewaarinstellingen in Vlaanderen en Brussel is opgenomen. Met die informatie ging hij zestig dagen lang de magazijnen in.

Voor alle Belgische titels uit de Eerste Wereldoorlog werden enkele fysieke checks uitgevoerd om een beter inzicht te krijgen in de volledigheid van de reeks, het aantal edities, het aantal en het formaat van de pagina's, etc. Ook de kwaliteit van het papier, de leesbaarheid van de tekst, en de vorm en de staat van de verpakking werden in kaart gebracht.

Fysieke staat

Hieronder geven we enkele statistieken over de fysieke staat van de krantenreeksen. Die werd vooral beoordeeld in functie van de digitalisering: Is het materiaal voldoende goed verpakt om het te kunnen vervoeren? Zal het gemakkelijk (verder) beschadigd raken tijdens het scannen? Kan de tekst automatisch worden herkend via OCR?

Wat tenminste als 'matig' werd beoordeeld, is met de nodige voorzichtingheid vervoerbaar en verwerkbaar. Het betreft hier gegevens per reeks. Een reeks met weinig pagina's in 1914-1918 weegt dus even zwaar in de percentages als één met veel pagina's.

Verpakking
(Sommige titels bevinden zich zowel in fardes als dozen)

Verpakking van de periodieke publicaties

Staat van de band

Staat van de publicatiebanden

Staat van het papier (Verzuring en beschadigingen)

Staat van het papier

Tekstconditie
(In functie van OCR. Vooral handgeschreven frontblaadjes zijn uiteraard slecht te OCR’en en zullen manueel moeten worden getranscribeerd)

Tekstconditie in functie van OCR

963 titels, 318.000 pagina's

Uit het grondige onderzoek bleek dat 440 krantenreeksen uit 1914-1918 nog niet waren opgenomen in de krantendatabank Abraham. Het totaal aantal reeksen bij de dertien bewaarinstellingen bedroeg 1867, waarbij sommige kranten natuurlijk op verschillende plaatsen worden bewaard. Na het wegfilteren van die dubbels blijken er 963 krantentitels uit de periode 1914-1918 te zijn overgeleverd. Daarvan zijn er 536 'uniek', omdat ze maar in één van de dertien instelling te vinden zijn.

Qua aantal pagina’s komen we op een totaal van 448.000 als we alle aanwezige reeksen optellen. Maar om efficient te digitaliseren, moeten dubbel bewaarde kranten worden weggefilterd. Het twee keer of meer digitaliseren van dezelfde krantenedities is immers verspilling van geld en moeite. Daarom moet trouwens ook de overlap met andere digitaliseringsinitiatieven worden bepaald. Het aantal te digitaliseren pagina's kon tot dusver worden teruggebracht tot 318.000.

Zelfs na het uitfilteren van dubbels is het geschatte aantal pagina's van 90.000 ruimschoots overtroffen. Dat stelde het projectteam voor een probleem: er moest óf een selectie worden gemaakt, óf er was meer geld nodig. De Raad van Bestuur van het VIAA keurde vorige week een aanzienlijke budgetverhoging goed. Daarmee kunnen waarschijnlijk alle kranten uit 1914-1918 worden gedigitaliseerd.

Volgende stappen

Op basis van het verhoogde budget en de voltooide inventaris wordt nu een lastenboek opgesteld waarmee het VIAA de digitalisering zal uitbesteden aan een of meerdere firma's. Ook wordt gewerkt aan het opstellen van een logistieke werkstroom die het mogelijk moet maken de kranten veilig vanuit de magazijnen van de bewaarinstellingen onder de scanner te krijgen - en weer terug. De ontbrekende titels die werden ontdekt tijdens de inventarisatie, worden opgenomen in de krantendatabank Abraham.

In een tweede fase gaat de effectieve digitalisering van start. En tenslotte zullen de bestanden worden opgeladen in de archiefomgeving van het VIAA en ter beschikking gesteld van de erfgoedinstellingen en gebruikersgroepen.

  • Nieuwsbericht
  • |
  • 03-02-2014
  • |
  • David Coppoolse (Vlaamse Erfgoedbibliotheek)