Nieuws van de Groote Oorlog: Digitalisering van Belgische kranten uit de Eerste Wereldoorlog
Op vraag van het VIAA voert de Vlaamse Erfgoedbibliotheek het project 'Nieuws van de Groote Oorlog' uit, een digitaliseringsproject voor kranten uit de Eerste Wereldoorlog. Bij dertien deelnemende bewaarinstellingen werden periodieke publicaties uit '14-'18 geïnventariseerd om te worden gedigitaliseerd.
Unieke bronnen
N.a.v. de herdenking van de 'Groote Oorlog' is er een hernieuwde belangstelling voor frontbladen, kranten, week- en maandbladen, pamfletten en vlugschriften uit deze periode. Deze nieuwsbladen vormen een belangrijke bron voor de geschiedenis van het leven in België tijdens de Eerste Wereldoorlog. Toch zijn ze amper gekend bij het publiek en meestal alleen op papier of microfilm toegankelijk voor onderzoekers.
Door de gebrekkige kwaliteit van het papier waarop veel van deze publicaties gedrukt zijn, wordt deze archiefbron bovendien sterk bedreigd. Zelfs wanneer de bewaaromstandigheden optimaal zijn, is het natuurlijk verval van het papier hoog. Het papier wordt broos en bij manipulatie is de kans op beschadiging zeer groot. Digitalisering is dus absoluut noodzakelijk om de inhoud van deze documenten voor de toekomst te bewaren én toegankelijk te houden.
Grootschalig digitaliseringsproject
Dankzij een project van het Vlaams Instituut voor Archivering (VIAA) i.s.m. de Vlaamse Erfgoedbibliotheek, FARO, PACKED en diverse cultureel-erfgoedinstellingen wordt een grootschalige digitalisering van periodieke publicaties (frontblaadjes, kranten en tijdschriften) uit de periode 1914-1918 gerealiseerd. Onderzoekers, erfgoedwerkers en specifieke doelgroepen krijgen een nieuwe toegang tot kwetsbare bronnen die een unieke kijk geven op de beeldvorming, nieuwsverstrekking en propaganda rond de oorlog, evenals het leven tijdens de bezetting.
De Vlaamse Erfgoedbibliotheek voerde in opdracht van het VIAA eind 2013 de eerste fasevan dit project uit. Onz projectmedewerker digitalisering inventariseerde de periodieke publicaties uit WO I bij de dertien participerende bewaarinstellingen. Daarbij werdvertrokken van de gegevens in Abraham - Catalogus van Belgische kranten, een databank van de Vlaamse Erfgoedbibliotheek waarin het krantenbezit van bijna honderd bewaarinstellingen in Vlaanderen en Brussel is opgenomen.
De projectmedewerker voerde in overleg met de instellingen een analyse uit van het te digitaliseren materiaal. Daarbij werd de voorlopige selectielijst verder gedetailleerd. Per reeks werden enkele fysieke parameters bepaald zoals de volledigheid van de reeks, het aantal beschikbare edities, de omvang in pagina's, de paginagrootte, etc. Ook de staat van het materiaal en de verpakking werd in kaart gebracht.
Om dubbel werk te vermijden, werd de overlap tussen de collecties en met andere digitaliseringsiniatieven bepaald. Op basis van de analyse werd een selectielijst opgesteld van te digitaliseren publicaties. Die lijst diende onder meer als basis voor het lastenboek waarmee het VIAA de digitalisering aan een firma uitbesteed. Na jurering werd GMS als digitaliseringsfirma gekozen voor het uitvoeren van het project.
In een tweede fase starten de partners met het registreren van hun WO I collectie in het registratiesysteem AMS, krijgen de verschillende nummers een barcode en worden deze verpakt in dozen zodat alles transportklaar is voor de digitaliseringsfirma. Na ophaling door de digitaliseringsfirma gaat de effectieve digitalisering van start. Daarna worden de bestanden opgenomen in de archiefomgeving van het VIAA en ter beschikking gesteld van de bewaarinstellingen. De werkwijze wordt door dit filmpje geïllustreerd
De derde fase is de uiteindelijke ontsluiting van het gedigitaliseerde materiaal via de VIAA publiekswebsite en later ook via bestaande websites als Abraham, Belgian War Press,Flandrica, Europeana en andere kanalen zoals educatieve websites, onderwijspakketten en thematische dossiers op de websites van mediagroepen, kranten, de openbare omroep, etc.
Inventarisatiefase
Bij de inventarisatie werd vertrokken van de gegevens in Abraham - Catalogus van Belgische kranten, een databank waarin het krantenbezit van bijna honderd bewaarinstellingen in Vlaanderen en Brussel is opgenomen.
Tuur voerde in overleg met de instellingen een analyse uit van het te digitaliseren materiaal. Per krantentitel werden enkele fysieke parameters bepaald, zoals de volledigheid van de reeks, het aantal beschikbare edities, de omvang in pagina's, de paginagrootte, etc. Ook de staat van het materiaal en de verpakking werden in kaart gebracht.
Om dubbel werk te vermijden, werd ook de overlap tussen de collecties en met andere digitaliseringsiniatieven bepaald. Op basis van de analyse werd uiteindelijk een selectielijst van te digitaliseren publicaties opgesteld. Die lijst diende onder meer als basis voor het lastenboek waarmee het VIAA de digitalisering aan een firma uitbesteed.
Stand van zaken
De inventarisatie en materiaalanalyse van kranten en nieuwsbladen uit de periode van de Eerste Wereldoorlog werd afgerond. Het overzicht voor de dertien bewaarinstellingen ziet er als volgt uit.
- ADVN: 325 titels - 30.582 pagina's
- AMSAB: 53 titels - 4.490 pagina's
- AMVB: 58 titels - 5.796 pagina's
- Erfgoedbibliotheek Hendrik Conscience: 351 titels - 117.943 pagina's
- In Flanders Fields: 191 titels - 36.035 pagina's
- KADOC: 41 titels - 12.879 pagina's
- KULeuven: 438 titels - 104.635 pagina's
- Letterenhuis: 48 titels - 1.324 pagina's
- Liberaal Archief: 13 titels - 6.988 pagina's
- Memorial Museum Passchendaele 1917: 7 titels - 9.807 pagina's
- PB Limburg: 13 titels - 1.590 pagina's
- PB Tolhuis: 103 titels - 13.505 pagina's
- Universiteit Gent: 227 titels - 104.374 pagina's
Met de bijna 450.000 pagina's die in kaart zijn gebracht, zitten we ver over de aanvankelijke inschatting van 90.000. Na uitfilteren van de dubbels, blijven er nog ongeveer 300.000 pagina's over om te digitaliseren.
Testfase
Op 10 juli 2014 werd een hoeveelheid testmateriaal uit het ADVN bij de digitaliseringsfirma GMS afgeleverd. Dit materiaal werd ingescand volgens de Metamorfoze Light richtlijnen. Er werden ook afgeleide bestanden en OCR bestanden gemaakt. Na een intense kwaliteitscontrole van zowel de moederbestanden, de afgeleiden als de OCR bestanden door PACKED, kan er een go gegeven worden voor de effectieve digitalisering van frontbladen, kranten en tijdschriften door GMS.
Registratie en verpakking
Sinds begin juli 2014 zijn de eerste partners van het Nieuws van de Groote Oorlog project begonnen met het registreren, barcoderen en verpakken van hun materiaal zodat er eind juli een eerste batch te digitaliseren materiaal door GMS kon worden opgehaald bij volgende partners:
- AMSAB: 486 nummers: 2.485 pagina’s
- In Flanders Fields Museum: 4.260 nummers: 23.115 pagina’s
- Letterenhuis: 35 nummers: 228 pagina’s
- Memorial Museum Passchendaele 1917: 877 nummers: 8.955 pagina’s
- Provinciale Bibliotheek Tolhuis: 343 nummers: 5.133 pagina’s
In totaal omvat de eerste batch 6.001 nummers en 39.916 pagina’s.
Het ophalen van de tweede batch werd begin september 2014 voorzien bij volgende partners:
- ADVN: 4.562 nummers - 18.612 pagina’s
- Liberaal Archief: 273 nummers - 1.512 pagina’s
In totaal omvatte de tweede batch 4.835 nummers en 20.124 pagina’s.
Een derde batch werd begin december 2014 bij deze partners opgehaald:
- AMVB: 864 nummers: 5.773 pagina's
- KADOC: 944 nummers: 9.968 pagina's
- KULeuven: 11.510 nummers: 59.071 pagina's
- Provinciale Bibliotheek Limburg: 206 nummers: 1.031 pagina's
Die derde batch bevatte 13.524 nummers en 75.843 pagina's.
Een vierde batch werd eind januari en begin februari 2015 opgehaald bij:
- Erfgoedbibliotheek Hendrik Conscience: 14.940 nummers en 68.862 pagina's
De vijfde en laatste batch werd half januari en eind februari 2015 pgehaald bij:
- UGent: 13.041 nummers en 65.646 pagina's.
De registratiefase van het project werd op 25 februari 2015 afgerond.
Nu de registratie afgerond is, kunnen we een overzicht geven van de precieze aantallen. In totaal werden 270.399 pagina's (verspreid over 52.336 edities en 900 titels) geregistreerd.
De aantallen per bewaarinstelling zien er zo uit:
Digitalisering
Na een intense kwaliteitscontrole van enkele maanden - zowel manueel in Photoshop als automatisch d.m.v. o.a. Delt.ae en ImCheck - van zowel de moederbestanden, de afgeleiden als de OCR bestanden door PACKED en het afstemmen van de kwaliteitsworkflow met de digitaliseringsfirma GMS, werd er begin oktober 2014 een go gegeven worden voor de effectieve digitalisering van frontbladen, kranten en tijdschriften door GMS. 9 oktober 2014 werden de eerste kranten gedigitaliseerd.
De digitalisatie van de 13 collecties zoals hierboven vermeld, werd op 20 maart 2015 afgerond. Nu alle kranten zijn gedigitaliseerd, moeten de essence- en metadata-bestanden nog worden aangeleverd. Dit kan nog wat tijd in beslag nemen omdat het verwerken van de digitale bestanden en het toevoegen van de metadata, waaronder de OCR en de correctie hierop een tijdrovende zaak is. We hopen dat dit in juni 2015 is afgerond.
Als alles goed gaat zal het gedigitaliseerde materiaal in het najaar van 2015 ter beschikking gesteld worden aan de content providers - die hun materiaal al via het VIAA-archiefsysteem kunnen raadplegen - en aan het grote publiek via een website.
De resultaten van het project worden gevaloriseerd en ter beschikking gesteld van de sector via de CEST website en op een workshop over kwaliteitscontrole in digitalisatieprojecten die door PACKED georganiseerd zal worden. Ook is er een voorstel ingediend voor een presentatie op Informatie aan Zee, in september in Oostende.
Nieuwsbrief
Via een regelmatige nieuwsbrief willen we bij het project betrokken partijen en andere geïnteresseerden op de hoogte houden van de ontwikkelingen:
- 2014-09-11 - Projectupdate 4
- 2014-05-15 - Projectupdate 3
- 2013-12-19 - Projectupdate 2
- 2013-11-12 - Projectupdate 1
Als u deze updates ook wenst te onvangen, kunt u zich inschrijven op de verzendlijst.