Transcriptie Nederlandse kranten uit 17e eeuw via crowdsourcing

De Nederlandse Koninklijke Bibliotheek (KB) heeft een enorme hoeveelheid historische kranten gedigitaliseerd en met optische tekenherkenning gelezen, zodat ze voor het algemene publiek doorzoekbaar zijn. De oudste Nederlandse kranten zijn gezet in gotische letters: de collectie gaat immers terug tot 1618 en dit was toen een gangbaar schrift.
De software voor optische tekenherkenning, waarmee teksten doorzoekbaar worden gemaakt, kan dit schrift niet lezen. Dat betekent dat men niet naar woorden of namen in de kranten kan zoeken: die worden namelijk niet gevonden. Jammer, want de kranten zijn inhoudelijk heel interessant. Ze geven het nieuws van vierhonderd jaar geleden: dichter op het verleden kun je bijna niet komen.
Overtikken door vrijwilligers
Om het probleem te verhelpen is het Meertens Instituut, dat zich bezighoudt met de bestudering en documentatie van Nederlandse taal en cultuur, samen met de KB een crowdsourcing-project gestart. Honderd vrijwilligers zullen de gotische krantenteksten overtikken. Naar verwachting hebben ze ongeveer anderhalf jaar nodig om alle 17de-eeuwse kranten te verwerken.
Vrijwilligers die gotisch schrift kunnen lezen en de oude tekst min of meer begrijpen, worden uitgenodigd mee te helpen. Het werk wordt vanuit huis gedaan, en het staat ieder vrij zo veel of zo weinig tijd eraan te besteden als hem of haar ter beschikking staat. Voor de transcriptie is een speciale website opgezet.