Workshop transcriptie- en tekstherkenning met Transkribus (verslag)

Eerste slide presentatie workshop Transkribus

Op dinsdag 19 oktober kwamen 11 collega’s uit de sector samen voor een hands-on workshop rond transcriptie- en tekstherkenning tool Transkribus. Die werd georganiseerd door meemoo in samenwerking met MoMu en de Vlaamse Erfgoedbibliotheken en vond plaats in de bibliotheek van MoMu in Antwerpen.

Expertiseopbouw 

Meemoo, MoMu en de Vlaamse Erfgoedbibliotheken bouwden in 2021 expertise op rond het gebruik van Transkribus, een tool voor transcriptie, automatische tekstherkenning, beeldanalyse en structuurherkenning van gedrukte en handgeschreven historische documenten. 

Voor Nieuwe Tijdingen  — het project voor de digitalisering, duurzame bewaring en online ontsluiting van het Vlaamse krantenerfgoed — werden ground truth bestanden opgesteld. Dit zijn foutvrije versies van tekst en segmentering van een pagina die dienen als referentiemateriaal voor de evaluatie van de OCR-kwaliteit van een representatieve selectie van 75 historische krantenpagina’s. Voor de digitalisering van het Melijn-archief maakte MoMu gebruik van Transkribus om een HTR (handwritten text recognition) model te trainen voor de automatische tekstherkenning van de 17de- en 18de-eeuwse handelscorrespondentie van de Antwerpse textielhandelaarsfamilie Melijn.

Om de opgedane expertise te delen met de sector, sloegen de drie instellingen de handen in elkaar voor het geven van een praktijkgerichte workshop Transkribus waar niet enkel de basis maar ook meer geavanceerd gebruik van Transkribus met collega’s werden gedeeld.

De workshop 

Na een introductie door Amber Tillemans, Projectmedewerker digitalisering aan MoMu, startte de workshop met een reeks presentaties en oefeningen. Deze doelden erop om de collega’s van a tot z door de basisfunctionaliteit van Transkribus te loodsen. 

De eerste presentatie in de voormiddag behandelde en gaf advies over de verschillende oplaadmogelijkheden, bestandsformaten, beeldkwaliteit en het aanmaken en beheren van collecties in Transkribus. Vervolgens gingen we over naar het maken van segmentaties van de lay-out. Met de oefeningen leerden de collega’s handmatige en automatische segmentering toe te passen en te werken met de correctie-tools van Transkribus. Om de voormiddag af te sluiten, kregen de collega’s een inleiding tot de richtlijnen van Transkribus voor het maken van transcripties en leerden ze deze toe te passen met de transcriptie-tools van het platform.

Na de middagpauze rondden we het verhaal over de basisfunctionaliteit af door de verschillende exportmogelijkheden van Transkribus te bespreken. Daarna eindigden we met twee presentaties over het geavanceerdere gebruik van Transkribus. Daarbij stonden we enerzijds stil bij het selecteren en toepassen van bestaande tekstherkenningsmodellen, en hoe je zo'n zelf zo’n model kan creëren door het systeem te ‘trainen’. Anderzijds gingen we dieper in op de toepassing van de user manager-functies en de Transkribus Lite versie, die kan worden gezet bij samenwerkingsprojecten.

Als kers op de taart sloten we de de dag af met een rondleiding door het vernieuwde MoMu.

De presentatie van de workshop Transkribus kan je terugvinden op SlideShare.

  • Nieuwsbericht
  • |
  • 22-11-2021
  • |
  • Montaine Denys (Vlaamse Erfgoedbibliotheken)