Zoek op historische woordfrequentie in DBNL

Afnemende frequentie van het woord rijtuig en opkomst van het woord auto

Sinds deze week is de DBNL ngram-viewer beschikbaar: een instrument voor het grafisch weergeven van zoekresultaten in de Digitale bibliotheek voor de Nederlandse letteren. De nieuwe interface maakt het mogelijk historische woordfrequentie te visualiseren.

In de computationele taalkunde is een ngram een aaneengesloten reeks van n items uit een bepaalde opeenvolging van tekst of spraak. De items kunnen fonemen, lettergrepen, letters, woorden of woordgroepen. De ngrams worden doorgaans verzameld uit een tekst- of spraakcorpus.

De DBNL ngram-viewer geeft het resultaat van een zoekactie weer in de vorm van een grafiek. Daarin is het aantal maal dat een tekenreeks voorkomt uitgezet op een tijdsbalk. Door op de meetpunten in de grafiek te klikken kunt u de vindplaatsen in de teksten bekijken.

Praktisch onderzoeksinstrument

In de afgelopen maanden heeft de historisch letterkundige prof. dr. Els Stronks (Universiteit Utrecht) onderzoek gedaan naar denkbeelden over jongeren in Nederlandstalige teksten. Voor dit onderzoek heeft ze gebruik gemaakt van tekstbestanden uit Delpher, Liederenbank en DBNL. De ngram-viewer werd speciaal voor dit onderzoek ontwikkeld.

Stronks presenteerde haar onderzoeksresultaten als de jaarlijkse KB-lezing. Tijdens het onderzoek heeft ze ook een weblog bijgehouden. Hoe u de ngram-viewer kunt gebruiken, legt Stronks uit in een korte clip.

  • Nieuwsbericht
  • |
  • 16-01-2015
  • |
  • David Coppoolse (Vlaamse Erfgoedbibliotheken)