IT-lands: Massa-digitalisering
Ik ben daar ontzettend blij mee. Onlangs heb ik nog lopen zeuren dat de Nederlandse overheid in vergelijking met het buitenland zo achterloopt in de ondersteuning van massadigitalisering. Of dat geholpen heeft weet ik niet, maar ik moet bekennen dat nu het werkelijk ergens op begint te lijken.
Want die subsidie van OCW is niet de enige die dit jaar is vrijgekomen. Aan het begin van het jaar heeft de Koninklijke Bibliotheek van OCW 13 miljoen euro gekregen om landelijke, regionale en koloniale dagbladen uit de periode 1618-1995 te scannen en via internet toegankelijk te maken. Dat project gaat dit najaar van start en moet in 2010 zijn voltooid: er zullen dan zo’n acht miljoen historische krantenpagina’s fulltext doorzoekbaar zijn. En dan krijgt de KB óók nog 10,5 miljoen euro om tussen nu en 2010 de zogenoemde Handelingen en Kamerstukken van de Staten-Generaal van 1814 tot 1995 te digitaliseren (samen 2,5 miljoen pagina’s). Kortom, er wordt de komende jaren 27,3 miljoen euro besteed aan het digitaliseren en op internet beschikbaar stellen van (oude) Nederlandse teksten.
Zoals gezegd: ik vind dat fantastisch. Waarom? Omdat hiermee een ongelooflijke hoeveelheid historische bronnen wordt ontsloten. Ik hoef hier niet uit te leggen hoeveel makkelijker en sneller je straks die bronnen kunt doorzoeken. De toepassingsmogelijkheden zijn erg groot – op het minisymposium vorige week over ‘Massadigitalisering in de geesteswetenschappen’ lag de nadruk op de wetenschappelijke toepassingen, maar bijvoorbeeld ook amateurgenealogen die op zoek zijn naar familieadvertenties krijgen er met die oude kranten een goudmijn bij.
Zelf zal ik straks in die teksten vooral op zoek gaan naar de vroegste vindplaatsen van woorden en uitdrukkingen. Dat doe ik nu al in de diverse historische tekstbestanden die op internet staan, maar voor dit soort onderzoek geldt bij uitstek: hoe meer, hoe beter. Het liefst zou ik willen dat de complete Nederlandse literatuur op internet wordt gezet, plus alle kranten, tijdschriften en pamfletten, maar voor de komende vier jaar ben ik dik tevreden met wat er nu allemaal aan komt.
Voor mijn vakgebied – de etymologie, de wetenschap die zich bezighoudt met de herkomst van woorden en uitdrukkingen – gaat dat veel nieuws opleveren, vooral voor de dateringen. Lang is nauwelijks aandacht besteed aan dat aspect van woordgeschiedenissen, maar door de digitale revolutie is dat compleet veranderd: wie al die nieuwe bronnen goed weet te benutten kan opeens veel meer vinden dan zo’n tien jaar geleden. Dat is de reden waarom ik oprecht blij ben met die extra gelden: hoe groter het aanbod oude Nederlandse teksten op internet, hoe degelijker mensen als ik hun werk kunnen doen.
Ewoud Sanders