Valkuil.nl gaat verder dan tikfouten alleen

31 mei 2011
Software voor tekstcorrectie schopt het doorgaans weinig verder dan controleren of woorden juist zijn gespeld. Goed gespeld maar verkeerd gebruikt slipt meestal tussen de mazen van het algoritme door. De Universiteit van Tilburg ontwikkelde echter een correctieprogramma dat pretendeert ook die taalmissers op te merken. Vanaf vandaag staat het online op www.valkuil.net.

Word ziet geen fout in de zin “Hij zij dat hij naar huis ging”, maar valkuil.net ziet het wel. Het correctieprogramma wordt vandaag gelanceerd tijdens het symposium ‘De automatische taalhulp'. Terwijl de meeste automatische correctors zich beperken tot typefouten ('historisi') en grammaticale fouten (d/t-fouten), is Valkuil.net in staat om specifieke verwarringen te herkennen tussen bestaande woorden (zoals 'zei' en 'zij' ) evenals onterecht gesplitste woorden ('verpleeg tehuis'). Het programma krijgt dat voor elkaar, doordat het rekening houdt met de context waarin de woorden worden gebruikt. Om dat onder de knie te krijgen, is een ‘zelflerend’ programma gevoed met grote hoeveelheden Nederlandse tekst, aan de hand waarvan het ‘leerde’ wat normaal taalgebruik is en wat afwijkt .

Leerproces nog niet voltooid
Valkuil.net komt voort uit het onderzoeksproject Implicit Linguistics, uitgevoerd aan Tilburg University bij het Tilburg center for Cognition and Communication. Het project, onder leiding van Antal van den Bosch, werkt ook aan een vertaalsysteem en brengt de spellingscorrector Valkuil.net uit om te laten zien wat mogelijk is. Door te leren van feedback van online gebruikers wil het onderzoeksteam het systeem gaandeweg verbeteren. In deze zin bijvoorbeeld, liet het nog teveel fouten zitten. Lastig is ook dat Valkuil.net voor elke komma en voor elke punt in een zin een spatie plaatst, die handmatig moet worden verwijderd. 

Lees meer over
Reactie toevoegen