Spraak en taaltechnologie is ‘noodzaak’ voor Europa
De Europese Unie (EU) heeft door haar veeltalige samenstelling altijd veel belangstelling betoond voor de ontwikkeling van taal en spraaktechnologie (TST). De EU heeft het afgelopen decennium zelfs redelijk wat energie en fondsen geïnvesteerd in het ontginnen en verkennen van deze nieuwe technologie. Onder meer via Euromap Language Technologies, het platform promotie van TST binnen de Europese Unie. Met ingang van 1996 heeft Euromap van zeventien verschillende Europese landen in kaart gebracht hoe zij met TST omgaan. In een tweede fase, vanaf 1998, heeft Euromap zich vooral beziggehouden met het opdrijven van de belangstelling voor TST binnen Europa. In de derde en voorlopig laatste fase concentreerde Euromap zich vanaf februari 2000 op de verdere verbreiding van TST in de Europese lidstaten. De derde fase van Euromap Language Technologies wordt in april van dit jaar afgerond. Het totale investeringsbudget voor de derde fase van het ontwikkelingsprogramma bedroeg 2,3 miljoen euro. Nederland heeft intensief meegewerkt aan deze derde fase. Zij het niet alleen. In het kader van de Nederlandse Taalunie (TNU) heeft Nederland met België (lees: Vlaanderen) onder één hoedje gespeeld. Dat neemt overigens niet weg dat de bevindingen van Euromap behoorlijk verschillende rapportcijfers laten zien voor Nederland en België. In het kort: Nederland scoort beter en Vlaanderen hinkt achterop. Euromap maakt niet duidelijk in welke mate het faillissement van de voormalige Vlaamse hoogvlieger Lernout & Hauspie Speech Products daarvoor verantwoordelijk is. Rapportcijfer In april brengt Euromap definitief verslag uit over haar activiteiten en bevindingen van de afgelopen zeven jaar. Automatisering Gids kreeg inzage in het voorlopige rapport. Het rapportcijfer dat Nederland krijgt mag uitstekend genoemd worden. Dit land gaat met stip door naar de tweede generatie TST. Helmer Strik van de katholieke Universiteit Nijmegen zegt dat het onderzoek van Euromap als doel had om een zo groot mogelijke consensus te bereiken: "Als je de vorderingen op het terrein inventariseert, moet je ook kijken naar kwaliteit. De prefinale versie van het onderzoeksrapport is naar een tweeduizendtal deelnemers uit het veld gestuurd. Ook buiten Nederland en Vlaanderen hebben we presentaties gedaan. Noorwegen en ZuidAfrika doen tenslotte vergelijkbare zaken. Ik ben tot dusver positief, maar er is wel nog 12 miljoen euro nodig voor verder onderzoek." De eerste generatie TST gaat over de huidige stand van zaken. Dat wil volgens het rapport zeggen dat de allerprilste gebruikers, de zogenaamde innovators, en hun opvolgers, de zogenaamde early adopters, de technologie inmiddels omarmd hebben. Tegelijk houdt dat ook in dat de derde groep gebruikers in de adoptiecyclus, de zogenaamde early majority, vooralsnog de draad niet heeft opgepikt en de technologie met andere woorden tot dusverre links heeft laten liggen. Van enig zicht op de vierde fase van de adoptiecyclus, het veroveren van de late majority, is volgens Euromap in de verste verte nog geen sprake. Andrew Joscelyne is de Europese coördinator van Euromap Language Technology. Hem staat een noodzakelijke, dubbele ontwikkeling voor ogen: "Aan de ene kant moeten de technologieën op het niveau van de volgende, tweede generatie getild worden; terwijl de producten zelf dringend de wereld in moeten." Volgens Joscelyne moet TST dezelfde allure verwerven die elektriciteit nu al heeft. Ze moet alomtegenwoordig worden en dus onzichtbaar: "TST moet uit het zicht verdwijnen om effectief te kunnen zijn." Joscelyne koestert de goede hoop dat dit ook gebeurt. Hij voorspelt dat de TST van de toekomst ‘embedded’ wordt. ‘Crossing the chasm’ Euromap gebruikt voor haar interpretatie van de feiten het model dat de Amerikaanse consultant Geoffrey Moore uitgetekend heeft in zijn door Silicon Valley tot bijbel uitgeroepen publicatie ‘Crossing the Chasm’. Moores visie wordt door sommige wetenschappers weliswaar met argusogen bekeken. Maar in het kort komt zijn theorie daarop neer dat nieuwe technologieën vijf verschillende adoptiefasen kennen. Volgens Euromap bevindt TST zich nu in de tweede fase van de adoptiecyclus die zij de ‘eerste generatie’ noemt. Met andere woorden: het grote publiek dat met de ‘tweede generatie’ TST moet veroverd worden is vooralsnog niet overstag gegaan voor het gebruik van de eerste generatie TST. De vraag dringt zich dan ook op of het eigenlijk wel zin heeft om met de ontwikkeling van deze aartsmoeilijk te ontginnen technologie door te gaan. En wie gaat dat betalen? Euromap heeft vastgesteld dat zeventien departementen aan tien verschillende Nederlandse universiteiten op een of andere manier betrokken zijn bij het ontwikkelen van TST. Daarnaast zijn nog eens tien andere onderzoekscentra betrokken bij onderzoek dat relevant is voor de sector. Daar komt bij dat nog eens een twintigtal bedrijven actief producten en diensten aanbiedt. Vrijwel al die bedrijven en organisaties zijn aangesloten bij NOTaS, de Nederlandse Organisatie voor Taal en Spraaktechnologie, een overkoepelende brancheorganisatie die de belangen behartigt van deze prille sector. Geert Kobus, woordvoerder van deze stichting, die twee jaar geleden werd opgericht, laat maar wat graag zijn ongenoegen blijken over de moeizame ontwikkelingen in het veld. Er is meer overheidssteun nodig, luidt zijn mening: "Voor de verdere ontwikkeling van de TSTsector is een breed gedragen en van overheidswege gesteund actieprogramma nodig. Maar de overheid trekt haar handen van de TSTsector af. Zelfs heel grote bedrijven binnen deze sector zijn verdwenen. Het ontbreken van een overheidsprogramma is daar debet aan. Er moet snel een financieelorganisatorisch kader geconcretiseerd worden. Wij willen meer aandacht voor het belang van de markteducatie en de marktontwikkeling. Wat kan je allemaal met TST? Soms lijkt het dat de Vlamingen wat dat betreft besluitvaardiger zijn." NOTaS wil graag samenwerken met Vlaamse zusterbedrijven en kennisinstellingen. Kobus: "Het belang van gezamenlijke actie lijkt evident. Maar er ligt nog geen blauwdruk klaar. De markt voor TST heeft een gouden toekomst, op voorwaarde dat we goed samenwerken. Ik zou persoonlijk veel sneller willen gaan. Ik heb een sterk gevoel van onrust dat we sneller moeten." Volgens Kobus is het grootste probleem echter dat zo vreselijk moeilijk is uit te leggen welk nut die hele waaier aan technologieën heeft die onder de noemer TST vallen. Kobus: "Wat het moeilijkst is tot op heden is het maken van een verbeterde verkoopstructuur. Het is ronduit moeilijk om uit te leggen wat TST is. Met andere woorden: de hele markt moet nog worden opgevoed." Jaap van der Meer van Systran, gespecialiseerd in automatische machinevertaling, ziet het desgevraagd nog somberder in. De markt heeft een ronduit negatief beeld van TST. Van der Meer: "Met het beroerde resultaat van machinevertalingen krijg je altijd de lachers op je hand. Maar het punt is dat machinevertalingen juist niet bedoeld zijn om mensen te vervangen. Dat is een van de meest voorkomende misvattingen. Een andere misvatting is de vraag naar perfectie: perfectie is ten enen male uitgesloten. Machinevertalingen worden nooit perfect!" De vraag blijft waarom technologieën die per definitie nooit perfect zal zijn desondanks toch wel noodzakelijk is. ‘Survival kit’ Andrew Joscelyne beantwoordt de vraag weliswaar met enige schroom, maar ziet in de ontwikkeling van TST uiteindelijk zelfs een basisvoorwaarde voor de overleving van een taal en haar economie. Joscelyne: "Ik geloof niet dat echt alle talen ter wereld per se hun eigen taaltechnologische ‘survival kit’ nodig hebben om te kunnen overleven. Zeker nu niet. Op dit moment kunnen talen perfect overleven dankzij de gesproken uitingen van hun gebruikers. Zelfs op internet kunnen talen overleven dankzij HTML documenten die alleen maar een passieve verwerking van de taal mogelijk maken." Maar om het voor een taal mogelijk te maken dat ze automatisch vertaald kan worden, of dat een papieren taaluiting uitgesproken kan worden door machines heb je TST nodig. Het probleem is juist dat de grote, levende talen in toenemende mate over TST beschikken. In de nieuwe digitale economie zou nog wel eens de tendens kunnen ontstaan dat alleen die talen door de economie uitgeselecteerd worden die over hun eigen TST beschikken. Dat betekent dus inderdaad dat elke taal op de lange termijn TST nodig heeft om te kunnen overleven. Omdat die TST onlosmakelijk deel zal uitmaken van de economische infrastructuur waarmee je transacties en andere economische activiteiten organiseert via het web of via de mobiele telefoon. Over een jaar of twintig tot dertig wordt de overlevingsstrategie van elke taal dus een serieus probleem. Ik koester echter de goede hoop dat de praktijk zal uitwijzen dat de ‘vertechnologisering’ van de talen veeleer zal toenemen dan afnemen."