Overslaan en naar de inhoud gaan

Spraaktechnologie wordt een geduchte concurrent voor 3G

De keerzijde van euforie is pessimisme. WAP (Wireless Application Protocol) stond tot voor kort bekend als de jongste digitale hoop in bange telecomdagen. Maar het tij heeft zich danig gekeerd. Marktanalisten vragen zich luidop af of WAP soms staat voor Wireless Application Problem.
Business
Shutterstock
Shutterstock

Nog meer onweer over de akkers van telecomland: de aanbieders van mobiele telefonie van de derde generatie (3G) kondigden begin dit jaar aan dat ze onmogelijk aan de verwachtingen konden voldoen. 3G zou, in tegenstelling tot eerdere berichtgeving, technisch gezien niet eerder haalbaar zijn dan in 2003. Volgens sommige telco’s zelfs niet eerder dan 2004 of 2005. Intussen wegen de investeringen, die veel later dan verwacht winst zullen opleveren, zwaar op de sector. Daarnaast maken de telecomoperatoren zich zorgen over de kosten die gepaard gaan met het werven van nieuwe klanten. Deze zijn de jongste jaren fors omhoog gegaan, terwijl diezelfde klanten steeds minder geld in het laatje brengen. Deze zogenaamde ‘churn rate’ werkt danig in het nadeel van de telco’s. Ze zien zich verplicht nieuwe diensten te bedenken die het aantal telefoontikken doen aanzwellen. Het futuristische 3G zou een einde moeten maken aan deze malaise. De vraag is of dat ook lukt en wanneer. Gevaarlijk Is mobiel surfen ook praktisch? Jackie Fench, analiste bij de Amerikaanse marktvorser Gartner Group stelt dat dit niet het geval is. De gebruiker houdt zijn toestel in de ene hand en bladert door de internetpagina met zijn andere hand. Ook beide ogen zijn in gebruik om tekst en beeld te ontwaren op het beeldscherm van de telefoon. Fench: “Het scherm van een WAP- telefoon en het toetsenbord van een GSM zijn beide onbruikbaar, zelfs gevaarlijk, in bepaalde omgevingen zoals een rijdend voertuig. Het gesproken woord voor de invoer en uitvoer van gegevens garandeert een handen- en ogenvrije situatie. Dat neemt niet weg dat elke activiteit die de concentratie van een chauffeur vermindert een negatieve uitwerking kan hebben op zijn veiligheid.” Om die reden is het Belgisch verkeersreglement aangepast. Telefonerende chauffeurs riskeren een fikse boete, tenzij ze gebruik maken van een car kit. Waarnemers wijzen er intussen op dat het echte probleem daarmee (letterlijk) niet van de baan is. Het vormen van een telefoonnummer, dat gepaard gaat met gebruik van beide handen en ogen, is gevaarlijker dan het bellen zelf, dat tenslotte dankzij de car kit handen- en ogenvrij kan gebeuren. De oplossing voor het concentratieprobleem dat ontstaat wanneer chauffeurs een nummer willen bellen, heet Voice Dialling. De chauffeur kan met de stem zijn toestel commanderen welk nummer er gevormd moet worden. Ook Voice Dialling is gebaseerd op spraakherkenning. Fench blijft desalniettemin voorzichtig: “Het is een misvatting te stellen dat het gebruik van spraakherkenning de risico’s wegneemt die voorkomen bij het gebruik van een mobiele telefoon tijdens het rijden. Studies tonen aan dat spreken en luisteren een significant deel van de hersencapaciteit in beslag nemen. Dat vermindert in belangrijke mate de mogelijkheid om tegelijkertijd nog andere taken uit te voeren.” Wederopstanding Is de telefoon een goed alternatief voor internet? Een recent rapport van het Amerikaanse onderzoeksbureau Harris Interactive toont aan dat een groot aantal gebruikers de telefoon prefereert boven internet. Dat geldt in toenemende mate voor consumenten die aandelen verhandelen. Lisa Fader, directeur financiële diensten bij Harris, noemt de wederopstanding van de telefoon zelfs substantieel. Zij stelt dat de ommekeer mede te danken is aan het tanende vertrouwen in de financiële markten. Fader: “Investeerders keren terug naar hun ‘brokers’ in plaats van zich via internet te verlaten op hun eigen oordeel.” In de Verenigde Staten wordt de telefoon in toenemende mate gebruikt voor internet. De Amerikaanse aandelenhandelaar Charles Schwab laat zijn klanten sinds jaar en dag gebruik maken van de telefoon voor aandelenhandel. Sinds 1996 gebeurt dat met spraakherkenning van Nuance om het de consument gemakkelijk te maken. Het hinderlijk intoetsen van ingewikkelde namen op het al te kleine toetsenbord van de telefoon is daardoor overbodig. Ron Croen, medeoprichter en directeur van spraakleverancier Nuance, stelt dat het toetsenbord van de telefoon op termijn helemaal verdwijnt. Croen: “De druktoetsen van de telefoon gaan dezelfde weg op als de draaischijf van vroeger.” Nuance is, niet toevallig, de leverancier van de spraaksoftware die aan de basis ligt van een nieuw, draadloos en toetsenloos telefoontoestel dat eerder dit jaar door Telespree Communications in de VS op de markt werd gebracht. De gebruiker beschikt over één knop. Die knop heeft hij nodig om verbinding te maken met een server. Vervolgens spreekt hij het nummer van de abonnee uit die hij wil bereiken. Op de server van Telespree draait de software van Nuance die het nummer herkent. De server vraagt om bevestiging van het nummer door middel van spraaksynthese. Nadat de klant aangegeven heeft dat het nummer klopt, wordt de verbinding tot stand gebracht. William S. Meisel, nestor van de spraakmarktanalisten, noemt de uitvinding van Telespree zowel innovatief als praktisch. Hij wijst er op dat het toestel ook door kinderen te bedienen is. Mede dankzij het ingebouwde concept ‘voice dialling’ zou een kind in staat moeten zijn papa of mama te bellen, gewoon door dat in het toestel te zeggen. Of het toestel van Telespree een succes wordt, moet vooralsnog afgewacht worden. Jackie Fench van Gartner ziet intussen vooral andere mogelijkheden voor traditionele en mobiele telefoongebruikers. Zij beveelt ontwikkelaars van mobiele telefonie aan om het gebruik van spraakherkenning vooral in overweging te nemen. Fench: “Zij zouden meer specifiek naar VoiceXML moeten kijken als een serieuze aanvulling op de microbrowsers die gebruikers van mobiele telefonie toegang verschaffen tot internetinformatie.” VoiceXML geldt als een de facto standaard onder ontwikkelaars van spraaktechnologie. VoiceXML maakt het mogelijk informatie die digitaal beschikbaar is, bij voorbeeld op internet, toegankelijk te maken voor de menselijke stem. Het is dan mogelijk om informatie die voldoet aan de specificaties van VoiceXML, toegankelijk te maken via een telefoonnummer. Ook of juíst wanneer die informatie zich oorspronkelijk op internet bevindt. Fench: “Spraakinteracties voor webinformatie kunnen vanaf elke denkbare telefoon gerealiseerd worden. Dat betekent dat een groot deel van de bevolking dat nog geen toegang tot internet heeft, nu wel over die mogelijkheid beschikt.’ In één keer De gebruiker hoeft geen nieuw toestel aan te schaffen. Een traditioneel telefoontoestel volstaat. Bovendien verbetert de spraakinterface de mobiele internetdienst. Fench: “Spraakherkenning is met name bijzonder geschikt in situaties waarbij een groot aantal opties beschikbaar is, zoals bij de namen van aandelen, steden of adressen. Het uitspreken van die opties is sneller en simpeler dan bladeren door een lange lijst. Bovendien kan de gebruiker verschillende handelingen in één keer uitvoeren. De vraag om bij voorbeeld ‘vijfhonderd aandelen te kopen’ zou op een microbrowser verschillende interacties van de eindgebruiker vergen.” Het concept mobiel internet dat door VoiceXML mogelijk gemaakt wordt, luistert naar de naam Voice Web of Voice Portal. In de Verenigde Staten blijken dergelijke diensten een zekere populariteit te genieten. Dat Internet Voice Portals mobiel internet gevoelig in gebruik zullen doen toenemen, staat volgens Jo Lernout, medeoprichter van het Belgische, thans in surseance van betaling verkerende Lernout & Hauspie Speech Products (L&H), buiten kijf. Lernout: “Het succes ervan is op de eerste plaats afhankelijk van het gebruik van spraakherkenning voor de vragen die de gebruiker wil stellen. Vervolgens moet een IVP beschikken over spraaksynthese om het antwoord te kunnen uitspreken op de vraag van de gebruiker. Maar er moet ook gebruik gemaakt worden van betere zoektechnologie, die alleen de relevante gegevens verstrekt na analyse van de vraag. De gebruiker moet zijn vraag overigens in een natuurlijke taal kunnen stellen. De zoektechnologie moet ook een goede taalkundige analyse maken van de sites die het antwoord op de vraag geven. Samenvattingstechnologie is nodig omdat de gebruiker niet wil dat op zijn telefoontoestel ellenlange pagina’s voorgelezen worden door de Voice Portal.” In de visie van Lernout zal, wanneer de mobiele telefonie van de derde generatie, zoals UMTS, werkelijkheid wordt, de voorbereidende stap van een Internet Voice Portal de gebruiker alleen nog maar meer doen internetten via de telefoon. Lernout: “UMTS biedt dezelfde voordelen als een IVP, maar voegt daar aan toe dat de gebruiker de informatie die hij opvraagt ook kan zien. De informatieoverdracht is dus beter. Het kleine, toetsloze UMTS-toestel dat over een klein scherm beschikt, zal nog steeds dankbaar gebruik maken van spraakherkenning voor de vraagstelling en van spraaksynthese voor het laten horen en zien van de informatie. Maar ook de samenvattingstechnologie blijft in gebruik, omdat een klein scherm handige overzichten en samenvattingen vereist die door de UMTS Portal gebracht moeten worden.”

Lees dit PRO artikel gratis

Maak een gratis account aan en geniet van alle voordelen:

  • Toegang tot 3 PRO artikelen per maand
  • Inclusief CTO interviews, podcasts, digitale specials en whitepapers
  • Blijf up-to-date over de laatste ontwikkelingen in en rond tech

Bevestig jouw e-mailadres

We hebben de bevestigingsmail naar %email% gestuurd.

Geen bevestigingsmail ontvangen? Controleer je spam folder. Niet in de spam, klik dan hier om een account aan te maken.

Er is iets mis gegaan

Helaas konden we op dit moment geen account voor je aanmaken. Probeer het later nog eens.

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in