Nieuws Leiderschap

26 oktober 2016 leestijd 1 minuut 0 reacties

Microsoft laat computer haast perfect luisteren

Als een mens luistert, wordt de tekst ook niet altijd even goed verstaan, afhankelijk van de manier waarop de spreker articuleert. In elk geval is hier sprake van een grote doorbraak, want luisterende computers hadden altijd een knullig imago. Een team van Microsoft Research in Redmond heeft zelflerende algoritmes bedacht, die spraak feilloos kunnen interpreteren.

Richard Keijzer

Richard KeijzerMeer van deze auteur

Een team onder leiding van Geoff Zweig heeft voortgeborduurd op een lange technologische ontwikkeling. Al vanaf de jaren 50 wordt geprobeerd om computers de menselijke stem te laten verstaan. Haast even lang wordt gewerkt aan de spraaksynthese, maar dat onderwerp lijkt een stuk makkelijker te zijn. Computerspraak, die in het begin blikkerig en robot-achtig klonk, is tegenwoordig nauwelijks nog van echte spraak te onderscheiden.

Geen beperking

Eerdere systemen voor spraakherkenning werkten in een zogeheten 'beperkte probleemruimte', wat wilde zeggen dat ze geschikt waren voor één enkele persoon (na veel trainingsuren) of voor een klein onderwerpje zoals het weerbericht. En dan nog waren die systemen niet echt robuust. Als een gebruiker vaak woordjes als "eeeh" gebruikte of een hoestbui kreeg, waren de resultaten niet te voorzien. Bij een van de herkennende systemen leidde het schrapen van de keel steevast tot het woordje "jurk".

Het systeem dat Microsoft nu heeft ontwikkeld is bruikbaar voor vrijwel elke tekst en vrijwel elke spreker. Ook tussenwerpsels en kuchen zijn geen probleem meer, zeggen de ontwikkelaars. Er is gebruik gemaakt van een verzameling gesproken woorden die in 2000 is vrijgegeven door het National Institute of Standards and Technology (Nist). Ontwikkelaars van spraakherkenningssystemen konden met die verzameling hun techniek testen.

De mens voorbij

Een absoluut perfect luisterende computer is er niet, maar dat geldt ook voor de mens. Over het algemeen hebben mensen een foutmarge van 4 procent, wat wil zeggen dat ze van elke 100 woorden er 4 verkeerd verstaan. Het team van Microsoft heeft dat voor hun systeem weten te verbeteren. Met dien verstande dat ze zijn uitgegaan van een eigen meting van de fouten. Daaruit bleek dat een professioneel transcriptiebureau 5,9 woorden van de 100 verkeerd had. Als het ging om een conversatie tussen twee vrinden was dat zelfs 11,3 procent. Meer informatie staat hier.

Gerelateerde artikelen

Google geeft spraakherkenning vrij

De ingang naar Google Speech Recognition wordt geregeld via een API, die onder de naam Google Cloud Speech API beschikbaar wordt gesteld.

Achtergrond Toepassingen PRO

Spraakinterface komt tot wasdom: de app is gezien

De spraakinterface wordt in snel tempo volwassen, en dat krijgt ingrijpende gevolgen.

Nieuws Netwerken

Google weet spraakherkenning flink te verbeteren

Google doet in een blog uit de doeken hoe het verantwoordelijk team de verbetering heeft kunnen bereiken.

Gerelateerde artikelen

Google geeft spraakherkenning vrij

Google geeft spraakherkenning vrij

De ingang naar Google Speech Recognition wordt geregeld via een API, die onder de naam Google Cloud Speech API beschikbaar wordt gesteld.

Spraakinterface komt tot wasdom: de app is gezien

Achtergrond Toepassingen PRO

Spraakinterface komt tot wasdom: de app is gezien

De spraakinterface wordt in snel tempo volwassen, en dat krijgt ingrijpende gevolgen.

Google weet spraakherkenning flink te verbeteren

Nieuws Netwerken

Google weet spraakherkenning flink te verbeteren

Google doet in een blog uit de doeken hoe het verantwoordelijk team de verbetering heeft kunnen bereiken.

Gerelateerde artikelen

Blog Oude systemen Partner

Hoe oude systemen en handmatige processen digitale innovatie afremmen

Organisaties die met verouderde software en op basis van handmatige processen werken, lopen vroeg of laat tegen hun grenzen aan.

Blog Co-pilot training door Goodzo Partner

AI met impact: Goodzo verzorgt Copilot-training voor Van Neynsel

Goodzo-consultant Tom Roggeveen heeft recent een AI-training verzorgd voor het MT van zorgorganisatie Van Neynsel.

Nieuws Cyberaanvallen, detailhandel Partner

Alarmerende toename van cyberaanvallen in detailhandel

Gestolen inloggegevens zijn tegenwoordig veel populairder dan creditcard-data.

Meer whitepapers

Whitepaper Marketing

High impact business stories creëren

De route naar de zakelijke beslisser.

Whitepaper Cloud

PCI Cloud for the Edge en HPE: het beste van twee werelden

De concurrentie voorblijven? Ga voor future-proof IT met PCI Cloud for the Edge en HPE en ontdek de voordelen van een multi-cloud.

Whitepaper Security

Trend Micro herstelt AWS-diensten voor Banijay Benelux na ransomware-aanval

Wat doe je als je wordt getroffen door een ransomeware-aanval en je bedrijf daardoor stil ligt? Lees de ervaringen van Banijay Benelux.

MEER WHITEPAPERS

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee