Nog even, en praten met je smartphone is heel gewoon
Google is er met een nieuwe techniek in geslaagd het kwaliteitsgat tussen menselijke spraak en computergegenereerde spraak te halveren. Zowel bij ‘Amerikaans Engels’ als bij Mandarijn-Chinees ligt de waardering nu boven de 95 procent van het niveau dat een menselijke spreker haalt – gemeten via de methodiek Mean Opinion Scores.
Die kwaliteit heeft Google weten te bereiken door gebruik te maken van een neuraal netwerk dat het aanduidt al WaveNet. Met dat neurale netwerk kan niet alleen beter verstaanbaar, maar ook natuurlijker klinkende spraak gegenereerd worden, en overigens desgewenst ook muziek. Meer informatie over die techniek is te vinden op Googles WaveNet-blog.