Meta geeft krachtige AI-gebaseerde audio-tekst vertaler vrij voor onderzoek
Meta heeft gisteren SeamlessM4T vrijgegeven onder een opensourcelicentie bedoeld voor onderzoek. Het taalmodel kan tot wel honderd talen in tekst en spraak vertalen. Het bedrijf zegt te willen bijdragen aan een efficiëntere communicatie tussen mensen die verschillende talen spreken.
SeamlessMT4 kan vertalingen doen van tekst naar tekst, tekst naar spraak, spraak naar spraak en spraak naar tekst. Voor tekstvertalingen kan het model met bijna honderd talen overweg. De spraak is beperkt tot 26 talen.
Als open source beschikbaar
Meta heeft SeamlessMT4 vrijgegeven onder een CC BY-NC 4.0-licentie wat betekent dat wetenschappers er voor onderzoeksdoeleinden vrij gebruik van kunnen maken en ontwikkelaars dit model mogen gebruiken om nieuwe toepassingen te bedenken. Ook de dataset waarmee Meta heeft getraind - SeamlessAlign - hoort daarbij. Volgens Meta bestaat deze dataset uit 270.000 uur aan geannoteerde spraak en tekst.
Een jaar geleden heeft OpenAI een vergelijkbaar taalmodel als opensourceproject gepubliceerd onder de naam Whisper. Ook dit model kan met bijna honderd talen overweg.
Reacties
Om een reactie achter te laten is een account vereist.
Inloggen Word abonnee