Overslaan en naar de inhoud gaan

Meta geeft krachtige AI-gebaseerde audio-tekst vertaler vrij voor onderzoek

Meta heeft gisteren SeamlessM4T vrijgegeven onder een opensourcelicentie bedoeld voor onderzoek. Het taalmodel kan tot wel honderd talen in tekst en spraak vertalen. Het bedrijf zegt te willen bijdragen aan een efficiëntere communicatie tussen mensen die verschillende talen spreken.

vertaling
Shutterstock, pathdoc

SeamlessMT4 kan vertalingen doen van tekst naar tekst, tekst naar spraak, spraak naar spraak en spraak naar tekst. Voor tekstvertalingen kan het model met bijna honderd talen overweg. De spraak is beperkt tot 26 talen. 

Als open source beschikbaar

Meta heeft SeamlessMT4 vrijgegeven onder een CC BY-NC 4.0-licentie wat betekent dat wetenschappers er voor onderzoeksdoeleinden vrij gebruik van kunnen maken en ontwikkelaars dit model mogen gebruiken om nieuwe toepassingen te bedenken. Ook de dataset waarmee Meta heeft getraind - SeamlessAlign - hoort daarbij. Volgens Meta bestaat deze dataset uit 270.000 uur aan geannoteerde spraak en tekst.

Een jaar geleden heeft OpenAI een vergelijkbaar taalmodel als opensourceproject gepubliceerd onder de naam Whisper. Ook dit model kan met bijna honderd talen overweg. 

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee

Bevestig jouw e-mailadres

We hebben de bevestigingsmail naar %email% gestuurd.

Geen bevestigingsmail ontvangen? Controleer je spam folder. Niet in de spam, klik dan hier om een account aan te maken.

Er is iets mis gegaan

Helaas konden we op dit moment geen account voor je aanmaken. Probeer het later nog eens.

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in