Nieuws Artificial Intelligence

23 september 2022 leestijd 1 minuut 0 reacties

AI-model Whisper herkent, vertaalt, transcribeert audio bijna net zo goed als een mens

OpenAI heeft een nieuw open source AI-model gepubliceerd, genaamd Whisper, dat audio op bijna menselijk niveau kan herkennen en vertalen. Het model kan daardoor interviews, podcasts, gesprekken en meer transcriberen in het Engels, ook als er in een andere taal gesproken wordt, aldus OpenAI.

Eveline Meijer

Eveline MeijerRedacteurMeer van deze auteur

brein computer interface — © Shutterstock

Shutterstock

Whisper is getraind op 680.000 uur aan audio-data en bijbehorende transcripts in 98 talen, die op het internet verzameld werden, schrijft Ars Technica. Volgens OpenAI leidde dat ertoe dat het model beter kan omgaan met accenten, achtergrondgeluiden en technische taal. Daarnaast maakt dit het mogelijk om in meerdere talen te transcriberen en om de audio naar het Engels te vertalen.

Het nieuwe AI-model breekt hiervoor de audio op in stukken van 30 seconden, die vervolgens in een encoder worden gestopt. De decoder is getraind om het bijbehorende tekstbijschrift te voorspellen. Daarbij worden ook speciale tokens gebruikt waarmee het model taken uit kan voeren als taalidentificatie, meertalige spraaktranscriptie en vertaling naar het Engels.

OpenAI heeft Whisper volledig open source gemaakt, in de hoop dat het een bouwsteen kan worden om spraakverwerking en toegankelijkheidstools te verbeteren. Het AI-model is te vinden op GitHub.

Gerelateerde artikelen

Nieuws Artificial Intelligence

Beeldherkenningsalgoritme OpenAI makkelijk te misleiden

Is het een appel of een pizza?

Nieuws Artificial Intelligence

Code 'inspreken' dankzij AI

AI-taalmodel zet Engelse spraak om in softwarecode.

Nieuws Artificial Intelligence

AI-taalmodel GPT-3 ook waardevolle toevoeging voor security

Neuraal netwerk maakt zoeken naar dreigingen gemakkelijker.

Gerelateerde artikelen

Beeldherkenningsalgoritme OpenAI makkelijk te misleiden

Nieuws Artificial Intelligence

Beeldherkenningsalgoritme OpenAI makkelijk te misleiden

Is het een appel of een pizza?

Code 'inspreken' dankzij AI

Nieuws Artificial Intelligence

Code 'inspreken' dankzij AI

AI-taalmodel zet Engelse spraak om in softwarecode.

AI-taalmodel GPT-3 ook waardevolle toevoeging voor security

Nieuws Artificial Intelligence

AI-taalmodel GPT-3 ook waardevolle toevoeging voor security

Neuraal netwerk maakt zoeken naar dreigingen gemakkelijker.

Gerelateerde artikelen

Nieuws identiteitsdiefstal Partner

Identity Management Day 2025: 10 tips om identiteitsdiefstal bij medewerkers te voorkomen

KnowBe4 presenteert 10 tips om identiteitsdiefstal bij medewerkers te voorkomen

Nieuws phishing, ai Partner

AI-aangedreven muterende phishingcampagnes zijn in opmars, waarschuwt KnowBe4-rapport

AI-aangedreven muterende phishingcampagnes zijn in opmars, waarschuwt KnowBe4-rapport

Achtergrond AI Partner

FrieslandCampina's AI Journey: From Grass to Glass, Data to Dairy

From Grass to Glass, Data to Dairy

Meer whitepapers

Whitepaper Artificial Intelligence

The challenge of information asymmetry

In many organizations, decision-making is hindered by information asymmetry, where critical data is unevenly distributed

Whitepaper Marketing

High impact business stories creëren

De route naar de zakelijke beslisser.

Whitepaper Cloud

Ontdek best practices voor het beveiligen van containerized apps en Kubernetes-clusters

Implementeer en voer veilige container-gebaseerde applicaties een stuk eenvoudiger uit.

MEER WHITEPAPERS

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee