OpenAI krijgt kleine, krachtige concurrentie van hechte partner en grote klant Microsoft
Microsoft heeft eerder al een alternatieve AI-aanbieder omarmd, maar komt nu met drie nieuwe AI-modellen. Deze Phi-3.5-modellen zijn zogeheten small language models (SLM's) waardoor ze relatief lichtgewicht zijn. Toch blijken ze hoge prestaties neer te kunnen zetten. OpenAI, Google, Meta en andere AI-aanbieders hebben er krachtige concurrentie bij.
In benchmarks van derde partijen blijken de drie Phi-3.5-modellen van Microsoft indrukwekkende resultaten te halen, meldt VentureBeat. Concurrenten als Gemini 1.5 Flash van Google en Llama 3.1 van Meta worden voorbijgestreefd en in sommige gevallen wordt ook GPT-4o van OpenAI gepasseerd. Laatstgenoemde is het 'topmodel' van ChatGPT-maker OpenAI.
Meer Microsoft-opties
Microsoft - en daarlangs diens klanten - is een grote afnemer van OpenAI's technologie. Daarnaast is Microsoft ook een hechte partner, die vele miljarden in het Amerikaanse AI-bedrijf heeft geïnvesteerd. Begin dit jaar heeft Microsoft echter een meerjarige samenwerking onthuld met de Franse start-up Mistral AI.
Naast die banden met externe AI-makers werkt cloudreus Microsoft dus ook aan eigen AI-modellen. De nu onthulde nieuwe Phi-3 modellen zijn bedoeld voor toepassingen in oplopende mate van complexiteit. Phi-3.5 mini heeft 3,8 miljard parameters en is bedoeld voor omgevingen met relatief beperkte rekenkracht, zoals bijvoorbeeld IoT-apparaten en smartphones. Het valt te gebruiken voor chatconversaties, ook in meerdere talen.
Taal, wiskunde, code, beeld
Phi-3.5 MoE (Mixture of Experts) combineert verschillende modellen die elk gespecialiseerd zijn in een specifieke taak. Het kan bogen op een totaal van 42 miljard parameters en gebruikt er daarvan bij uitvoering van taken 'slechts' 6,6 miljard stuks. Het valt te gebruiken voor meertalige conversaties, wiskundige opdrachten en voor het schrijven van softwarecode.
Phi-3.5 Vision is de meest geavanceerde van de drie nieuwe Phi-SLM's die Microsoft nu uitbrengt. Dit topmodel bevat mogelijkheden voor taal- en ook beeldverwerking. Het valt te gebruiken om teksten te 'lezen' en te genereren, plus afbeeldingen, foto's en video's te 'zien' en te genereren, plus multimodale combinaties daarvan. Dat laatste geeft gebruikers mogelijkheden voor bijvoorbeeld het laten creëeren van afbeeldingen op basis van tekstinput, het laten opstellen van tekstverslagen van video's, en meer.
Reacties
Om een reactie achter te laten is een account vereist.
Inloggen Word abonnee