In GPU-schaarste door AI-hype komt Nvidia met volgende generatie AI-chip
Terwijl de nu-vorige generatie van Nvidia's grafische chips (GPU's) voor AI-werk nog altijd wereldwijd schaars zijn, brengt de chipmaker de nieuwe H200 op de markt. Deze krachtige chips voor wetenschappelijke rekentaken (zoals AI en HPC, high-performance computing) beloven een flink hoger prestatieniveau, wat aantrekkelijk kan zijn voor cloudaanbieders die hun klanten AI-taken laten draaien.
Nvidia zelf vergelijkt zijn H200 met de A100, die in 2020 is geïntroduceerd en die is gebaseerd op de oudere Ampere-architectuur. De nieuwste AI-chip heeft bijna twee keer zoveel geheugen (141 gigabyte) met daarvoor bijna tweeënhalf keer zoveel bandbreedte (4,8 terabytes per seconde). In vergelijking met de H100, die eind 2022 is aangekondigd, heeft Nvidia's nieuwe GPU 'slechts' 1,8 keer zoveel geheugen en 1,4 keer zoveel bandbreedte. De H100 en de H200 zijn gebaseerd op de nieuwere Hopper-architectuur.
Harder, beter, sneller
De krachtigere, nieuwe chip kan genAI-toepassingen een flinke prestatieverbetering geven. Nvidia spiegelt een bijna-verdubbeling voor wat betreft de inferentiesnelheid van het Llama 2.0-model van Facebooks moederbedrijf Meta. Deze prestatiesprong is wél in vergelijking met de H100-chip. Toekomstige software-updates voor de H200 moeten nog meer verbeteringen brengen, belooft Nvidia.
De grote, brede en aanhoudende hype rond AI-toepassingen zorgt ervoor dat speciale chips daarvoor zeer in trek zijn. Nvidia, die de grootste leverancier op dit gebied is, kampt al geruime tijd met een scheefgetrokken verhouding tussen vraag en aanbod. De productie van deze complexe chips kan de opgezweepte vraag niet bijbenen. Dit heeft al gezorgd voor flink hoge prijzen én voor consolidatie van AI-taken bij techreuzen en cloudaanbieders die wel de hand weten te leggen op de felbegeerde GPU's.
AWS, Google, Microsoft en Oracle
De H200 moet in het tweede kwartaal van komend jaar beschikbaar komen, meldt Nvidia. Dan komen zowel serverfabrikanten als ook cloudaanbieders met H200-systemen. Techreuzen AWS , Google, Microsoft en Oracle behoren tot de voorhoede van leveranciers die gebruik van de nieuwe GPU's gaan bieden aan hun klanten. Daarnaast doen ook kleinere bedrijven als CoreWeave, Lambda en Vultr mee, aldus Nvidia.
Reacties
Om een reactie achter te laten is een account vereist.
Inloggen Word abonnee