AWS zet democratisering en privacy van generatieve AI in de schijnwerpers

De wapenwedloop rond generatieve AI is in volle gang en ook AWS mengde zich daar in april in. Tijdens de AWS Summit in Amsterdam op 1 juni werd duidelijk dat het bedrijf wel een andere route neemt dan zijn concurrenten. Met een sterke nadruk op democratisering en privacy streeft AWS ernaar om generatieve AI toegankelijk te maken voor iedereen, zonder in te leveren op de bescherming van persoonlijke gegevens.

Eveline MeijerRedacteurMeer van deze auteur

Andy Warfield van AWS — © AWS/Janus van den Eijnden

AWS/Janus van den Eijnden

OpenAI gaf afgelopen november het startschot voor de wapenwedloop met de onthulling van ChatGPT. Sindsdien verschijnt het ene na het andere bericht over nieuwe mogelijkheden met generatieve AI. Google voegt het bijvoorbeeld toe aan Search, Microsoft stopt het in onder meer Bing, Windows 11 en GitHub, en ook Meta is druk bezig met de tekstrobots. Het was dus geen verrassing toen AWS in april nieuwe opties rondom generatieve AI deelde, in de vorm van bijvoorbeeld CodeWhisperer - een tegenhanger van GitHub Copilot - waarmee programmeercode gegenereerd kan worden.

“Er wordt enorm veel over gesproken”, zegt Andy Warfield, VP en Distringuished Engineer bij AWS, in zijn keynote tijdens de AWS Summit in Amsterdam. Ook hij blijkt onder de indruk van de plotselinge snelle vooruitgang: “Ik heb in mijn hele carrière nog nooit zoiets gezien. Ik kan ook geen ander voorbeeld bedenken van een verschuiving die zoveel mensen boeit.”

Toch gaat AWS naar eigen zeggen niet anders met generatieve AI om dan met alle andere technologieën. “Dat betekent dat we barrières weghalen, zodat ook jij hiermee kunt gaan werken”, verklaart Warfield.

Basisblokken voor AI

Praktisch gezien betekent dit dat AWS generatieve AI niet alleen aan zijn eigen producten toevoegt zodat eindgebruikers het kunnen inzetten - zoals dat nu ook kan in Word of Google Search - maar dat het bedrijven en developers helpt om zélf aan de slag te gaan met generatieve AI, voor hun eigen tools en diensten.

Dit doet AWS aan de hand van zogeheten ‘foundation models’, legt Constantin Gonzalez, Principal Solutions Architect bij AWS, uit in gesprek met AG Connect. “Dat zijn hele grote modellen die een variëteit aan taken uit kunnen voeren.” Klanten krijgen toegang tot die modellen via het nieuwe Amazon Bedrock, dat nu als preview beschikbaar is. Het gaat dan bijvoorbeeld om basisblokken van AI21 en Stability AI, waarmee machines tekst kunnen begrijpen en genereren en afbeeldingen gegenereerd kunnen worden. Daarnaast zijn er foundation models van AWS zelf beschikbaar, zoals Titan. Beide zijn natural language processing-modellen, waarmee bijvoorbeeld content en samenvattingen gegenereerd kunnen worden of een sentimentanalyse uitgevoerd kan worden op basis van een tekst. “Klanten kunnen zelf kiezen welk model het beste bij hun use case past”, legt Gonzalez uit. Voordeel voor developers is dat ze bij Bedrock vervolgens geen rekening hoeven te houden met de onderliggende infrastructuur, want dat doet AWS voor ze.

Toch is het niet zo dat AWS zelf geen voordelen uit generatieve AI probeert te halen door het in zijn eigen diensten te stoppen. CodeWhisperer is daar een goed voorbeeld van. Net als GitHub Copilot kan CodeWhisperer op basis van waar de developer mee bezig is in real-time code genereren. “Het kan complete functies suggereren terwijl je code schrijft en het suggereert automatisch welke libraries het beste bij jouw werk passen”, aldus Warfield. Daarnaast kan CodeWhisperer code scannen op bekende kwetsbaarheden en geeft het een melding als per ongeluk trainingsdata wordt aangetroffen.

Het privacyprobleem

In deze wapenwedloop is snelheid van groot belang. Want terwijl bedrijven druk naar manieren zoeken om relevant te blijven op dit gebied of om er voordelen uit te halen, blijkt de concurrentie soms al aardig voor te lopen. Maar snelheid kan er ook voor zorgen dat privacy en security onderschoven kindjes worden.

Constantin Gonzalez, Principal Solutions Architect bij AWS

Diverse privacyexperts waarschuwden in februari dan ook al tegenover AG Connect over privacyrisico’s. Zo is het aannemelijk dat ChatGPT het internet gescraped heeft voor trainingsdata, waar ongetwijfeld ook eerder openbaar gemaakte persoonsgegevens bij zitten. Daarnaast delen veel gebruikers onbewust persoonsgegevens met het systeem. “Elk prompt dat je intypt wordt weer gebruikt om het systeem te verbeteren. Het systeem kan dus een profiel van de gebruiker maken en profileren is onder de AVG een verwerking met een hoog risico”, aldus Ruben van der Geest, jurist bij ICTRecht. Eind mei werd bovendien duidelijk dat het samenwerkingsverband van Europese privacytoezichthouders een speciale werkgroep belast met de consequenties van generatieve AI voor de gevoelige persoonsgegevens van Europeanen.

Daar bovenop komen ook nog risico’s als gegenereerde phishingmails die cybercriminelen kunnen gebruiken of het feit dat de dingen die generatieve AI zegt, niet per se kloppen, waardoor er meer valse informatie de wereld in komt. Ook daar is al een praktijkvoorbeeld van: een Amerikaanse advocaat die bij het aandragen van jurisprudentie op ChatGPT vertrouwde en zes zaken aanhaalde die helemaal niet blijken te bestaan.

Verantwoord gebruik van AI

AWS lijkt zich bewust te zijn van dergelijke risico’s en de regulering die daar ongetwijfeld op volgt. “Taalmodellen moeten accuraat, snel en onschadelijk zijn”, zei Warfield daar bijvoorbeeld over. En ook Gonzalez ging hier dieper op in tijdens het gesprek met AG Connect. Zo benadrukt hij dat klanten AWS Bedrock kunnen gebruiken om taalmodellen op hun eigen voorwaarden te kunnen finetunen. “Dus in plaats van dat we de klantdata gebruiken om onze eigen modellen te trainen, werken we met privacy by default. We gebruiken geen klantdata om onze modellen te verbeteren, dat kunnen klanten binnen hun eigen virtual private cloud doen. De klantdata blijven dus in handen van de klant zelf.”

Daarnaast probeert AWS naar eigen zeggen te investeren in manieren om de modellen accurater te maken, ook zodat ze schadelijke content vermijden. “We denken echt dat generatieve AI grote effecten gaat hebben voor alle bedrijven. En daarom denken we dat het nog belangrijker is om onze klanten te helpen om dit verantwoord te gebruiken. Daarom investeren we zoveel mogelijk in het verantwoord gebruik van AI”, sluit Gonzalez af.

Update 14:28: In het artikel stond ten onrechte dat Cohere een foundation model is van AWS. Cohere is een partner van AWS en biedt zijn foundation model aan via Amazon SageMaker JumpStart. Het artikel is daarop aangepast.