Nieuws Artificial Intelligence

8 mei 2023 leestijd 1 minuut 0 reacties

Publieke pijnbank klaargezet voor belangrijkste 'large language' AI-modellen

Tijdens de grote hackersconferentie Defcon in Las Vegas van 10 tot 13 augustus is speciaal ruimte ingericht voor het fileren van bekende en minder bekende large language models (LLM). Tot nog toe werd dit werk vooral door bedrijven als OpenAI en Google binnenshuis gedaan en de resultaten ervan waren niet publiek beschikbaar. Met wat de Defcon AI Village-organisatie noemt de "grootste red teaming exercise" uitgevoerd op welke groep AI-modellen dan ook, moet daar verandering in komen.

Thijs Doorenbosch

Thijs DoorenboschMeer van deze auteur

hackers group — © Shutterstock

Shutterstock

Defcon verwacht dat in dit onderdeel van het evenement duizenden hackers aan de slag gaan, waaronder ook honderden studenten van minder bekende instituten en communities. Het doel is zo veel mogelijk fouten te vinden in de werking van de AI-modellen. Het gaat niet alleen om traditionele beveiligingsfouten, maar ook om meer LLM-specifieke problemen als hallucineren, bias en jailbreaks.

Nu komen dergelijke fouten regelmatig naar voren in het gebruik, dus het wordt prijsschieten voor de deelnemers aan AI Village van Defcon. De initiatiefnemer van Defcon AI Village - Sven Cattell - vindt dat de controle op de werking en dus de fouten van dergelijke AI-systemen niet beperkt mag zijn tot de interne ontwikkel- en testafdelingen van de bedrijven die dergelijke modellen creëren. Hij stelt dat de wezenlijke problemen met deze technologie niet opgelost gaan worden als niet veel meer mensen de gelegenheid krijgen om de modellen aan de tand te voelen. Cattell ziet graag een systeem met bug bounties ontstaan, zoals dat ook voor de veiligheidsaspecten van veelgebruikte software bestaat.

Heel wat bedrijven stellen zich kwetsbaar op

Het wordt de deelnemers aan AI Village zo makkelijk mogelijk gemaakt. Er zijn laptops beschikbaar en een tijdelijke toegang tot een flink aantal large language models. Anthropic, Google, Hugging Face, Nvidia, OpenAI en Stability hebben al toegezegd modellen beschikbaar te stellen. Mogelijk doet ook Microsoft mee. Voor degene die de meeste punten weet te scoren is een high-end Nvidia GPU beschikbaar.

Gerelateerde artikelen

Nieuws Security

ChatGPT maakt onveilige code, en verzwijgt dat

Wetenschappers ontdekken tekortkomingen in AI-geschreven code, die de AI wel zou kunnen aangeven (maar dus niet doet).

Nieuws Artificial Intelligence

Onderzoek naar missers van tekstrobots gaat mis op de missers

Website onderzoekers offline door vloeken, misinformatie en hoge hostingkosten.

Nieuws Artificial Intelligence

Voorlopig geen GPT-5, belooft OpenAI

ChatGPT-maker lijkt gevoelig voor oproep om AI-pauze in te lassen. Of toch niet helemaal?

Gerelateerde artikelen

ChatGPT maakt onveilige code, en verzwijgt dat

Nieuws Security

ChatGPT maakt onveilige code, en verzwijgt dat

Wetenschappers ontdekken tekortkomingen in AI-geschreven code, die de AI wel zou kunnen aangeven (maar dus niet doet).

Onderzoek naar missers van tekstrobots gaat mis op de missers

Nieuws Artificial Intelligence

Onderzoek naar missers van tekstrobots gaat mis op de missers

Website onderzoekers offline door vloeken, misinformatie en hoge hostingkosten.

Voorlopig geen GPT-5, belooft OpenAI

Nieuws Artificial Intelligence

Voorlopig geen GPT-5, belooft OpenAI

ChatGPT-maker lijkt gevoelig voor oproep om AI-pauze in te lassen. Of toch niet helemaal?

Gerelateerde artikelen

Blog informatiehuishouding Partner

De onzichtbare impact van een slechte informatiehuishouding op klanttevredenheid

Waarom informatiemanagement direct invloed heeft op je klanttevredenheid.

Achtergrond AI Partner

FrieslandCampina's AI Journey: From Grass to Glass, Data to Dairy

From Grass to Glass, Data to Dairy

Nieuws identiteitsdiefstal Partner

Identity Management Day 2025: 10 tips om identiteitsdiefstal bij medewerkers te voorkomen

KnowBe4 presenteert 10 tips om identiteitsdiefstal bij medewerkers te voorkomen

Meer whitepapers

Whitepaper Artificial Intelligence

The challenge of information asymmetry

In many organizations, decision-making is hindered by information asymmetry, where critical data is unevenly distributed

Whitepaper Marketing

High impact business stories creëren

De route naar de zakelijke beslisser.

Whitepaper Datamanagement

Het strategisch belang van master data management voor de moderne organisatie

Op zoek naar de sleutel tot effectief data management? Transformeer jouw datamanagementstrategie met het stappenplan uit dit whitepaper.

MEER WHITEPAPERS

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee