AI-jailbreaking kan vangrails van bekende genAI-modellen doorbreken
Jailbreaking is niet alleen 'weggelegd' voor smartphoneplatformen die bijvoorbeeld bepaalde apps of appstores niet toestaan. Deze hackactiviteit wordt ook toegepast op kunstmatige intelligentie, waarvan de makers bepaalde functionaliteit en output niet toestaan. Omdat ze dat liever niet willen óf vanwege wet- en regelgeving niet mogen. Microsoft heeft recent ontdekt dat kwaadwillenden de ingebouwde vangrails van populaire genAI's kunnen omzeilen met een eenvoudige techniek.
Microsoft heeft informatie over bedreigingen gepubliceerd waarin gebruikers worden gewaarschuwd voor een nieuwe jailbreak-methode die AI-modellen kan dwingen schadelijke informatie vrij te geven. De techniek is in staat om LLM's (Large Language Models) te dwingen om gedragsrichtlijnen, die door de AI-leverancier in de modellen zijn ingebouwd, volledig te negeren. Deze alles-ontgrendelende methode heeft de naam Skeleton Key gekregen.