Onderzoek naar missers van tekstrobots gaat mis op de missers
Het ging om onderzoek met medewerking van Meta - moederbedrijf van onder meer Facebook - dat ook erg graag wil weten waarom deze vorm van kunstmatige intelligentie zo foutgevoelig is. Meta wilde daarvoor wel de code van zijn LLaMa-systeem delen met een geselecteerde groep onderzoekers, meldt The Register. Maar het was niet erg praktisch om de onderzoekers te laten werken met het volledige LLaMa-model met enkele tientallen tot honderden miljarden parameters, aangezien dat de inzet van een enorme infrastructuur betekent.
De onderzoekers hebben daarom een afgeleid model gemaakt met zeven miljard parameters - en noemden dat Apalca - dat zelfs op een Raspberry Pi en een Pixel 6-smartphone blijkt te werken.
Filters werken niet voldoende
De onderzoekers hingen het aan een publieke website om er hun experimenten mee te doen. Na korte tijd werd de demo-site echter al weer offline gehaald. In een verklaring zeggen de onderzoekers dat het beschikbaar stellen van het model potentiële risico's met zich meebrengt, zoals het verspreiden van valse informatie, 'toxische' teksten en stereotypen. Het is het algemene probleem van zogeheten instruction following models, waar ook GPT, ChatGPT en Bing Chat aan lijden. Er waren daarom moderationfilters toegevoegd die OpenAI - de maker van GPT en ChatGPT - ook gebruikt. Bovendien werd aan alle respons die Apalca geeft, een watermerk toegevoegd zodat anderen met enige zekerheid kunnen herleiden of teksten van Apalca afkomstig waren.
Toch waren de filters onvoldoende om Apalca te corrigeren. Het lijkt erop dat Apalca nog sterker in de fout gaat dan modellen zoals GPT-3.5, zeggen de onderzoekers. Bovendien liepen de kosten voor het hosten van de demo-site op basis van Apalca zo op dat werd besloten de website weer te sluiten. Het experiment is echter allerminst mislukt, zeggen de onderzoekers tegen The Register. De dataset en de code die nodig zijn om het model af te stellen op specifieke taken zijn beschikbaar via GitHub. Het model is daarom nuttig voor het doen van onderzoek naar de tekortkomingen ervan.
Reacties
Om een reactie achter te laten is een account vereist.
Inloggen Word abonnee