Innovatie & Strategie

Analytics
Containerschepen

Deep learning forensics

Onderscheid tussen onvolledige en gemanipuleerde informatie steeds moeilijker

Containerschepen © CC0 - Pixabay Hessel Visser
24 juli 2017

Zaterdag 15 juli werd Nederland opgeschrikt door het nieuws dat drugscriminelen in de haven van Rotterdam opereren met behulp van cybercriminelen. Eind vorig jaar sloegen bedrijven ook al alarm toen bleek dat de douane als gevolg van computerstoringen in de Rotterdamse haven containers zonder controle doorlaat. Dat geeft te denken over de virusuitbraak die een aantal containerterminals in Rotterdam eind juni heeft getroffen.

In 2013 al bleek dat de haven van Antwerpen zo lek was als een mandje en dat criminelen containers met drugslading door de computers te hacken eenvoudig konden ophalen. Zelfs toen de gaten in de firewalls waren gedicht, hebben de criminelen spionage-apparatuur aangebracht in de havenkantoren en konden zo hun criminele activiteiten voortzetten. Het mag duidelijk zijn dat criminele organisaties in toenemende mate digitaliseren om hun criminele activiteiten te ondersteunen.

Mijn blogs van 31 mei en 3 juli adresseerden de beveiliging en forensisch onderzoek van het Internet of Things en de snelle opkomst van slimme computers die misschien nog niet intelligent zijn maar wel veel slimmer dan we tot voor kort voor mogelijk hielden. Vijf jaar geleden in Antwerpen moesten criminelen nog hun eigen apparatuur binnensmokkelen om systemen te manipuleren. Door in te breken op het Internet of Things kunnen criminelen ongemerkt meekijken en gegevensstromen in de haven manipuleren.

Manipulatie

Vooral als het gaat om autonome systemen die een hoge graad van automatisering hebben, zal het lastig worden om manipulatie van gegevens te bewijzen. De huidige deep learning-algoritmen hebben kennis verworven aan de hand van trainingsvoorbeelden en het is lastig om met de hand na te gaan hoe deze kennis in de systemen is gerepresenteerd en hoe sensordata worden verwerkt. Daarbij komt dat deze algoritmen juist zo krachtig zijn door hun capaciteit om onvolledige informatie te kunnen verwerken.

Google heeft inmiddels spraakmakende voorbeelden op zijn researchblog gepubliceerd die deze eigenschappen illustreren. Bijvoorbeeld een programma dat ontbrekende details op foto’s kan reconstrueren (of beter gezegd fantaseren). Of een programma dat gebouwen, dieren en objecten op foto’s kan herkennen, maar deze beelden ook herkent in een wolkenlucht. Ook traditionele taalverwerking moet eraan geloven. In september 2016 heeft Google het ‘oude’ translate-algoritme vervangen door een neuraal netwerk. Interessante bevinding daarbij is dat deep learning de verborgen lagen in het netwerk zo gevormd heeft dat vertalingen mogelijk zijn zonder dat het daar voorbeelden van heeft gezien.

Voorbeeld

Wie denkt dat dit vooral academische toepassingen zijn, heeft het mis. Deze technologie wordt nu klaargestoomd voor de zelfrijdende auto. Nvidia, de maker van de graphics-processoren, liet onlangs op zijn jaarlijkse developersconferentie zien welke enorme ontwikkelingen er op dit moment gaande zijn om deep learning op grote schaal naar de consument te brengen. Daarbij is natuurlijk de zelfrijdende auto een inspirerend voorbeeld en tegelijkertijd ook een belangrijke stimulans om de technologie mobiel en betaalbaar te maken.

Met dit soort systemen wordt het onderscheid tussen onvolledige informatie en gemanipuleerde informatie steeds moeilijker. Het lijkt erop dat voor forensisch onderzoek aan slimme autonome apparaten naast IoT forensics ook onderzoek nodig is naar de representatie en verwerking van informatie in kunstmatige neurale netwerken, oftewel: deep learning forensics.

Reactie toevoegen