Overslaan en naar de inhoud gaan

Op zoek naar terroristengeld

In het kader van de oorlog tegen het terrorisme staan de banken voor een moeilijke taak. Zij moeten verdachte geldstromen opsporen en stopzetten. Het grote probleem is echter het identificeren van de rekeninghouders: de namen van personen of terroristische organisaties worden in elk land anders gespeld. Is Mihammed dezelfde als Mehmed? Zonder intelligente systemen, concludeert Herman Gores, komen we daar niet uit.
Carriere
Shutterstock
Shutterstock

In de strijd tegen het internationale terrorisme hebben de Amerikaanse autoriteiten hun pijlen gericht op de geldstromen van mogelijke terroristen en hun sponsors. Door waar mogelijk banktegoeden te bevriezen hopen de regeringen van de Westerse Alliantie te verhinderen dat terreurorganisaties nogmaals in staat zijn een aanslag als op 11 september 2001 te plegen. De zoektocht naar verdachte rekeningen en geldstromen verloopt echter ineffectief doordat Europese banken gebruik maken van ontoereikende methoden. Zolang er in het ene land sprake is van ‘Usama Bin Ladin’ en elders van ‘Osama bin Laden’, is het zeker niet ondenkbaar dat er nog veel geld door de mazen glipt. Internationale inlichtingendiensten hebben onder banken een lijst gedistribueerd met daarop enkele honderden verdachte terroristische organisaties en personen. Het is niet zeker of alle namen en adressen ook daadwerkelijk bestaan. Bij publicatie van de lijst bleek namelijk dat er een niet bestaand adres in Rotterdam op voorkwam. En er komen ook aliassen op voor. Een genoegzaam bekend fenomeen is dat iemand die onvindbaar wil worden voor autoriteiten zijn identiteit verandert: een andere naam, adres of geboortedatum of alledrie. Hierbij heeft de persoon in kwestie grofweg de keus uit twee alternatieven: een geheel andere identiteit aannemen (1) of in de buurt van de waarheid blijven (2). Elke keus heeft zijn voor- en nadelen. Met een geheel andere identiteit, mag je je absoluut niet vergissen. Dit is de categorie van de aliassen. De meesten verkiezen daarom in de buurt van de waarheid te blijven. Ze schrijven hun gegevens zodanig anders, dat het net lijkt alsof iemand anders een fout heeft gemaakt. Een simpel voorbeeld: de achternaam ‘Ronge’ wordt ‘Bonge’ – de suggestie is dat een ‘R’ abusievelijk als ‘B’ is gelezen en ingevoerd. Een geboortedatum wordt verdraaid, of er wordt een tikfout gemaakt. Manipuleren De problematiek voor internationale banken is de volgende: het controleren van elke internationale transactie op het voorkomen van één van de namen van de betreffende terroristenlijst. Het gaat dan om een vergelijking van de lijst met: • de naam van de rekeninghouder; • het betalingskenmerk; • de tenaamstelling van de rekening van de begunstigde. Binnen de automatisering ligt het overigens voor de hand dat een bank de namen van al haar rekeninghouders eerst (eenmalig) met de lijst vergelijkt. Het softwarematig vergelijken van persoons- en bedrijfsnamen is geen sinecure. Het is redelijk eenvoudig als alle namen gestandaardiseerd zijn en er nooit fouten worden gemaakt bij het inbrengen van de gegevens. Een applicatie vergelijkt dan de gestandaardiseerde en foutloze namen: ze zijn gelijk of niet. Dit is een ‘exacte match’. De praktijk wijst echter uit dat aan de twee genoemde voorwaarden nooit wordt voldaan. Mensen maken nu eenmaal fouten. In geval van bankrekeningen van terroristen komt daar nog bij dat ze namen fingeren en/of manipuleren om herkenning te voorkomen. Een andere, en wellicht de belangrijkste, complicerende factor is het omzetten van niet-westerse namen naar het Latijnse schrift. Ook het feit dat namen vaak uit meerdere elementen bestaan en de doorsneewesterling niet weet wat de betekenis van de samenstellende delen is, maakt een betrouwbare vergelijking erg lastig (zie kader). Een exacte vergelijking van gehele naamstrings of betalingskenmerken als middel om verdachte banktransacties op te sporen biedt weinig soelaas. Een kleine verbetering is mogelijk door een naam, op basis van spaties en koppelstreepjes, op te splitsen in de samenstellende delen en die in een matrix met elkaar te vergelijken. Volgordeverschillen in de naam leiden dan niet per definitie tot een ongelijkheid. Maar als de wijze waarop de woorden onderling worden vergeleken nog steeds exact is, leidt elk klein verschil in notatie van een woord tot non-identificatie. Klankcode De oplossing van het matchprobleem ligt enerzijds in de herkenning van de betekenis van naamsdelen, en anderzijds in het op intelligente wijze met elkaar vergelijken van deze naamsdelen. Om geen appels met peren te vergelijken, is het belangrijk te weten wat woorden betekenen in een tenaamstelling. De hiervoor benodigde kennis omvat onder meer: • de structuur; • feiten (in dit geval de voornamen, familienamen, voor-, tussen- en achtervoegsels et cetera); • het gebruik. Een eenvoudig voorbeeld van ‘structuur’ is de wijze waarop in Nederland namen van personen worden geschreven. Daarvan zijn er verschillende. Een eenvoudige is: voornaam en achternaam. Onder ‘feiten’ verstaan we een verzameling werkelijke gegevens: de waarden. Bijvoorbeeld alle familienamen. Dus als bekend is dat ‘Kok’ ook een familienaam is, dan wordt de naam ‘Ada Kok’ anders geïnterpreteerd dan ‘Ada Gegevensverwerking’. En dan komen namen ook nog op verschillende manieren voor: bijvoorbeeld in de aanhef van een brief. Dit is het ‘gebruik’. Om effectief te kunnen zoeken moet de gebruikte software daarnaast ook kennis bevatten over een land. In een multiculturele samenleving houdt dit ook niet-westerse namen in. In Nederland, Duitsland, België, Frankrijk of Groot-Brittannië leven ook mensen met een Arabische, Iraanse, Indische of Birmese afkomst. Door gebruik te maken van deze kennis zijn de zoekresultaten vele malen beter dan de klassieke, op exacte vergelijking gebaseerde, matchingsmethoden. Dit vindt zijn oorzaak in het gebruik van meerdere intelligente vergelijkingsmethoden: • fonologie (vergelijking op basis van klank); • spellingsvergelijking (op meerdere manieren). Deze technieken kunnen worden gecombineerd om een optimaal resultaat te behalen. Bij het fonologisch vergelijken krijgen gelijkklinkende woorden dezelfde klankcode. ‘Matthijssen’ en ‘Mateisen’ klinken hetzelfde. ‘Mustapha’ en ‘Mustafa’ ook. Verschillende schrijfwijzen van ‘Mohammed’ leiden naar dezelfde klankcode. ‘Mihammed’ (tikfout: op een qwerty-toetsenbord zit de ‘i’ naast de ‘o’) en ‘Mehmet’ klinken gelijk: ‘Menet’. Vanwege de onbekendheid van de betekenis en structuur van Arabische namen is het aannemelijk dat er veel verschillen in voorkomen en er fouten mee worden gemaakt. Het is aan te raden de gespelde woorden te vergelijken op basis van trigrammen. Deze techniek deelt elk woord op in stukjes van drie karakters. De trigrammen van twee verschillende woorden worden met elkaar vergeleken. Dit is ook toe te passen op ongecomprimeerde klankcodes. In dat geval spreken we van trifonenvergelijk. En dan blijkt dat ‘Mihammed’ volledig gelijk is aan ‘Mehmet’, omdat beide woorden leiden tot de klank ‘Menet’ (zie tabel). Geen zekerheid Overigens zijn echte synoniemen, dus ook die van Arabische namen, op te nemen in een synoniementabel. Door Mehmet, Mahmoud, Muhamed en andere, synoniem te verklaren, worden ze als 100 procent gelijk beschouwd. Als andere naamsonderdelen ook enigszins op elkaar lijken, is misschien sprake van een verdachte transactie. Aangezien de lijst met mogelijke terroristen en hun financiers circa vijfhonderd namen omvat en het dagelijks aantal internationale transacties dat een bank verwerkt niet enorm groot is, is het zinnig de naamgegevens van elke relevante betaling zowel op basis van spelling als klanken te vergelijken. Als dit een mate van overeenkomst oplevert die boven een bepaalde drempelwaarde ligt, moet de transactie worden gesignaleerd (zie figuur). In de hectiek van de nasleep van de gebeurtenissen op 11 september 2001 kozen banken vaak voor een pragmatische oplossing voor het matchen van de lijst met terroristische personen en organisaties met internationale betalingen. Dit gebeurt ofwel handmatig (eigenlijk visueel: met een blik op het scherm) ofwel door toepassing van de klassieke middelen. Deze methoden leveren onvoldoende zekerheid. Door het toepassen van intelligentie tijdens de matching en door vanuit meerdere gezichtspunten naar de data te kijken, worden de mazen rondom de verdachte geldstromen verder aangetrokken. Drs. H.T.J. Gores r.i. is als general manager werkzaam bij Human Inference BV in Arnhem (h.gores@HumanInference.com).Transcriptie en translitteratie Namen uit niet-westerse culturen zijn niet alleen op een andere manier opgebouwd, maar er wordt vaak ook een ander schrift gehanteerd. Namen uit bijvoorbeeld het Arabisch moeten in het Latijnse schrift worden omgezet. En dan nog naar de betreffende taal. Zo wordt in NRC Handelsblad gesproken van ‘Osama bin Laden’ en ‘Al-Qaeda’. In de Frankfurter Allgemeine van ‘Usama Bin Ladin’ en ‘Al Qaida’. Dit zijn twee uiterst actuele namen in het Duits en het Nederlands. De complexiteit is vele malen groter als rekening moet worden gehouden met meer talen, bewust gemaakte afwijkingen en fouten die goedbedoelende medewerkers onbewust maken. Transcriptie is het omzetten van tekens of karakters van het ene naar het andere schrift. Daarvoor is een zeer complexe set regels beschikbaar die niet leidt tot eenduidige en niet-ambigue omvorming. Bij translitteratie wordt ook de klank van karakters meegenomen. Het Arabisch kent vrijwel geen klinkers, daardoor zijn ‘Mehmet’ en ‘Mohammed’ feitelijk dezelfde naam. Een en ander leidt er bijvoorbeeld ook toe dat iemand, met een naam die klinkt als ‘moestaafa’, in Duitsland wordt schreven als ‘Mustapha’ en in Nederland als ‘Moestafa’.

Lees dit PRO artikel gratis

Maak een gratis account aan en geniet van alle voordelen:

  • Toegang tot 3 PRO artikelen per maand
  • Inclusief CTO interviews, podcasts, digitale specials en whitepapers
  • Blijf up-to-date over de laatste ontwikkelingen in en rond tech

Bevestig jouw e-mailadres

We hebben de bevestigingsmail naar %email% gestuurd.

Geen bevestigingsmail ontvangen? Controleer je spam folder. Niet in de spam, klik dan hier om een account aan te maken.

Er is iets mis gegaan

Helaas konden we op dit moment geen account voor je aanmaken. Probeer het later nog eens.

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in