Human Inference omarmt open source community

Datacleaner is voor het Nederlandse Human Inference een eerste open source-product. Maar Chief Marketing Officer Vincent van Hunnik ziet de voordelen van het model duidelijk voor zich: “Hoe meer mensen meedenken en mee ontwikkelen aan dit tool, hoe beter. Maar als eigenaar van de code en sponsor van de community willen we zelf ook inhoudelijk bijdragen. Onze consultants zijn beschikbaar als vraagbaak voor leden van de community en mogen zelf ook uren schrijven voor uitvoerend werk ten behoeve van DataCleaner.”
Op dit moment is DataCleaner in staat om inzicht te bieden in het voorkomen van allerhande afwijkingen in bestanden. Daarbij moet niet alleen worden gedacht aan hard aanwijsbare fouten zoals e-mailadressen zonder @ of namen die vraagtekens of andere onmogelijkheden bevatten. Het tool wijst bijvoorbeeld ook op kansrekenkundig onaannemelijke verdelingen in de bestanden, zoals een hoog aantal dubbele namen, onmogelijke creditcard-nummers of over- dan wel ondervertegenwoordiging van bepaalde geografische gebieden.
Geen vrees voor kannibalisme
Op de agenda voor komende versies van DataCleaner staan nog aanvullende functies voor onder meer het beoordelen van de opbouw van burgerservicenummers (BSN) en uitgebreider mogelijkheden om maatwerkanalyses uit te voeren. Ook komt er een koppeling met Human Inference's on-demand platform, waarmee een aantal van de gesignaleerde ongerechtigheden in de databestanden zijn te verhelpen.
Van Hunnik maakt zich voorlopig geen zorgen over de mogelijkheid dat DataCleaner zich zo voortvarend zou kunnen ontwikkelen dat het op termijn een bedreiging gaat vormen voor de commerciële producten en diensten. De onlangs vrijgegeven versie 2.0 bevat naast allerhande nieuwe analysemogelijkheden bijvoorbeeld ook al bepaalde mogelijkheden om fouten te herstellen, wat raakt aan de kernfunctionaliteit van Human Inference’s Data Improver.
Van Hunnik: “Zou kunnen, maar ik zie het niet zo gauw gebeuren. Meer dan 20 jaar ervaring, research en ontwikkeling is niet zomaar ingehaald.” Als voorbeeld van een correctie-hoogstandje noemt hij het ontrafelen van per ongeluk samengevoegde velden in bepaalde records: DataCleaner kan prima onderkennen dat een naam en een adres onterecht in één veld zitten, maar om iets als {9 5404 NK Uden JB van Ieperen Boekelsedijk} te kunnen herstellen is toch wel wat meer nodig.” De software maakt daartoe bij voorbeeld gebruik van landspecifieke taalregels en adresconventies.
High profile klanten
Zo’n 250 bedrijven gebruiken oplossingen van Human Inference om te kunnen voldoen aan governance-regels, opsporing van fraude en het trefzekerder zoeken in call centers. Enkele bekende namen uit het klantenbestand zijn AEGON, Allianz, ANWB, Achmea, Center Parcs, Ministerie van Justitie, Essent, Holland Casino, ING, KPMG, KPN, Nederlandse Spoorwegen, TNT Post, Ymere en Wehkamp. Naast het hoofdkantoor in Arnhem heeft het bedrijf vestigingen in Engeland, Duitsland, België, Zweden, Denemarken en Spanje.
Reacties
Om een reactie achter te laten is een account vereist.
Inloggen Word abonnee