Analysedatabase doet het liever niet met SQL
Het Spaanse bedrijf illuminate kiest echter voor een andere benadering: het ‘value-based’ datawarehouse.
De gedachte achter de speciaal voor analysedoeleinden gebouwde database van illuminate is dat SQL een zodanig rigide gedefinieerde gegevenstoegangstaal is dat deze niet geschikt is voor het zinvol ad hoc exploreren van grote gegevensverzamelingen. De technische consequentie van een alternatieve aanpak is wel dat je gegevens op een andere manier opslaat. illuminate doet dat door alle waarden uit de relationele database(s) die erin worden geladen maar één keer op te slaan, of dat nu ‘Den Haag’ is of ‘38’.
Een extra metadatalaag bestaat uit een groot aantal ‘pointers’ die naar die waarden verwijzen. Die pointers houden bijvoorbeeld bij of de waarde ’38’ in de tabel ‘schoenmaat’, ‘leeftijd’ of ‘huisnummer’ voorkomt. “Door op die manier gegevens vast te leggen, zijn we in staat hele lastige SQL-achtige vraagstukken door middel van knippen en plakken beantwoord te krijgen”, zegt Richard Lagrand, salesmanager voor illuminate Nederland.
Maar met SQL zelf doe je dat niet; daarvoor zijn te veel handelingen nodig, die doorgaans ook nog eens uitgevoerd moeten worden door een specialist. “Als ik als marketeer bij een grote onderneming een vraag heb aan mijn bedrijfsdata, dan moet ik naar de technische afdeling toe, daar moeten ze heel goed nadenken welke tabellen ze gaan laden en op welke manier die geïndexeerd en gegroepeerd moeten worden, in bijvoorbeeld datacubes. Maar als marketeer weet ik vaak niet waar ik precies naar op zoek ben en als ik eenmaal een antwoord heb, kan het best zijn dat dat weer vijf vragen opwerpt. Dus dan zou je die cyclus weer opnieuw in moeten.”
illuminate stelt voor dat type mensen de juiste technologie te kunnen bieden, met als extra voordeel dat die niet over echte SQL-kennis hoeven te beschikken als ze de eigen tool illuminate Explorer gebruiken. Desgewenst kunnen bedrijven ook vanuit omgevingen als Cognos of Business Objects de database bevragen, via een standaard-ODBC-link.
De software van illuminate bestaat uit een complete business intelligence-suite. Maar de onderscheidende factor is de database, die door de enkelvoudige opslag van zeer beperkte omvang kan blijven. Het bedrijf claimt in een van zijn whitepapers in een test met een forse database een compressie tot minder dan een procent van de omvang van de kale gegevens te hebben bereikt. Van de 1,8 miljard oorspronkelijke waarden bleven 13 miljoen unieke waarden over. De uiteindelijke ruwe database van 18 gigabyte resulteerde in een complete database van 19,5 gigabyte, terwijl dat met een gewone relationele database al gauw 90 tot 100 gigabytes zou zijn geweest, door alle indexen die een dergelijke database moet aanleggen om als zodanig bruikbaar te zijn.
In Nederland werkt illuminate sinds afgelopen zomer aan een klantenbestand. In onder andere de VS (retail) en Spanje (veelal banken) is dat al wel gelukt. “De grote gemene deler is het bedrijf dat al een datawarehouse en een business intelligence-suite heeft, maar daarnaast behoefte heeft aan snelheid en flexibiliteit. Dus waar de marketeer klem zit tussen zijn gegevens en de technische afdeling. Klantensegmentering kunnen wij bijvoorbeeld al in het laadproces voorbereiden.”
/f.blankena@sdu.nl