Datalakes: onmisbaar of onoverzichtelijk?
Allereerst is het goed te weten wat wordt verstaan onder een datalake. De ‘introductie’ van de term wordt toegeschreven aan James Dixon, CTO van BI- en bigdataplatform Pentaho. Zijn omschrijving van de term en de analogie met gefilterd water is overal te vinden. Vrij vertaald luidt deze: “Als je een datamart ziet als een winkel gevuld met flesjes water – gefilterd, verpakt, gestructureerd en klaar voor consumptie – dan is een datalake een meer vol met water in een meer natuurlijke staat. De inhoud van dit meer stroomt binnen vanuit een bron om het meer te vullen, en verschillende gebruikers van het meer kunnen het meer ingaan om het te onderzoeken, erin te duiken of monsters te nemen.” Om deze beschrijving aan te vullen, kan worden gesteld dat in een datalake alle soorten gegevens kunnen binnenstromen en worden opgeslagen in hun originele staat.