Van datalake naar AI-toepassing
Bedrijven beschikken tegenwoordig over grote hoeveelheden data die via verschillende kanalen worden verzameld. Complexe afhankelijkheden in de data maken het een uitdaging deze data overzichtelijk en kostenefficiënt op te slaan. Datalakes zijn hiervoor een oplossing. Maar hoe gebruik je de data daarin voor AI-toepassingen? De CRISP-DM-methode voor bigdataprojecten biedt volgens Fabian Langer en Kouros Pechlivanidis hiervoor een goede oplossing.
In een eerder artikel heeft Thomas Mons beschreven hoe bedrijven dataoplossingen kostenefficiënt kunnen ontsluiten in de cloud. Bij het inrichten van de data-infrastructuur zijn datalakes en datawarehouses cruciaal. Datalakes bestaan uit grote hoeveelheden platte data met veel features, die vervolgens voor AI-toepassingen kunnen worden gebruikt. Datawarehouses bestaan daarentegen juist uit gestructureerde en gefilterde data, wat deze toepassingen ideaal maakt voor dashboarding.