Overslaan en naar de inhoud gaan

IT moet 'Wilde Westen' in datascience beteugelen

De rol van datascientists groeit naar mate meer organisaties over gaan tot datagestuurd werken. Zeker bij grotere organisaties leidt dat al snel tot een wildgroei aan gereedschappen en dubbel werk aan dezelfde datasets. De CIO moet daarom zorgen dat de IT-afdeling standaarden instelt zodat nieuwe processen reproduceerbaar en herbruikbaar zijn.
Programmeren
© Shutterstock.com
Shutterstock.com

Het werk van een datascientist binnen een organisatie start doorgaans op een afdeling of binnen een team. Er is behoefte om beslissingen beter te onderbouwen met gegevens die binnen het bedrijf aanwezig zijn of van externe bronnen kunnen worden betrokken. Een ander team ziet het succes van de aanpak en schakelt ook een datascientist in voor een eigen project.

Iedere datascientist heeft eigen methoden en tools en boort zelf databronnen aan. Al snel ontstaan silo's en een heel scala aan opensourcegereedschappen, schetst Nick Elprin de groei van een ongewenste situatie. Elprin is ceo van Dominion Data Lab bij Venturebeat. Ontwikkelingen in datascience gaan snel en bij onvoldoende onderhoud kunnen tot dan toe prima presterende modellen opeens slechte voorspellingen geven.
Voor het doen van experimenten worden bedrijfsdata gekopieerd die vervolgens een eigen leven gaan leiden op verschillende plekken in de organisatie en soms zelfs daarbuiten wanneer met cloudservices een heel shadow-IT-landschap ontstaat.

Veel dubbel werk

Op een gegeven moment is een team klaar met de experimenten en wil het de nieuwe werkwijze in productie nemen. De IT-afdeling komt dan voor de taak te staan de uiteenlopende omgevingen die teams hebben opgezet, over te nemen. Daar ontstaan problemen omdat gekozen oplossingen niet blijken op te schalen. Bovendien moet de IT-afdeling veel dubbel werk verrichten omdat de oplossingen van teams geënt zijn op verschillende bases.

Naar verwachting gaat de rol van datascience in de nabije toekomst nog flink groeien. Daarom is het nu van belang een goede governance op te zetten en standaarden af te spreken waarbinnen datascience zich op een verantwoorde en onderhoudbare manier kan ontwikkelen, adviseert Elprin.

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee

Bevestig jouw e-mailadres

We hebben de bevestigingsmail naar %email% gestuurd.

Geen bevestigingsmail ontvangen? Controleer je spam folder. Niet in de spam, klik dan hier om een account aan te maken.

Er is iets mis gegaan

Helaas konden we op dit moment geen account voor je aanmaken. Probeer het later nog eens.

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in