Innovatie & Strategie

Analytics
Big Data

De uitdaging die Big Data heet

Pijnpunten en richtlijnen bij integratie van Big Data-analytics

© CC0 - Pixabay
31 oktober 2016

Pijnpunten en richtlijnen bij integratie van Big Data-analytics

Een onderzoek bij 73 bedrijven wereldwijd, uit sectoren als financiële diensten, consulting, technologie, overheid, telecom en retail, geven inzicht in hoe bedrijven zich vandaag aanpassen aan analytics en aan de nieuwe uitdagingen die Big Data creëert.

Gebruik van analytics in een organisatie is noodzakelijk om competitief te blijven. Het is echter een lang proces om analytics integreren in de organisatie [2] en er vervolgens de vruchten van te plukken. Ondertussen ontwikkelen innovatieve technologieën zich sneller dan bedrijven zich kunnen aanpassen. Zo dwingen de verschillende kenmerken van Big Data ons om nog sneller te reageren.

Hedendaagse toepassing

De werkelijke toepassing van het concept analytics is pas de laatste jaren aan het stijgen. Veel bedrijven bevinden zich nog steeds in de implementatiefase van analytics. Dit zien we terug in de technieken en doelstellingen die hiermee gepaard gaan. Marketinganalytics wordt bijvoorbeeld vaker toegepast dan HR-analytics. Deze laatste brengt bovendien gevoeligere, personeelgebonden inzichten met zich mee, wat sommige bedrijven afschrikt.

Daarnaast zien we dat bedrijven initieel eerder voor descriptive analytics dan voor meer geavanceerde predictive analytics [3] kiezen. Dit uit zich in de gebruikte technieken. Organisaties kiezen eerder simpele toepassingen die minder performante modellen creëren [7]. Zo werkt 74 procent met beslissingsbomen en met de welgekende lineaire regressie techniek. Echter, slechts 33 procent gebruikt neurale netwerken en slechts 22 procent support vectormachines.

Deze observatie kan gelinkt worden aan het groeiproces van organisaties. Data science-teams die net gestart zijn in bedrijven, dienen hun modellen te kunnen verantwoorden om het vertrouwen van het management te winnen.

Veel Bedrijven nog in implementatiefase
fig 1: Veel bedrijven nog in implementatiefase

 

Er is dus nog veel potentieel is op gebied van analytics en zijn toepassingen. Dit geldt ook voor Big Data-analytics. Werken met grote hoeveelheden of met ongestructureerde data, vergt niet alleen andere technieken, maar ook een nieuwe kijk op data en analytics. We zien dat reeds 45 procent van de bedrijven webanalyticssoftware heeft geïmplementeerd (tegenover 38 procent niet en 16 procent ongekend). Hadoop is door 40 procent geïnstalleerd (tegenover 49 procent niet) en 37 procent heeft textminingsoftware in gebruik (tegenover 49 procent niet).

Het analyticsteam

Er is veel interesse in de vraag hoe bedrijven analytics kunnen integreren. In grote lijnen zien we de volgende structuren: (1) een gecentraliseerd team of center of excellence, (2) een lokaal team, (3) een verspreid model, en (4) uitbesteding van analytics. Eerdere studies [3], [5], [6] tonen aan dat een verspreid model, waarbij data scientists ongecoördineerd op verschillende plaatsen in het bedrijf werken, het meest voorkomt. Toch leidt een gecentraliseerd model sneller tot maturiteit omdat dit schaal- en synergievoordelen bewerkstelligt [10]. Ook draagt dit bij aan overdracht van kennis en expertise wat een datagedreven cultuur aanmoedigt. Tegelijkertijd zal een werkelijk datagedreven bedrijfscultuur [10] vaak een gecombineerd model gebruiken met lokaal en niet gecoördineerde data scientists om kort op de bal te kunnen spelen.

Onze survey toont dat bedrijven verschillende combinaties gebruiken, maar ook dat centralisatie de voorkeur heeft. Bovendien signaleren we dat in bijna twee derde van de bedrijven, de verantwoordelijke voor analytics een hoge positie bekleedt, wat toont dat inzichten gedreven door data aan belang winnen. Drie veel voorkomende toedelingen van de verantwoordelijkheid zijn:

  • een bestaande chief-level executive (CXO) (29 procent),
  • een nieuw gecreëerde CXO functie (24 procent), bijvoorbeeld een chief analytics officer, of
  • het hoofd van het betreffende departement waar analytics wordt toegepast (29 procent).

Slechts in 8 procent van de bedrijven is een middenmanager verantwoordelijk, in 6 procent de chief executive officer en in 5 procent niemand.

In het algemeen, zijn de meeste analyticsteams relatief klein. Bijna de helft van de organisaties heeft tien of minder data scientists. Wel merken we dat de grootte van de teams groeit. Er is een positieve correlatie tussen de grootte van een team en de omvang van het bedrijf, het aantal jaar dat het bedrijf analytics uitvoert, als het bedrijf aan e-business doet en als het bestuur aanstuurt op een analytics cultuur. Daarnaast zijn data scientists in het algemeen mannelijk en jong met een gemiddelde leeftijd van 32. Slechts 20 procent van de teams heeft een evenwichtige genderdiversiteit en 7 procent heeft een overwegend vrouwelijk team.

Kwaliteiten van een data scientist

De analyticsteams groeien, maar het aantal data scientists groeit onvoldoende mee. McKinsey Global Institute [8] voorspelde in 2011 een tekort van 140.000 tot 190.000 mensen met geavanceerde analytische vaardigheden en bovendien een tekort van 1,5 miljoen managers en analisten die weten hoe ze inzichten uit Big Data kunnen omzetten in beslissingen. De juiste mensen met de juiste kwaliteiten vinden wordt dus steeds moeilijker en belangrijker.

Onze survey peilde de vaardigheden die bedrijven verwachten van hun data scientists. In het algemeen zoeken bedrijven naar een goede combinatie van kwantitatieve vaardigheden en inzicht in de bedrijfsproblematiek. Verder valt het op dat er enkele atypische vaardigheden belangrijk zijn geworden, zoals juridische kennis en inzicht in data kwaliteit. Minder belangrijk zijn hardware vaardigheden. Dit kan mogelijk verklaard worden door een grotere scheiding van het IT en analytics team. In 79 procent van de bedrijven heeft IT immers een ondersteunde rol voor analytics.

Daarnaast merken we op dat de huidige tekorten in drie grote categorieën vallen. Ten eerste, is er nog steeds een grote behoefte aan personen met kwantitatieve vaardigheden. Ten tweede wordt er een nadruk gelegd op de voeling met de departementen en het bedrijf waarbinnen analytics wordt toegepast. Dit is belangrijk om analytics op de juiste plaatsen toe te passen en data werkelijk te kunnen omzetten in inzichten en beslissingen. Ten slotte, is er een nieuwe behoefte ontstaan, namelijk kunnen werken met Big Data. Bedrijven zijn op zoek naar mensen die kunnen omgaan met uiteenlopende data en grote datavolumes. Het is niet gemakkelijk om al deze kwaliteiten in één persoon te vinden, dus het wordt nog belangrijker om het juiste team samen te stellen en hen de juiste opleiding te geven.

Cloud een oplossing?

Recent is er een nieuw concept van geautomatiseerde analytics [4], [11] opgedoken. Deze application programming interfaces (API’s) berusten op een cloudplatform voor de opslag en het delen van data en analytics modellen. Dat biedt de mogelijkheid met analytics aan de slag te gaan zonder grote soft- en hardware investeringen. Bovendien zouden deze oplossingen analytics toegankelijk maken voor personen zonder expertise. Met slechts enkele kliks kunnen bijvoorbeeld marketing, financiën en HR specialisten hun data visualiseren en inzichten genereren. We maken hierbij enkele kanttekeningen. Meer bepaald, men kan zich afvragen wie de verantwoordelijkheid draagt voor de besluiten die uit deze modellen voortvloeien: de verkoper van de API, de bedrijfsspecialist, IT of de manager? Daarnaast hebben leken moeite om inzichten te valideren [1], [11]. Daarom is het aangeraden om een minimum opleiding te bieden en de geijkte stappen van het analyticsproces als richtlijnen aan te houden [11].

Uitdaging Big Data
Fig 2: Waardering van vaardigheden voor Data Scientists

Wel kunnen analytics API’s een (tijdelijke) oplossing bieden voor een tekort aan data scientists, en voor de complexiteit van Big Data. De cloud laat toe om grote hoeveelheden data op een flexibele manier en zonder grote investeringen op te slaan en hier vervolgens de nodige technieken op los te laten. Daarnaast steunen deze API’s op het creëren van een analyticsplatform [4] waar technieken intern en extern gedeeld kunnen worden. Dit kan in-house datascientists kennis laten maken met geschiktere technieken. Ten slotte is er een aantal API’s die zich specifiek focussen op het analyseren van tekst, video of web analytics. Daarmee kan een organisatie snel nieuwe soorten data analyseren zonder grote investeringen of een lange leercurve.

Maturiteit

In het verleden zijn verscheidenen maturiteitsmodellen voor data warehousing en business intelligence voorgesteld [9]. Modellen specifiek gericht naar analytics maturiteit zijn echter nog beperkt. Eén van de bekendste bestaat uit de vijf opeenvolgende fasen van analytics competitiviteit, ontwikkeld in 2007 door Davenport en Harris [2]. In 2010 werd dit aangevuld met het DELTA raamwerk [3], hetgeen staat voor toegankelijke, hoge kwaliteit data; bedrijfsoriëntatie; analytics leiderschap; strategische doelstellingen; en de analisten zelf. Dit model bevat verscheidene richtlijnen om per succes factor over te gaan naar een hoger niveau van analytics competitiviteit.

Ook wij zien verschillende niveaus van maturiteit terugkomen in onze resultaten. Bedrijven ontwikkelen zich op gebied van technieken en toepassingen. HR-analytics is bijvoorbeeld enkel aanwezig in de meest mature bedrijven. Bovendien, hoe langer een bedrijf analytics toepast, hoe vaker men voorspellende toepassingen in plaats van enkel descriptieve technieken nastreeft. Initieel starten de meeste bedrijven met simpele OLAP-technieken en segmentatie. Op een volgend niveau starten bedrijven met simpele, begrijpbare analyticstechnieken, bijvoorbeeld beslissingsbomen en regressietechnieken. Ten slotte passen de meest mature bedrijven ook geavanceerde [7] technieken toe, zoals neurale netwerken en ensemble technieken. Naast de groeicurve in technieken en toepassingen, bemerken we ook een groeicurve in organisatie. Aanvankelijk starten bedrijven met simpele, kleinschalige projecten. Dit evolueert dan naar analytics georganiseerd op departement niveau en ten slotte organisatiewijde analytics met een zeer data-gedreven beslissingsproces.

Conclusie

Big Data brengt nieuwe uitdagingen met zich mee in een reeds veranderende bedrijfsomgeving. Hoewel veel bedrijven bezig zijn te leren omgaan met analytics, merken we dat er toch reeds plaats is voor Big Data. Bedrijven kijken naar nieuwe tools, zoeken nieuwe vaardigheden in hun data scientists en streven een data-gedreven beslissingscultuur na. Echter, de weg is nog lang. Door een goede focus op de organisatie van zowel data als mensen, kunnen bedrijven zich uiteindelijk opwerken naar echte Big Data analytics competitieve bedrijven.

Lees meer over
Zie ook Innovatie & Strategie op AG Connect Intelligence
1
Reacties
Pascal Lubbe 06 december 2016 10:07

Goed stuk, duidelijk voorhaal voor elke lezer. Bedankt, groeten, Pascal. SAS Nederland.

Reactie toevoegen