Development

Procesmanagement
Digitalisering processen

Ethiek bij process mining: vier richtlijnen

Er bestaat geen intrinsiek goede of slechte data-analysemethode

22 november 2016

Er bestaat geen intrinsiek goede of slechte data-analysemethode

De meeste bedrijven houden zich bezig met data-analyse. Dergelijke analyses bieden kansen. Process mining kan de basis zijn voor procesverbetering. Maar met de toename van data science komt ook het verantwoord gebruik van data centraal te staan. Hoe staat het met de privacy? Anne Rozinat formuleert vier richtlijnen.

Toen ik 12 jaar geleden naar Nederland verhuisde en mijn boodschappen bij Albert Heijn deed, wilde ik niet meedoen met de bonuskaart, omdat ik niet wilde dat het bedrijf mijn boodschappen zou bijhouden. Voor mijn gevoel zou deze informatie het bedrijf helpen om de producten zodanig te presenteren dat ik meer zou gaan kopen. Het voelde gewoon niet goed.

Tegenwoordig worden er overal veel data verzameld. De meeste bedrijven zijn op de een of andere manier bezig met het analyseren van data. Data-analyses kunnen bedrijven en hun klanten enorme kansen bieden, maar met deze toename van data science komt ook de ethiek, het verantwoord gebruik van data, centraal te staan. Initiatieven zoals de seminars Responsible Data Science (http://www.responsibledatascience.org), creëren dat bewustzijn en stimuleren onderzoekers om algoritmes te ontwikkelen die eerlijkheid, nauwkeurigheid, vertrouwelijkheid en transparantie nastreven.

Het goede nieuws

Process mining is een data-analysemethodiek binnen het grotere kader van data science, dat zich richt op het analyseren van processen. Zij is omstreeks 15 jaar geleden bij de Technische Universiteit Eindhoven ontwikkeld. Process mining biedt de kans om complete processen in kaart te brengen en volledige processen te analyseren – gebaseerd op digitale sporen in datasystemen. Process mining kan de basis zijn voor procesverbetering en de naleving ervan. Maar hoe weet men dat process mining op een verantwoorde manier wordt gebruikt? Waar moet men op letten bij het introduceren ervan in een bedrijf?

Het goede nieuws is dat process mining in de meeste situaties geen persoonlijke informatie analyseert, omdat zij zich doorgaans richt op de interne organisatorische processen en niet op profielen van klanten. Process mining kan echter de problemen in processen transparanter maken dan waar mensen zich comfortabel bij voelen (en er zijn meer dingen om rekening mee te houden). In dit artikel geef ik vier richtlijnen die kunnen helpen process mining verantwoord te gebruiken.

Overweeg een ethisch handvest op te stellen

Er is geen intrinsiek goede of slechte data-analysemethode. Het zijn altijd mensen die de technologie gebruiken. Neem Albert Heijn: het bedrijf zou de informatie die het op de bonuskaart opslaat, kunnen gebruiken om er zeker van te zijn dat klanten de langste weg nemen in de winkel om de normale boodschappen te doen (zodat zij langs zoveel mogelijk producten lopen). Maar het bedrijf kan de informatie ook gebruiken om de winkelervaring prettiger te maken of om meer producten aan te bieden die we lekker vinden.

De volgende vier richtlijnen zorgen ervoor dat process mining een opbouwende kracht wordt in een onderneming.

1. Verduidelijk het doel van de analyse

Aan het begin van een process-miningproject dient men na te denken over het doel van de analyse. Mensen beginnen vaak met een vaag idee en halen alle mogelijke gegevens boven water. Analyseer wat het probleem is en welke gegevens nodig zijn om het op te lossen.

Do’s:

• Controleer of er wettelijke beperkingen zijn omtrent de data. Een voorbeeld: in Duitsland mag personeelgerelateerde informatie niet gebruikt worden en kan ook niet eens worden verkregen. Indien een project betrekking heeft op het analyseren van klantinformatie, zorg er dan voor dat de beperkingen duidelijk zijn. Overweeg de anonimiserende opties (richtlijn 3).

• Overweeg om een ethisch handvest op te stellen dat het doel van het project weergeeft, inclusief wat er wel en niet gedaan mag worden op basis van de analyse. Men kan bijvoorbeeld duidelijk aangeven dat het doel niet is om de prestaties van werknemers te evalueren.

Don’ts:

• Formuleren van onzorgvuldige of vage doelen die mensen kunnen afschrikken. Het project moet op zakelijke doelen gericht zijn om de medewerking van procesmanagers te krijgen (zie ook richtlijn 4).

• Beginnen met een groot project. Men moet zich richten op één proces met een duidelijk doel. Indien men de omvang van het project te groot maakt, kunnen mensen het blokkeren, terwijl zij niet eens begrijpen wat process mining allemaal kan.

2. Verantwoorde omgang met gegevens

Net als bij alle andere data-analysemethodes, dient men voorzichtig te zijn met informatie.

Verzamel niet in de wilde weg, bedenk van tevoren wat je nodig hebt

Do’s:

• Zorg dat derde partijen (bijvoorbeeld consultants die de process-mininganalyse uitvoeren) een geheimhoudingsovereenkomst tekenen, zodat zij de vertrouwelijkheid van de data respecteren.

• Zorg dat de harde schijven van laptops, externe harde schijven en USB-sticks die gebruikt worden voor het overzetten van data, gecodeerd zijn.

Don’ts:

• Gegevens overdragen aan medewerkers voordat gecontroleerd is wat in de data staat. Het kan gebeuren dat de dataset meer informatie bevat dan men heeft aangevraagd, of er kan sprake zijn van gevoelige data waarover men niet heeft nagedacht. Zorg ervoor dat alle gevoelige data worden verwijderd of geanonimiseerd voordat zij worden overgedragen.

• Data laden op een cloud-gebaseerde process-miningtool zonder (a) gecontroleerd te hebben of de organisatie dit toelaat, en (b) zonder de toolverkoper te vragen hoe hij ervoor zorgt dat de data beveiligd worden. Gebruik daarvoor in de plaats een lokale desktop-process-miningtool (zoals ProM of Disco) om de data lokaal te analyseren of zorg ervoor dat de verkoper een on-premise versie van zijn software binnen de organisatie opzet.

3. Overweeg anonimiseren

Als er gevoelige data zitten in de dataset, kan men er ook voor kiezen de data te anonimiseren in plaats van te verwijderen. Het anonimiseren stelt een bedrijf in staat om de oorspronkelijke data te verdoezelen, terwijl het patroon van de dataset voor analyse behouden blijft. Men kan bijvoorbeeld de namen van medewerkers anoniem maken en toch de verdeling van de werklast analyseren.

Geen velden onnodig anoniem maken

Do’s:

• Bepaal welke datavelden gevoelig zijn en anoniem gemaakt moeten worden. Sommige process-miningtools (bijvoorbeeld Disco en ProM) hebben anonimiseringsfunctionaliteit ingebouwd. Hiermee kan men informatie importeren en op een anonieme wijze exporteren.

• Houd er rekening mee dat ondanks het anonimiseren, bepaalde informatie nog herkenbaar kan zijn. Door bijvoorbeeld het slim combineren van gegevens: patiënten met een zeldzame ziekte combineren met de plaats van behandeling. De anonimiteit is dan niet meer gewaarborgd.

Don’ts:

• Het anoniem maken van data voordat zij zijn opgeschoond. Het kan namelijk gebeuren dat het zuiveren van de data dan niet meer mogelijk is.

• Het onnodig anoniem maken van velden. Terwijl de patronen bij het anoniem maken wel in de data blijven – vergeleken met het volledig verwijderen van informatie – kan men makkelijk relevante informatie kwijtraken. Wanneer men bijvoorbeeld de Case ID anonimiseert in het incidentmanagementproces, kan men het ticketnummer niet meer opzoeken in het servicedesksysteem.

4. Richt een gezamenlijk cultuur op

Door een gezamenlijke cultuur op te richten rond een process-mininginitiatief, kan men alle belanghebbenden duidelijk maken dat hun perspectief wordt meegenomen. Het doel is om een sfeer te creëren waarin mensen niet voortdurend op hun fouten worden gewezen, maar waarin iedereen zich inzet voor hetzelfde project, een sfeer waarin de analyse en procesverbetering een gezamenlijke inspanning zijn.

Do’s:

• Controleer de datakwaliteit voordat de data-analyse wordt uitgevoerd, door een domeindeskundige te betrekken bij het datavalidatieproces. Op deze manier kan men het vertrouwen winnen van de proceseigenaren: de data laten zien wat er daadwerkelijk gebeurt, men begrijpt waar de data voor staan.

• Werk op een iteratieve wijze en presenteer de bevindingen als een uitgangspunt voor discussie. Geef mensen de kans om uit te leggen waarom bepaalde dingen gebeuren en laat hen aanvullende vragen stellen. Behalve het verbeteren van de kwaliteit en de relevantie van de analyse, zal dit ook helpen om de betrokkenheid van alle projectleden bij de definitieve resultaten te verhogen.

Don’ts:

• Het formuleren van overhaaste conclusies. Je mag er nooit van uitgaan dat je alles van het proces weet. Zo kunnen teams die wat trager zijn, moeilijke gevallen afhandelen, mensen kunnen goede redenen hebben om af te wijken van het proces, en het kan zijn dat je niet alles uit de data kunt halen (enkele stappen zouden buiten het systeem om uitgevoerd kunnen worden).

• Een onjuist beeld geven van de data of iets constateren dat niet door de data wordt ondersteund. Voor alle resultaten uit de analyse moet men bijhouden welke stappen zijn gedaan bij het voorbereiden van de data en de process-mininganalyse. In het geval er vragen zijn over de basis van de analyse, kan men dan altijd teruggaan en laten zien welke filters er zijn toegepast op de data – om zo te komen tot het beeld dat wordt gepresenteerd.

Lees meer over Development OP AG Intelligence
Reactie toevoegen