Bias is een blijvertje
Data-analisten besteden veel aandacht aan het verwijderen van bias uit data. Er wordt veel onderzoek gedaan naar methodes om bias in data te detecteren. En er is tooling ontwikkeld om bias in data te ontdekken en te verwijderen. Dit gebeurt door de data te schonen. Maar algoritmes kunnen ook vooroordelen die in de data zijn verborgen eruit pikken en gebruiken. Daarom suggereren anderen dat we meer gebruik moeten maken van biasvrij kunstmatige data (synthetic data). Deze data genereren we zelf, zonder de biases uit de buitenwereld over te nemen. Maar het bias-vrij of bias-arm maken van data is en blijft mensenwerk. Het genereren van synthetische data blijft mensenwerk. En al de beslissingen die worden genomen bij het bias vrijmaken, zijn weer onderworpen aan menselijke vooroordelen die we allemaal hebben.