Development

Analytics
Informatie

De inhoud bepaalt de waarde

Een goede inhoudelijke analyse maakt van een oud bestand een waardevol informatie-object

© CC0 Public Domain Geralt
18 mei 2017

Het grote verschil tussen gestructureerde en ongestructureerde informatie is dat je van de eerste direct kunt zien wat het is en wat de ‘waarde’ ervan is.

Bij de tweede ligt de werkelijke waarde vaak verborgen in de inhoud.

Gestructureerde informatie (data en tekstgegevens) kun je direct lezen en heeft een concrete waarde. Door gegevens binnen de context van een applicatie te brengen wordt de waarde ervan nog concreter en wordt ook de relatieve waarde ten opzichte van andere gegevens duidelijk. Honderd is in absolute waarde 100, maar in betekenis gering als de naastvolgende waarde in een serie 10.000 is. Gestructureerde informatie kun je sorteren op waarde, analyseren en eenvoudig in relatie brengen tot andere informatie-elementen. Business Intelligence- en Big Data-analysesoftware maken hier dankbaar gebruik van.

Ongestructureerd

Hoe anders is het met de waardebepaling van ongestructureerde informatie. Allereerst staat deze informatie als individuele bestanden ergens in een opslag of beheeromgeving. Afhankelijk van de opslagomgeving kun je zien wat voor objecttype zij is, haar omvang, de titel en mogelijk wat aanvullende gegevensvelden zoals creatiedatum, eigenaar en laatst gebruikt. Ook de plaats van het object binnen de beheeromgeving kan enige informatie geven over de aard van het object. Maar het zijn nog steeds om- of beschrijvende  gegevens over het object zelf.
Mogelijke informatie over de inhoud van het object kan worden verkregen uit aanvullende metadata of indexvelden. Als deze velden tenminste zijn gedefinieerd en zinvol zijn ingevuld. Iets dat door de gebruiker niet altijd als een plezierige taak wordt ervaren.

Nieuwe beheersoplossingen helpen de gebruiker bij het opslaan van nieuwe informatie met suggesties bij het invullen van deze velden. Ze  ‘kijken mee’ naar de activiteiten in het werkproces, de rol van de gebruiker en deels ook naar de meest voorkomende woorden in het object. Een volledig automatische analyse en registratie komen ook steeds vaker voor. Informatie wordt zo vollediger en met een bedrijfstaxonomie geregistreerd. Soortgelijke informatie wordt gegroepeerd en veiliggesteld overeenkomstig de bewaartermijn en wet- en regelgeving. Dit vermindert werk en willekeur van de eindgebruiker en verbetert de terugvindbaarheid van een object: het bonnetje, het bezwaarschrift of de beleidsnota.

Oude bestanden

Maar wat te doen met de reeds aanwezige, oude en vaak slecht geregistreerde files en bestanden in een organisatie? Een beetje organisatie heeft er miljoenen van op diverse Fileshare-locaties staan. Oudere beheeroplossingen bieden slechts een digitale weergave van de oorspronkelijk fysieke file/folder-opslagstructuur in plaats van een metadatagebaseerde ontsluiting. Ook in modernere document- of contentmanagementoplossingen is de inhoud en zo de bedrijfswaarde of risico van de opgeslagen objecten, niet tot nauwelijks te bepalen. Dit door niet of foutief ingevulde velden, verschillen in terminologie of het gebruik van de velden voor andere informatie.

Alleen afgaan op hoe het oude object is ontsloten, maakt de integratie in één bedrijfsinformatiehuishouding risicovol. Enerzijds vanwege de zoekresultaat-overload door de presentatie van alle mogelijke objecten en anderzijds omdat de werkelijke inhoud en waarde daarvan niet bekend zijn. Dat laatste geeft een reële kans op het niet tonen van wel aanwezige en relevante informatie. Als een cruciale bedrijfs- of klantbeslissing op onvolledige informatie wordt genomen, kunnen de gevolgen, bij nadere analyse, ingrijpend zijn.

Waardevol

Weten wat de werkelijke inhoud en waarde van de bestaande objecten en bestanden voor de bedrijfsvoering zijn, is meer dan alleen een technisch linkje leggen naar de objecten op basis van de leesbare kenmerken. Een goede inhoudelijke analyse van wat er echt in het object staat en een daarop gebaseerde classificatie en ontsluiting maken van een oud bestand een waardevol informatie-object.

Reactie toevoegen