Management

Datamanagement
boos op computer

Bonnetje zoek? Geen wonder.

Documenten vormen snelgroeiend governance-probleem

© CC0 (pixabay) ijmaki
19 april 2017

Documenten vormen snelgroeiend governance-probleem

Over ruim een jaar, op 25 mei 2018, wordt de nieuwe Algemene Verordening Gegevensbescherming (AVG) van kracht. Organisaties zijn in dat kader verplicht een functionaris gegevensbescherming aan te stellen. Maar hoe kan zo'n functionaris z'n verantwoordelijkheid nemen, als hij van een substantieel deel van de data niet weet dat ze er zijn, waar ze zijn, waar ze over gaan of waarom ze er zijn?

Wat is erger; een bonnetje dat zoek is, of een bonnetje dat gevonden wordt? Vaak weten we het niet. En wat doet het ertoe als we toch niet beschikken over de technische middelen om het gezochte bestand te managen? Dat is het parket waarvoor grote organisaties zich gesteld zien. Ze hebben steeds meer moeite om grip te houden op hun digitale documenten. Wat is de laatste versie? Hoe voorkomen we dat er kopieën circuleren? Betekent 'niet te vinden' ook 'bestaat niet'?

Niet alleen vanwege de compliance

Ruwweg 80 procent van de data die bedrijven en overheidsdiensten bewaren is ongestructureerd. Dat betekent dat ze qua, inhoud en bestandsstructuur niet op één lijn zijn te brengen. Daar blijft het niet bij. Meestal zijn ook zaken als auteur, creatiedatum, eigenaar, versie-status, follow-up en gewenste bewaartermijn niet vastgelegd, ervaart datamanager Jeroen Tegelaar van KPMG. Dat is niet alleen van belang vanwege compliance, maar ook vanwege productiviteit. "Mensen krijgen aantoonbaar meer rust in hun werk en maken daardoor minder fouten als ze hun documenten sneller terugvinden in de juiste versie."

In de gemiddelde organisatie verdubbelt het aantal documenten elke twee jaar. Als gevolg van fusies en overnames zitten die documenten vaak in verschillende en veelal ook technisch verouderde digitale omgevingen, die onderling niet of slechts moeizaam samenwerken. Door aanleg van persoonlijke archieven, op netwerkschijven en op cloudplatformen als Google Docs of Dropbox, maken eigengereide eindgebruikers het er nog eens erger op. Vaak in reactie op slecht voorbereide pogingen tot centralisatie van het documentbeheer.

Niet weten wat je hebt, waar je het hebt en waarom je het hebt, is – ook los van de AVG – uit governance-oogpunt een tijdbom. Toch lopen de meeste informatiemanagers er nog met een grote boog omheen, stelt Reinoud Kaasschieter van Capgemini. "80 procent van de data is ongestructureerd en meestal ook niet centraal beheerd. Alleen al de hoeveelheid bewaarde e-mails is in de meeste organisaties immens en voor de verantwoordelijken inhoudelijk doorgaans een grote onbekende. Het is een probleem dat jaar over jaar groeit, maar niet zelden is het enige antwoord van de IT-staf het bijplaatsen van harde schijven."

Theoretisch betere oplossingen worden aangeboden onder labels als Enterprise File Share & Sync (EFSS) Web Content Management (CMS), Enterprise Content Management (ECM). Naast opslag en sharing bieden dergelijke 'omgevingen' of 'platformen' doorgaans ook workflow, synchronisatie, versiebeheer, beveiliging, access control en bewaking van bewaartermijnen en vernietigingsplicht inhoudt. Bedrijfsapplicaties die gebruikmaken van ECM-technologie zijn onder meer office suites, case management en tal van branche- en bedrijfsspecifieke applicaties, zoals Corsa (populair bij gemeenten) of Decos (in veel ziekenhuizen).

Heterogeen

Wereldwijd zijn er minstens 200 aanbieders van ECM- en EFSS-technologie. Bekende namen zijn Alfresco, OpenText (ECM, Documentum), IBM (FileNet), Microsoft (Sharepoint), Adobe en G360. Kleinere bedrijven zoeken het doorgaans meer in de aanpalende sfeer van Enterprise File Sharing & Sync (EFSS) via clouddiensten, variërend van Office365, Google Docs en Evernote tot Dropbox, Box of SpiderOak. Maar in de praktijk zijn deze 'oplossingen' vaak zelf onderdeel van het probleem, want meer impliceert hier allerminst beter. Vooral grote bedrijven – met 1000 of meer kantoorwerkplekken – maken gebruik van ECM, onder meer in sectoren als financiële dienstverlening, overheid, zorg, nuts, hightech. Vaak hebben ze een heterogeen ECM-landschap waarin, historisch gegroeid, meerdere platformen naast elkaar in gebruik zijn maar nauwelijks samenwerken. Dat leveranciers van documentbeheerplatformen, van Acropolis tot Xblox, zich niet bijzonder inspannen om hun gebruikers uit de penarie te helpen mag weinig verwondering wekken. De ontwikkeling van oplossingen in kennisintensief en dus kostbaar, wat de uiteraard vraag oproept 'wie de veerman zal betalen'. De uitwisselingsstandaard CMIS (Content Management Interoperability Services) is al zeker zo'n jaar of zes (versie 1.1) beschikbaar, maar is tot dusverre slechts schoorvoetend en doorgaans alleen op deelaspecten omarmd. Het doet vermoeden dat een aantal leveranciers een technology lock-in stiekem nog wel als een acceptabele vorm van klantenbinding beschouwt. Gebruikersorganisaties die hun documentbeheer willen centraliseren zullen dat in de meeste gevallen dan ook zelf in het vat moeten zien te gieten. Daarbij zijn in grote lijnen 3 strategieën te overwegen:

 AG tekstballon-1Er mee leren leven

Een silver bullit voor het documentbeheer bestaat volgens Kaasschieter niet. In zijn rol van solution architect komt hij met zekere regelmaat over de vloer bij overheidsinstellingen die een jaar of wat geleden besloten om 'het allemaal te centraliseren'. Maar vrijwel onveranderlijk ontdekken deze organisaties dat dat een onmenselijke opgave is. Het is te complex, er zijn te veel applicaties en bovenal; de eindgebruikers werken helemaal niet mee. Die vinden centraal beheer – met richtlijnen over wat en hoe, met beveiliging en toegangsrechten – gewoon veel te lastig. Daarom houden ze fanatiek vast aan 'hun' mappen op netwerkschijven. Dreigen de stekker daaruit te trekken, resulteert hooguit in uitwijken naar nog veel ongrijpbaarder oplossingen op basis van Dropbox of Google Drive.

Gegeven deze patstelling kan het volgens Kaasschieter wel degelijk een rationele keuze zijn om verschillende onderling moeizaam verenigbare documentbeheersystemen naast elkaar te handhaven. Legacy-informatie kan volgens Kaasschieter zo nodig worden gemanaged door gevoelige stuff via e-discoverry te identificeren en op case-by-case-basis naar het nieuwe regime over te brengen.

Waar de proces-flow dit nodig maakt, worden gesloten omgevingen bilateraal ontsloten via houtje-touwtjekoppelingen. CTO Ernst van Rheenen van Xillio maakt bij deze aanpak wel de kanttekening dat er al gauw omgevingen ontstaan die slecht evolueerbaar zijn; aanpassingen zijn onevenredig kostbaar, riskant en tijdrovend. Terwijl de use cases voor aanpassingen zich – onder invloed van mobility, cloud en consumerization – in rappe opeenvolging aandienen.

Organisaties die deze weg kiezen moeten rekenen op hoge beheerlasten.

 AG tekstballon-2Migratie

Klassieke uitweg uit het ECM- & EFSS-woud. Content wordt overgebracht van uit te faseren repositories naar één uitverkoren ECM-omgeving. Dat is meestal de omgeving die de vanuit de organisatie gewenste functionaliteit het minst onvolledig afdekt.

Gezien de alsmaar voortgaande technologische ontwikkeling is migratie in de praktijk vaak dweilen met de kraan open. Het sinds enkele maanden aan de MKB-beurs NPEX genoteerde Xillio heeft in het verleden veel documentmigraties bij grote bedrijven geregisseerd. Onder meer bij Philips, de Nationale Politie, Rijksoverheid.nl, Rijksportaal en ABN-AMRO. Maar CEO-oprichter Rikkert Engels steekt niet onder stoelen of banken dat dergelijke projecten, ofschoon ze technische zin goed te doen zijn, in organisatorisch opzicht nogal eens teleurstellen. "Vaak draait zo'n migratie uit op een meerjarig project dat al voor de finale oplevering achterloopt bij de dan actuele inzichten en technische mogelijkheden."

Zaken die documentmigraties complex maken zijn volgens Van Rheenen onder meer de vertaling van metadata (vastlegging van status en geschiedenis van de documenten) en het toevoegen van specifieke door eindgebruikers gevraagde functionaliteit waar de gekozen doelomgeving niet standaard in voorziet.

Verder stelt migratie eisen aan de datakwaliteit (met name wat betreft metadata). Als daar niet volledig aan kan worden voldaan, blijft het in de praktijk vaak bij een deeloplossing.

Vooral bij veel uit te faseren bron-platformen en kunnen de projectkosten van migratie fors zijn.

 AG tekstballon-3Integratie

Een meer structurele en uit oogpunt van data-architectuur elegantere oplossing voor heterogene documentlandschappen is implementatie van middleware die met alle (nou ja, bijna dan) documentbeheeromgevingen lezen en schrijven kan. Tegelaar ziet middleware vooral als een oplossing waar grote volumes in het spel zijn. "Zo'n tussenlaag of enterprise service bus laat de bestaande opslag- en indexeringsoplossingen (repositories) in stand en wisselt daar onder water documenten en metainformatie mee uit, ten gunste van één eenduidige overall gebruiks- en beheerinterface."

Het evidente voordeel van integratie via middleware is dat het redelijk toekomstbestendig is, zolang de leverancier (en daar heeft deze uiteraard alle reden toe) de technische ontwikkelingen blijft volgen door innovatie bij de ECM-leveranciers te verdisconteren in de updates van de middleware.

Middleware-oplossingen die goed met documenten uit de voeten kunnen zijn onder meer: BizTalk360, Tibco, Mulesoft, Webmethods en sinds kort ook Xillio. Een ander belangrijk voordeel is dat laag kwalitatieve ongestructureerde data ook kan worden gearchiveerd. "Zo goed als mogelijk indexeren en 'as is' opgeslagen houden", raadt Tegelaar aan. 

Beargumenteerd regime

Aan de technologie hoeft het dus niet te liggen. Toch heeft Tegelaar een belangrijke waarschuwing voor degenen die denken dat een oplossing daarmee binnen handbereik ligt. "Een oplossing die werkt vergt meer dan techniek alleen. Het wezenlijke probleem is namelijk niet de gefragmenteerde IT, maar het gebrek aan structuur in de creatie en omgang met documenten." Hij raadt klanten om die reden vrijwel altijd aan eerst een data-architectuur ontwikkelen, die het mogelijk maakt documenten te koppelen aan processen en organisatieonderdelen. "Door die in kaart te brengen, kun je processen aanwijzen en attributen benoemen. Op basis daarvan zijn relaties te leggen zijn tussen documenten, databases, organisatieonderdelen en activiteiten. Dat levert een 'kaart' op van je informatielandschap, waarop je vervolgens ook legacy-documenten een plek kunt geven. Alleen dan kan je de betreffende documenten aan een beargumenteerd regime onderwerpen, met een onderscheid tussen auteur en eigenaar, met inzicht in status en versie, met duidelijkheid over vertrouwelijkheid en privacy, met scherpte rond bewaarplicht en vernietigingsdatum. Als je dat niet hebt, wat wil je dan gaan doen met die moderne technische oplossingen voor documentmigratie of -integratie?" 

Ligt het antwoord van de ECM-leveranciers in Hilversum op de plank?

Openheid en interconnectiviteit belichamen in IT een trend waar uiteindelijk ook de leveranciers van ECM- en EFSS-technologie zich niet aan kunnen onttrekken, denkt Rikkert Engels van Xillio. Stuk bij beetje worden voorzieningen (zogeheten API's) geïntroduceerd om repositories te ontsluiten voor software van derden. Meestal heeft het weinig meer om de hakken dan faciliteren van point to point connexties. Maar sommige partijen gaan wel aanzienlijk verder. 

Misschien komt Microsoft met het in Office 365 via API's volledig benaderbaar maken van de voormalige Sharepoint-repository de eer toe de wake-upcall voor de concurrentie te hebben afgegeven. Zich veilig achtende grote namen als Documentum en Opentext doen nog net of ze het niet hebben gehoord. Maar de eerste kleinere – en kennelijk ook wendbaardere – spelers als SDL (meertalig webcontent management) en M-files (multi platform enterprise information management) pakten de uitdaging wel op. En ze gingen daarbij meteen een stap verder dan uitdager Microsoft, door niet alleen hun repository open te stellen voor opvragingen uit vreemde omgevingen, maar – andersom – ook bevraging van repositories van derden vanuit hun omgeving te faciliteren.

Xillio gaat ervan uit dat ook andere ECM- en EFSS-leveranciers, net als SDL en M-files, ervoor zullen kiezen technische ondersteuning van documentintegratie te bieden. Om die reden positioneert het Hilversumse bedrijf zijn middleware niet in de eerste plaats als oplossing voor gebruikersorganisaties. De gedroomde afnemers zijn ECM- en EFSS-leveranciers die het op OEM-basis in hun productaanbod willen opnemen.

Lees meer over
Zie ook Management op AG Connect Intelligence
Reactie toevoegen