Nieuwe aanpak voor data back-up
Maar als de totale hoeveelheid bedrijfsgegevens een veelvoud van die 2 TB is, is een nacht niet voldoende voor het maken van een totale back-up.
Een mogelijke oplossing voor dit probleem is, om de zekerheidskopie niet weg te schrijven naar tape, maar naar een tweede serie disks. Met die oplossing kan aanzienlijk meer data worden weggeschreven, tegen meerprijs uiteraard.
Kosten
Die meerprijs heeft uiteraard een bovengrens. Kostenoverwegingen spelen wel degelijk een rol bij de vraag of bedrijven wel of geen back-up maken, aldus Lex Beijk, ICT-manager van TNO: “We hebben een supercomputer waarbij een opdracht wel 2 terabyte aan data kan opleveren. Daar kunnen we een back-up van maken, maar het is goedkoper is om de Cray een nachtje te laten stampen. Dan hebben we de gegevens ook weer.”
Nieuwe techniek
Er komt een nieuwe aanpak voor het zekerstellen van de gegevens, een methode die bekend staat onder de naam Continuous Data Protection (CDP). Bij die aanpak wordt doorlopend een kopie van de gegevens weggeschreven naar een andere disk.
“Met CDP heb je niet meer te maken met een backup-window en ook het restore-window, de tijd die nodig is om de gegevens na een crash weer terug te zetten, verdwijnt”, zegt Jerry Rozeman, hoofd van de afdeling consultancy van Isit een bedrijf dat gespecialiseerd is in storage-oplossingen. Gegevens worden doorlopend weggeschreven, waarbij tevens een tijdcode wordt meegeschreven. Aan de hand daarvan kunnen gegevens razendsnel worden gereconstrueerd mocht dat nodig zijn. “We zien eigenlijk twee vormen”, zegt Rozeman, “de echte CDP die in realtime werkt en een CDP-achtige techniek die werkt met opslagintervallen. Dan wordt om de zoveel tijd een kopie weggeschreven. ”
Hoeveel data beheert een organisatie
ziekenhuis (klein) 2 TB
ziekenhuis (middelgroot) 7-8 TB
ziekenhuis (groot) 200 TB (VUmc)
middelgrote bank 1,8 TB (Friesland Bank)
grote bank 10 TB (vestiging Deutsche Bank)
videowebsite 100+ TB (TMF)
verzekeraar 9 TB (Geové)
Toename te beheren data
Over het algemeen geldt voor de hoeveelheid data van een bedrijf een groei van 50 tot zelfs 100 procent per jaar.
Kosten storage
De kosten voor opslag op disk liggen tussen de 2 en 5 euro per gigabyte, afhankelijk van de snelheid van de schijfsystemen. De kosten per terabyte liggen dus een factor 1000 hoger. Het maken van bakc-up’s gaat het best als de gegevens gestructureerd zijn, zodat ze op een uniforme wijze gekopieerd kunnen worden. In de praktijk is dat echter vaak niet het geval. Onderzoek wijst uit dat ongeveer 75 procent van alle gegevens van een bedrijf ongestructureerd is. Circa 20 procent is gestructureerd, dat wil zeggen opgenomen in een databasestructuur, terwijl de rest wordt geclassificeerd als semi-gestructureerd. Dan gaat het bijvoorbeeld om e-mails.
Het aanbrengen van meer structuur stond lang hoog op het lijstje van de ‘geggevensbeheerder, maar tegenwoordig is ook dat aan het verdwijnen. De zoekmethoden in ICT-land zijn dermate geavanceerd geworden, dat het vanuit dat oogpunt niet meer belangrijk is om structuur aan te brengen. De algoritmen kunnen net zo goed in ongestructureerde als in gestructureerde gegevens zoeken. Het gevolg is, dat de hoeveelheid ongestructureerde gegevens gewoon kan blijven doorgroeien, waardoor het maken van back-up’s meer tijd zal blijven vergen.Aanbieders
- EMC heeft de techniek gerealiseerd in de vorm van Recoverpoint, toegepaste hardware die als onderdeel van het SAN werkt. Het apparaat kan worden gebruikt in een heterogene omgeving.
- NetApp zet zijn kaarten voorlopig op een netwerk (IP) aanpak, met Snapvault en OSSV. Beide producten zijn CDP-achtig en kunnen ook in een multiplatform-omgeving worden gebruikt.
- Veritas levert beide technieken. Een CDP-achtige oplossing in de vorm van het pakket Panther, dat alleen bruikbaar is in en Windows-omgeving. Voor true-CDP wordt hardware geleverd in de vorm van Revivio, een module met een zeer hoge verwerkingskracht.
- CommVault levert een module die de naam CDR draagt en die embedded in backup-software wordt gebruikt. De programmatuur is CDP-achtig en werkt alleen in een Microsoft Windows-omgeving.