Datazee groeit naar 281 exabytes
Dat kunnen beelden van bewakingscamera’s zijn, om maar wat te noemen.
Volgens IDC was 2007 een cruciaal jaar, want ergens in die periode is de gemiddelde digitale schaduw van de aardbewoners groter geworden dan hun gemiddelde digitale voetafdruk. De onderzoekers hadden eerder geen rekening gehouden met dit fenomeen, vandaar dat hun schatting voor de omvang van de jaarlijks gegenereerde datahoeveelheid zo’n 10 procent te laag was.
In 2007 hebben de wereldbewoners gezamenlijk 281 exabytes geproduceerd. Exa is het voorvoegsel dat 10 tot de macht 18 voorstelt; 1 exabyte is dus 1 miljard gigabytes. “Het grootste deel van die gegevens wordt opgewekt door particulieren, maar daar moet je je niet blind op staren”, zegt John F. Gantz, Program Director bij IDC en verantwoordelijk voor het onderzoek. “Want hoewel het produceren van de data grotendeels een zaak van individuen is, is het beheer van de data voor een zeer groot gedeelte de verantwoordelijkheid van bedrijven. We hebben becijferd dat 85 procent van alle gegevens beheerd wordt door een zakelijke entiteit, bijvoorbeeld een serviceprovider of een exploitant van een datawarehouse”, aldus Gantz.
Het jaar 2007 was in nog een opzicht bijzonder: voor het eerst was de opgewekte hoeveelheid informatie groter dan de totale opslagcapaciteit voor digitale gegevens die de wereld rijk is. “Dat is nog niet zo erg, omdat niet alle gegevens worden opgeslagen, maar de trend is wel ingezet. In 2010 zal de helft van de opgewekte datazee niet meer opgeslagen kunnen worden”, stelt Gantz. Niet alleen de hoeveelheid gegenereerde gigabytes neemt toe, ook het aantal opslagplaatsen stijgt rap. Gantz: “Data worden op steeds meer plaatsen opgeslagen. We hebben natuurlijk harde schijven, maar ook dvd’s, geheugensticks en zelfs RFID-chips. Nu is de informatiehoeveelheid op die laatste drager niet zo bijster groot – met 128 bits ben je er eigenlijk wel – alleen zijn het er gruwelijk veel. Juist door de zeer grote aantallen is de kans groot dat een beheerprobleem gaat ontstaan.”
De groei blijkt zichzelf in stand te houden, mede door ontwikkelingen op technologisch gebied. De prijs van opslagsystemen blijft maar dalen, terwijl de capaciteiten van de disks blijven toenemen. Ook maakt de industrie bijvoorbeeld sensoren met steeds meer pixels. Een mobiele telefoon met een camera van 3 megapixels is allang geen bijzonderheid meer. Die camera’s leiden tot een ware toevloed van digitale foto’s. “En die”, zegt Gantz, “moeten allemaal ergens opgeslagen worden.”
Het is een goede gelegenheid om de beschikbare opslagcapaciteit eens goed onder de loep te nemen en te kijken of er wellicht ongebruikte ruimte gewonnen kan worden. De meeste diskdrives staan maar voor zo’n 70 procent vol met gegevens en door technieken als virtualisatie kan die ruimte weer beschikbaar komen. De bepalende factor is goede software, die ervoor zorgt dat de diskdrives in een ‘pool’ worden opgenomen en die ook zorgt voor het goed opbergen van de informatie.
Gantz: “De systeembeheerders zullen van de noodzaak tot virtualisatie doordrongen moeten worden. Waar er nog rigide gedachten heersen over het verdelen van de beschikbare opslagruimte, zullen die op de schop moeten. Er is geen ruimte meer voor. Die luxe hebben we aanstonds niet meer.”
Over vijf jaar zullen twee miljard mensen toegang hebben tot internet en zal het aantal mobiele telefoons boven de drie miljard uitkomen. Gantz: “Als je niet oppast, wordt het een sciencefictionboek, met een gedigitaliseerde maatschappij waar iedereen met iedereen verbonden is en men elkaar doodgooit met informatie. Voor veel mensen is dat beangstigend, Maar het goede nieuws is dat wij met z’n allen erbij staan terwijl het toekomstscenario zich ontwikkelt. Met een goede aanpak kan veel ellende worden voorkomen. Bedrijven zullen een hecht raamwerk moeten maken voor de opwekking, uitwisseling en opslag van informatie. Daarin mag geen plaats zijn voor wildgroei. Bedrijven ontwikkelen dat raamwerk eerst in eigen huis en hevelen het daarna over naar hun zakelijk partners. Dat creëert een sneeuwbaleffect, met hopelijk positieve gevolgen.”
De bedrijven moeten goed om zich heen kijken naar nieuwe technieken die worden ontwikkeld om de datastromen in de hand te houden. Slimme hardware (veroorzaakt door geavanceerde software) kan de gegevensberg op een juiste manier opslaan. Ook kan er zo worden gewaakt voor het te vaak opslaan van dezelfde informatie. “Deduplicatie wordt een van de belangrijkste trends van de komende tijd. Informatie mag best een aantal malen worden opgeslagen, maar er zijn grenzen. Elke onderneming zal voor zichzelf moeten bepalen waar die grenzen liggen”, meent Gantz.
/r.keijzer@sdu.nl