Overslaan en naar de inhoud gaan

Datazee groeit naar 281 exabytes

De onderzoekers van IDC hebben een nieuwe term bedacht. Ze hebben het niet alleen over de digitale voetafdruk van iemand, maar ook over diens digitale schaduw. De digitale voetafdruk bestaat uit alle gegevens die een mens genereert, dat wil zeggen die hij zelf maakt door het schieten van een digitale foto of videofilm, danwel opwekt door te telefoneren via VoIP of Skype. En dan is er nog de digitale schaduw, bestaande uit alle gegevens die over een bepaalde persoon worden vervaardigd.
Business
Shutterstock
Shutterstock

Dat kunnen beelden van bewakingscamera’s zijn, om maar wat te noemen.
Volgens IDC was 2007 een cruciaal jaar, want ergens in die periode is de gemiddelde digitale schaduw van de aardbewoners groter geworden dan hun gemiddelde digitale voetafdruk. De onderzoekers hadden eerder geen rekening gehouden met dit fenomeen, vandaar dat hun schatting voor de omvang van de jaarlijks gegenereerde datahoeveelheid zo’n 10 procent te laag was.
In 2007 hebben de wereldbewoners gezamenlijk 281 exabytes geproduceerd. Exa is het voorvoegsel dat 10 tot de macht 18 voorstelt; 1 exabyte is dus 1 miljard gigabytes. “Het grootste deel van die gegevens wordt opgewekt door particulieren, maar daar moet je je niet blind op staren”, zegt John F. Gantz, Program Director bij IDC en verantwoordelijk voor het onderzoek. “Want hoewel het produceren van de data grotendeels een zaak van individuen is, is het beheer van de data voor een zeer groot gedeelte de verantwoordelijkheid van bedrijven. We hebben becijferd dat 85 procent van alle gegevens beheerd wordt door een zakelijke entiteit, bijvoorbeeld een serviceprovider of een exploitant van een datawarehouse”, aldus Gantz.
Het jaar 2007 was in nog een opzicht bijzonder: voor het eerst was de opgewekte hoeveelheid informatie groter dan de totale opslagcapaciteit voor digitale gegevens die de wereld rijk is. “Dat is nog niet zo erg, omdat niet alle gegevens worden opgeslagen, maar de trend is wel ingezet. In 2010 zal de helft van de opgewekte datazee niet meer opgeslagen kunnen worden”, stelt Gantz. Niet alleen de hoeveelheid gegenereerde gigabytes neemt toe, ook het aantal opslagplaatsen stijgt rap. Gantz: “Data worden op steeds meer plaatsen opgeslagen. We hebben natuurlijk harde schijven, maar ook dvd’s, geheugensticks en zelfs RFID-chips. Nu is de informatiehoeveelheid op die laatste drager niet zo bijster groot – met 128 bits ben je er eigenlijk wel – alleen zijn het er gruwelijk veel. Juist door de zeer grote aantallen is de kans groot dat een beheerprobleem gaat ontstaan.”
De groei blijkt zichzelf in stand te houden, mede door ontwikkelingen op technologisch gebied. De prijs van opslagsystemen blijft maar dalen, terwijl de capaciteiten van de disks blijven toenemen. Ook maakt de industrie bijvoorbeeld sensoren met steeds meer pixels. Een mobiele telefoon met een camera van 3 megapixels is allang geen bijzonderheid meer. Die camera’s leiden tot een ware toevloed van digitale foto’s. “En die”, zegt Gantz, “moeten allemaal ergens opgeslagen worden.”
Het is een goede gelegenheid om de beschikbare opslagcapaciteit eens goed onder de loep te nemen en te kijken of er wellicht ongebruikte ruimte gewonnen kan worden. De meeste diskdrives staan maar voor zo’n 70 procent vol met gegevens en door technieken als virtualisatie kan die ruimte weer beschikbaar komen. De bepalende factor is goede software, die ervoor zorgt dat de diskdrives in een ‘pool’ worden opgenomen en die ook zorgt voor het goed opbergen van de informatie.
Gantz: “De systeembeheerders zullen van de noodzaak tot virtualisatie doordrongen moeten worden. Waar er nog rigide gedachten heersen over het verdelen van de beschikbare opslagruimte, zullen die op de schop moeten. Er is geen ruimte meer voor. Die luxe hebben we aanstonds niet meer.”
Over vijf jaar zullen twee miljard mensen toegang hebben tot internet en zal het aantal mobiele telefoons boven de drie miljard uitkomen. Gantz: “Als je niet oppast, wordt het een sciencefictionboek, met een gedigitaliseerde maatschappij waar iedereen met iedereen verbonden is en men elkaar doodgooit met informatie. Voor veel mensen is dat beangstigend, Maar het goede nieuws is dat wij met z’n allen erbij staan terwijl het toekomstscenario zich ontwikkelt. Met een goede aanpak kan veel ellende worden voorkomen. Bedrijven zullen een hecht raamwerk moeten maken voor de opwekking, uitwisseling en opslag van informatie. Daarin mag geen plaats zijn voor wildgroei. Bedrijven ontwikkelen dat raamwerk eerst in eigen huis en hevelen het daarna over naar hun zakelijk partners. Dat creëert een sneeuwbaleffect, met hopelijk positieve gevolgen.”
De bedrijven moeten goed om zich heen kijken naar nieuwe technieken die worden ontwikkeld om de datastromen in de hand te houden. Slimme hardware (veroorzaakt door geavanceerde software) kan de gegevensberg op een juiste manier opslaan. Ook kan er zo worden gewaakt voor het te vaak opslaan van dezelfde informatie. “Deduplicatie wordt een van de belangrijkste trends van de komende tijd. Informatie mag best een aantal malen worden opgeslagen, maar er zijn grenzen. Elke onderneming zal voor zichzelf moeten bepalen waar die grenzen liggen”, meent Gantz.
/r.keijzer@sdu.nl

Lees dit PRO artikel gratis

Maak een gratis account aan en geniet van alle voordelen:

  • Toegang tot 3 PRO artikelen per maand
  • Inclusief CTO interviews, podcasts, digitale specials en whitepapers
  • Blijf up-to-date over de laatste ontwikkelingen in en rond tech

Bevestig jouw e-mailadres

We hebben de bevestigingsmail naar %email% gestuurd.

Geen bevestigingsmail ontvangen? Controleer je spam folder. Niet in de spam, klik dan hier om een account aan te maken.

Er is iets mis gegaan

Helaas konden we op dit moment geen account voor je aanmaken. Probeer het later nog eens.

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in