Gigantische datastroom richting Amsterdam
In totaal zijn er 11 Tier-1 locaties, verspreid over de hele wereld. Tussen CERN (dat met Tier-0 wordt aangeduid) en deze centra ligt een uitgebreide infrastructuur die is gebouwd als een grid. Er wordt gewerkt met grote bandbreedtes. Een datatransport van 100 megabyte per seconde en dat uren achter elkaar zal geen zeldzaamheid zijn. Trompert: “Er wordt gewerkt in zogeheten bursts, forse datapakketten die in een aantal uren worden overgedragen.” Inmiddels heeft SARA de eerste meetgegevens al binnengekregen, op 10 september was de primeur. De gegevens worden opgeslagen op zowel tapes als disks. SARA heeft nu al ruim 600 terabyte diskcapaciteit. “Die hoeveelheid wordt verder uitgebreid. De huidige plannen hebben een uitloop tot 2011-2012 en tegen die tijd zullen we de beschikking hebben over 5 petabyte diskopslag en 8 petabyte op tape”, aldus Trompert.De genoemde 100 MB/sec heeft betrekking op de data die door Atlas worden geleverd. SARA krijgt echter ook nog uit andere bronnen gegevens, dus moet rekening worden gehouden met meer bandbreedte. Trompert: “Denk dan aan 150 MB/sec, zodat ook de data van de meetmodules LHCb en ALICE verwerkt kunnen worden. En om helemaal zeker te zijn, streven we naar een bandbreedte van 300 MB/sec, dan zijn we op alles voorbereid.”In Amsterdam wordt niet alleen gezorgd voor een veilige opslag van de meetgegevens, er is ook verwerkingscapaciteit beschikbaar. Daarvoor staat er een clustersysteem, dat is gevuld met 808 Intel-processors, en deze leveren een rekenkracht van 4 teraflops. De cluster is een product van Clustervision en Dell, op basis van dual- en quadcore Xeons. De gegevens die in Amsterdam aankomen, zijn afkomstig van de detector met de naam Atlas. Deze meet een aantal eigenschappen van de deeltjes in het systeem. Hun lading wordt bepaald, evenals de kinetische energie. Het zou weinig zin hebben om alle gegevens die Atlas registreert zomaar op te slaan en het grid in te sturen. In plaats daarvan wordt gebruikgemaakt van een triggersysteem, dat van de miljarden events die per seconde optreden de interessantste uitzoekt en daarvan alle gegevens verzamelt. De gegevens worden verzonden via de glasvezelinfrastructuur van het grid. “Die verbindingen zijn dubbel uitgevoerd en per kanaal hebben we een bandbreedte van 10 gigabit per seconde”, zegt Trompert.