Overslaan en naar de inhoud gaan

Facebook-vinding vermindert slijtage aan SSD-cache

Facebook gebruikt duizenden SSD’s als cahegeheugen om te profiteren van de snelheid ervan. Maar alle gegevens in zijn rekencentra op SSD opslaan zou veel te duur zijn. En een meerlaagse oplossing creëren waarbij met behulp van beheersoftware goedkopere, langzamere opslagmethoden worden ingezet naarmate gegevens minder vaak worden opgevraagd, leek Facebook bij de volumes die het hanteert minder effectief.
Business
Shutterstock
Shutterstock

Vervangen SSD's nog steeds duur

In plaats daarvan koos het voor een opzet waarbij duizenden SSD’s ingezet worden als cache voor het tijdelijk opslaan van de meest opgevraagde gegevens. Voor het in goede banen leiden van de gegevensopslag in deze opzet ontwikkelde het een eigen applicatie: Flashcache.
Eén van de uitdagingen die het daarbij op zijn pad kreeg was, dat het gebruik van flitsgeheugens grenzen stelt aan het aantal malen dat een SSD beschreven kunnen worden. Zeker bij het intensieve verkeer dat de Facebook-systemen te verwerken krijgen, is dat een punt van aandacht. Want vervangen van een SSD is nog altijd relatief prijzig. Flashcache moet voor efficiënte tussenopslag van gegevens zorgen bij een evenwichtige verdeling van de werklast over de SSD’s.

Gegevensanalyse wijst de weg

Aan de hand van analyses van de daadwerkelijke belasting van de SSD’s hebben de Facebook-ontwikkelaars een nieuwe, verbeterde versie van Flashcache weten te ontwikkelen. Daarbij gaat het deels om een handiger verdeling van veel gelezen datasets over de beschikbare opslagcapaciteit. Maar de ontwikkelaars kwamen er ook achter dat het de prestaties ten goede komt wanneer gegevens in cache direct naar schijf worden geschreven na een gebruikershandeling, in plaats van te wachten totdat een bepaalde hoeveelheid data klaar stond om weggeschreven te worden.

Ook wisten ze een algoritme te ontwikkelen dat beter voorspelt welke data niet langer in cache hoeven te worden gehouden. Dat gebeurt nu niet langer op basis van het ‘last-in, first-out’-principe. In plaats daarvan kijkt het algoritme, welke datasets het langst niet zijn opgevraagd.

Duidelijk betere prestaties

De belasting van de SSD’s is door deze ingrepen evenwichtiger geworden. Waar tot nog toe 50 procent van de cache 80 procent van de schijfbewerkingen kreeg te verduren, is dat nu teruggebracht tot 50/50. De prestaties hebben daar niet onder geleden, integendeel. De zogeheten hit rate, het aantal verzoeken om data dat kan worden afgehandeld zonder dat de systemen terug hoeven te vallen op de harde schijven, steeg van 60 naar 80 procent. Facebooks meest bezochte systemen zagen met Flashcache 3.0 een reductie van 40 procent in leesbewerkingen en van 75 procent in schrijfbewerkingen.

Flashcache is ontworpen voor de databases MySQL en InnoDB, maar het is onder Linux algemeen toepasbaar. De software is beschikbaar als module bij Linux die geladen kan worden zonder aanpassingen te doen aan de Linux-kernel.

Gerelateerde artikelen
Gerelateerde artikelen

Reacties

Om een reactie achter te laten is een account vereist.

Inloggen Word abonnee

Bevestig jouw e-mailadres

We hebben de bevestigingsmail naar %email% gestuurd.

Geen bevestigingsmail ontvangen? Controleer je spam folder. Niet in de spam, klik dan hier om een account aan te maken.

Er is iets mis gegaan

Helaas konden we op dit moment geen account voor je aanmaken. Probeer het later nog eens.

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in

Maak een gratis account aan en geniet van alle voordelen:

Heb je al een account? Log in