Anbieter zum Thema
Durch den Umfang an gesammelten Daten kann es schnell ineffizient werden, sämtliche auf Flash-Medien zu speichern. Daten, die, wenn überhaupt, nur selten gelesen werden, sollten kostengünstiger auf magnetischen Medien gespeichert werden.
Andererseits bringen Daten, auf welche häufig zugegriffen wird, die IOPS-Fähigkeiten von Festplatten schnell an deren Leistungsgrenze, so dass Flash-Medien den besten Platz für die Speicherung dieser "Hot-Data" darstellen.
"Hot" ist auch wichtig
Eine sofortige Leistungsverbesserung für Anwendungen wird erreicht, wenn nur geringe Mengen der wichtigsten Daten auf Flash-Medien platziert werden. Als Faustregel gilt: Wenn es um Performance geht, kann ein klein wenig Flash sehr viel bewegen. Das ist der Schlüssel zu mehr Performance.
Das kleine Problem ist, welche Daten sind wichtig und es damit Wert, in den Cache kopiert zu werden? Wie trennt man die Spreu vom Weizen? Die rechte Seite der Abb. 1 listet einige der wichtigsten Komponenten auf, welche von aktuellen Caching-Anwendungen verwendet werden, um zu bestimmen, welche Daten in den Cache wandern sollten.
Wichtig ist das Erkennen von „Hot-Zones“ innerhalb der Daten, um die Positionen innerhalb der Volumes bestimmen zu können, auf welche häufig zugegriffen werden. Ebenfalls wichtig bei der Festlegung der Cache-Daten sind auch die kritischen Eigenschaften, wie die Befehlsgröße von Anwendungen und der sequentielle Umfang des Datenzugriffs.
Falsche Cache-Anfrage waren gestern
Dies alles wird zusammenfassend als Data-Access-DNA (Datenzugriffs-DNA) bezeichnet. Mit erweiterten Analyse-Methoden können diese Datenzugriffsmuster erkannt und diese Informationen als Teil der Auswahlkriterien für das Befüllen des Flash-Speichers verwendet werden.
Letztlich zeichnet sich ein gutes Auswahlkriterium dadurch aus, dass die im Flash-Speicher abgelegten Daten zu jedem Zeitpunkt die wichtigsten Daten für die Anwendung sind. Dies gewährleistet, dass die Daten bereits auf dem Flash-Speicher warten, wenn die Anwendung auf sie zugreifen muss. Ermitteln lässt sich das durch die Hit Ratio, also die Trefferquote.
Je höher der Prozentsatz der direkt vom Flash beantworbaren Anfragen, desto besser der DNA-Algorithmus. Wie Abb. 1 zeigt, sind sowohl Trefferquote als auch das IOPS-Rating wichtig für die erfolgreiche Flash-Einbindung, was in traditionellen Architekturen einen Konflikt auslöst.
“Catch 22” des optimalen Flash-Cachings
Um eine bessere Trefferquote zu erhalten, müssen Caching-Software-Module statistisch gesehen die Daten in Echtzeit verarbeiten, um vernünftig auswählen zu können, ob ein spezifisches Datenelement es wert ist, im Cachespeicher abgelegt zu werden.
Je mehr Analysen die Software in Echtzeit zu erledigen hat, desto höher ist die Überlagerung der Kommunikation zwischen Datenpfad und zum Flash-Speicher. Dies ist ein klassisches Datenpfad-Design-Dilemma:
- Wird zu viel Zeit damit verbracht, zu entscheiden, ob ein Datenelement zwischengespeichert werden sollte während es den Datenpfad durchläuft, verlangsamt sich der Zugriff auf den Flash-Speicher.
- Wird jedoch zu wenig Zeit darauf verwendet, werden für die Anwendung unnötige Daten im Cache gespeichert oder schlimmer noch, kritische Daten im Cache überschrieben.
(ID:39834410)