Definition

Was ist Ceph?

| Autor / Redakteur: Thomas Joos / Rainer Graefen

(Bild: Red Hat)

Bei Ceph handelt es sich um ein sehr skalierbares Opensource-Speichersystem auf Basis von Linux. Die Daten werden auf den angebundenen Servern verteilt. Dazu befinden sich in den Servern physische Datenträger, die durch Ceph zu einem virtuellen Speichersystem zusammengefasst werden.

Wenn Unternehmen Ceph einsetzen, werden verschiedene physische Festplatten der Ceph-Server zu einem gemeinsamen Software Defined Storage zusammengefasst. Die Basis eines Ceph-Clusters stellen also diese Server dar, auch Object Storage Devices (OSD) genannt.

Die OSDs stellen zusammen den Ceph-Cluster dar. Die Clients können mit verschiedenen Netzwerkprotokollen eine Verbindung zu dem Datenspeicher aufbauen. Dazu gehört auch iSCSI. Ceph ist vorzugsweise ein Objektspeicher, der aber auch für Block und File Storage nutzbar ist. Die einzelnen Daten werden in Objekte aufgeteilt und schließlich auf den Platten der einzelnen OSDs verteilt. Das stellt die Hochverfügbarkeit der Umgebung sicher.

Rad Hat hat den Hersteller von Ceph übernommen. Durch die Skalierbarkeit wird Ceph inzwischen häufig in virtuellen Umgebungen auf Basis von KVM oder in Container-Netzwerken eingesetzt.

Da die Netzwerkverbindungen in einem Ceph-System eine fundamentale Rolle einnehmen, sollten die Server untereinander mit 10 Gbit/s verbunden werden. So ist sichergestellt, dass der Datenverkehr zwischen den Ceph-Servern mit ausreichender Bandbreite und geringen Latenzen stattfinden kann.

Schwerpunkt in großen Rechenzentren

Ceph spielt seine Vorteile vor allem in größeren Rechenzentren aus, in denen Dutzende bis Hunderte Server eingesetzt werden und ihre physischen Festplatten zu einem Ceph-Cluster verbinden. Zwar lässt sich Ceph bereits ab drei Knoten betreiben, wird aber erst dann sinnvoll eingesetzt, wenn größere Datenmengen gespeichert werden müssen.

Setzen Unternehmen bei Ceph auf den Red-Hat-Konkurrenten Suse, müssen mindestens vier Knoten eingesetzt werden. So will Suse sicherstellen, dass der Cluster den Ausfall eines Knotens problemlos übersteht. Die Knoten sollten außerdem nicht nur über genügend Festplatten verfügen, sondern auch leistungsstarke CPUs und genügend Arbeitsspeicher. Das zahlt sich bei Schreibvorgängen aus.

Bezüglich Datenträger unterstützt Ceph neben herkömmlichen Festplatten auch SSDs und beherrscht ebenfalls schon das noch junge NVMe-Protokoll. Auf OSDs sollte möglichst für alle Bereiche auf SSD-Hardware gesetzt werden, um die Leistung zu verbessern.

Ceph ist enorm skalierbar und kann derzeit bis in dreistellige Petabyte-Bereiche genutzt werden. Solche Größenordnungen lassen sich einfach durch das Hinzufügen weiterer Serverknoten in den Cluster erreichen. Dies gilt ebenfalls für Kapazitätserweiterungen mittels zusätzlicher Festplatten, die selbständig durch das Ceph-System eingebunden werden.

Hochverfügbarkeit durch Software-defined Storage

Ceph benötigt weder spezielle Hardware noch Controller, um zu funktionieren. Die Daten werden hochverfügbar auf die physischen Datenträger der angebundenen Server verteilt. Dabei können Administratoren festlegen mit welcher Redundanz gearbeitet wird.

Fallen einzelne Server in einem Ceph-Cluster aus, sind die Daten nicht verloren, und das Speichersystem steht weiterhin zur Verfügung. Je nach Konfiguration können sogar mehrere Server auf einmal ausfallen ohne den Cluster zu beeinträchtigen.

Windows- und Cloud-Anbindung mit Ceph

Die Anbindung an Linux ist ein Schwerpunkt in Ceph. Windows-Rechner können Ceph-Speicher zwar benfalls nutzen, allerdings mit Umwegen. Hier bietet sich zum Beispiel die Integration eines Ceph-Gateways an oder die Integration von Suse Enterprise Storage. Über Ceph-Gateways wird eine RESTful-Schnittstelle zur Verfügung gestellt, die eine Kompatibilität mit OpenStack ermöglicht, oder gleich die Verbindung mit Amazon S3 bietet.

Windows-Clients bindet man vorzugsweise per iSCSI-Schnisttelle an. Dadurch können alle Betriebssysteme mit Ceph kommunizieren, die auch iSCSI oder SANs unterstützen. Der in Windows-Betriebssystemen integrierte iSCSI-Initiator kann so ohne zusätzliche Treiber-Updates mit dem Ceph-Speicher verbunden werden.

Nachdem ein Ceph-Speicher aufgebaut ist, in dem die verschiedenen Knoten im Cluster zusammengefasst wurden, können Client-Rechner über verschiedene Wege auf Ceph zugreifen. Häufig wird auf „Reliable Autonomic Distributed Object Store“ (RADOS) gesetzt, oder auf iSCSI.

Für Ceph steht auch das Dateisystem CephFS/XFS zur Verfügung. Für den Zugriff wird ein kompatibler Ceph-Client benötigt. Mit RADOS organisiert Ceph den Zugriff auf die einzelnen Daten, die als Objekte auf den OSDs abgelegt sind.

Kommentare werden geladen....

Was meinen Sie zu diesem Thema?

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 45095549 / Definitionen)