Bibliotheksservice-Zentrum Baden-Württemberg wurde durch das Speichersystem gebremst Landesweites Bibliothekssystem brauchte mehr I/Os

Redakteur: Rainer Graefen

Im Rahmen einer europaweiten Ausschreibung - unter Federführung der Universität Ulm - erhielt die Firma aStec im Jahr 2009 den Auftrag das „integrierte Bibliothekssystem“ (IBS|BW) auf Basis ihres Produktes aDIS|BMS zu realisieren. Die Herausforderung des Projekts bestand darin, 300.000 Nutzern eine schnelle Recherche zu ermöglichen.

Die Universitätsbibliothek der Uni Tübingen
Die Universitätsbibliothek der Uni Tübingen
( Uni Tübingen)

Ein Konsortium wissenschaftlicher Bibliotheken entschied sich zur Einführung eines einheitlichen Bibliothekssystems, welches alle medienbezogenen Dienste einer Bibliothek zusammenfasst.

Allen wissenschaftlichen Bibliotheken des Landes steht es frei, dem Konsortium beizutreten. Die Produktion wurde 2010 aufgenommen. Mittlerweile wird das System von über 60 Einrichtungen mit über 300.000 Studenten, Mitarbeitern und Gästen genutzt.

Bildergalerie

Betreuer des IBS|BW ist das Bibliotheksservice-Zentrum Baden-Württemberg (BSZ). Der Betrieb erfolgt am Zentrum für Datenverarbeitung der Eberhard Karls Universität Tübingen (ZDV), der den nutzenden Bibliotheken auf Basis von aDIS|BMS das lokale Bibliothekssystem in einem Cloud-Modell anbietet.

Mit dieser Cloudlösung wurde ein neuer Weg beschritten, der die Fähigkeiten der Beteiligten in idealer Weise zusammenführt. Als zukunftsweisend stellt sich das zentrale Betriebsmodell dar. Durch die Clusterlösung und zentrale Serverhaltung am ZDV sowie dem BSZ als zentralen Service-Verantwortlichen werden Synergien geschaffen und die Zusammenarbeit der Partnereinrichtungen langfristig gesichert.

Hochverfügbares Bibliothekssystem

Die produktiven Datenbanken belegen 1,6 TByte. Auf diese wird im Wesentlichen über Instanzen der relationalen Datenbank PostgreSQL zugegriffen. Tagsüber werden die I/O-Lasten durch Lesevorgänge dominiert, nachts finden in großem Umfang Backups, Datenbankupdates und andere schreibintensive Vorgänge statt.

Für den unterbrechungsfreien Betrieb ist es wesentlich, dass diese Arbeiten innerhalb vorgegebener, enger Zeitfenster beendet werden. Die Herausforderung liegt darin, dass sehr viele I/O-Operationen in kurzer Zeit abgearbeitet werden müssen.

Im Jahr 2009 erhielt das Berliner Unternehmen aStec den Zuschlag für den Aufbau des Bibliothekssystems aDIS|BMS mit einer landesweiten Lizenz, die für alle Hochschulen und die zwei Landesbibliotheken in Baden-Württemberg gilt.

Seit 2010 wurden nun sukzessive die alten Systeme der teilnehmenden Bibliotheken der Universitäten Freiburg, Hohenheim, Stuttgart, Tübingen und Ulm auf das neue System umgestellt. Darüber hinaus greifen mehr als 40 weitere Hochschulbibliotheken auf die Dienstleistungen zu, ebenso die badische und württembergische Landesbibliothek.

Planmäßiger Projektstart

Im Sommer 2013 konnte planmäßig die Migration abgeschlossen werden. Ziel des Projekts ist auch die langfristige Verbesserung der Kooperation zwischen den einzelnen Bibliotheken der verschiedenen Hochschulen im gesamten Bundesland. Davon versprechen sich alle beteiligten Parteien von Anfang an einen zentralen, wirtschaftlichen und ressourcenschonenden Betrieb und die Erhaltung der Zukunftsfähigkeit aller beteiligten Bibliotheken.

Mehr als 300.000 Nutzer greifen heute auf das Bibliothekssystem zu. Sie suchen nach Büchern und Medien, leihen diese aus, merken diese vor oder verlängern Leihfristen. Neben der einfachen Suchfunktion können Studenten auch über den Thesaurus recherchieren und erhalten dank der guten Performance sehr schnell ihre Treffer.

Die Bibliotheken selbst führen die Beschaffung und Katalogisierung in dem zentral betriebenen aDIS|BMS durch. Insgesamt muss das Zentrum für Datenverarbeitung der Universität Tübingen dafür zahlreiche Datenbanken mit mehr als 1,6 TByte Datenvolumen hosten, um die Anfragen aus allen Bibliotheken zu bedienen.

Storage-Lösung mit hohen IOPS für Datenbank-Hosting gesucht

Für dieses anspruchsvolle Projekt sind Dr. Werner Dilling, Leiter der Abteilung Systeme und Prof. Dr. Thomas Walter, Direktor des ZDV und Lehrstuhlinhaber Informationsdienste an der Universität Tübingen sowie René Lange als IT-Administrator für den Bereich Bibliotheksdienste ZDV verantwortlich.

Hierzu evaluierten sie zunächst das bisher eingesetzte Storage-System. Die Herausforderung bestand darin, kürzere Antwortzeiten bei großen Datenbankanwendungen zu erreichen. Der zunächst eingesetzte Speichercluster konnte die hohen Anforderungen an die zu leistenden IOPS jedoch nicht erfüllen. Vor der Beschaffung des jetzigen Speichersystems wurde dieses ausführlich auf seine Leistungsfähigkeit in diesem Anwendungsbereich getestet.

Maßgeblich seien dabei die Messwerte RandomWrite-IOPS und RandomRead-IOPS gewesen, so der Systemverantwortliche René Lange. Er fasst die weiteren Anforderungen zusammen: „Wir benötigten eine zuverlässige Lösung, die sowohl in der ersten Phase des Projekts als auch beim späteren Ausbau wirtschaftlich skalieren konnte und die hinreichend redundant aufgebaut ist.“

Lösung durch EUROstor

Bevor es zur Entscheidung für das Nimble System kam, wurden diverse Alternativen getestet. Diese Tests konnten aber die Anforderungen aus verschiedensten Gründen nicht erfüllen. Der erste Kontakt zu Nimble Storage kam 2013 über den langjährigen guten persönlichen Kontakt zwischen dem ZDV und der EUROstor, Partner von Nimble Storage, zustande.

„Die Zusammenarbeit besteht bereits seit mehr als zehn Jahren und ist seitdem auf einer vertrauensvollen Ebene weiter gewachsen. Als erster Impulsgeber konnten wir die Verantwortlichen bei der Universität Tübingen davon überzeugen, sich einmal mit den Mitarbeitern von Nimble Storage, Thilo Süßmuth und Pierre Flammer, an einen Tisch zu setzen.

Im weiteren Verlauf haben wir dann auch die Teststellung begleitet und umfangreiche Gespräche geführt“, fasst Franz Bochtler, Geschäftsführer bei EUROstor, zusammen. Im März 2013 erfolgte dann die vorab durchgesprochene Teststellung. Beim Austesten konnten vor allem die erreichten IOPS-Zahlen beeindrucken. „In den durchgeführten Tests konnten wir die von Nimble angesetzten Leistungswerte bestätigen.

Die durchschnittliche RandomRead-IOPS-Rate war bei 26.000 (ca. 1.100 pro Prozess). Der Spitzenwert lag bei 33.935 IOPS. Die RandomWrite-IOPS haben sich bei 15.000 eingependelt. Um diese Werte aus der Nimble Storage-Lösung heraus zu kitzeln, wurden zwei FIO-Jobs in zwei VMs parallel gestartet. Jeder FIO-Job lief mit zwölf Threads und einer IO-Tiefe von acht“, erklärt René Lange die Testergebnisse.

Scale-Out und Performance-Kontrolle mit Cloud-Portal

Relativ schnell nach der abgeschlossenen Teststellung entschieden sich alle Beteiligten für den Einsatz zweier identischer Nimble CS260g Speichersysteme mit insgesamt 72 TB Bruttokapazität für die beiden räumlich getrennten Standorte.

Darüber hinaus wurde von Anfang an zusätzlich die Nutzung des Analyse-Tools InfoSight von Nimble Storage beschlossen. Mit diesem erhält das IT-Team nun eine bessere Übersicht über die Performance, die Verfügbarkeit und über den nötigen Ausbau des Storage-Systems.

Alle fünf Minuten fragt der Service aktiv Sensordaten der Storage-Arrays ab und analysiert diese. Täglich kommen damit 30 Millionen Datensätze zusammen. Das macht auch aus dem Hosting des Bibliothekssystems aDIS|BMS ein eigenes Big Data Projekt.

Ausfallsicheres Bedienkonzept

Alle Daten werden von einem Data Science Team genauestens ausgewertet, um mit Hilfe von Mustererkennung und Korrelationsanalyse im Frühstadium befindliche Störfälle frühzeitig auszumachen und diese zu beheben, bevor sie zu Systemausfällen führen. Der kollaborative Gedanke kommt hier voll zum Tragen, denn die ausschließlich vollständig anonymisiert ausgewerteten Daten kommen allen Unternehmen und Organisationen zu Gute.

Tritt ein Vorfall auf, wird dieser durch das Team analysiert und nicht nur beim betroffenen System behoben, sondern die Informationen werden allen anderen Systeme ebenfalls zur Verfügung gestellt. Damit wird eine ständige Verbesserung der eingesetzten Nimble Storage-Lösungen gewährleistet und die Stabilität langfristig ausgebaut.

Dazu kommt ein ausfallsicheres Betriebskonzept, welches wesentlich von den Nimble Systemen getragen wird. „Dies ist bei dem Bibliotheksprojekt besonders wichtig, da mehrere tausend Studenten, Mitarbeiter und Gäste permanent auf die Services zugreifen und die Datenbanken im Falle einer Störung für niemanden mehr verfügbar wären.

Dies hätte eine Menge unangenehmer Fragen zur Folge, die das erfolgreiche Projekt infrage stellen könnten. Ein wichtiges Kriterium war deshalb die ständige Verfügbarkeit der Datenbank-Services ohne Performance-Einbußen“, hebt Dr. Werner Dilling hervor.

Wellness-Analyse für Storage

Neben dem Cloud-Portal hilft dem IT-Team des ZDV auch die den Kunden zur Verfügung stehende Variante des InfoSight-Portals, bei dem sie selbst Parameter eingeben können, um die Verfügbarkeit des Storage-Systems zu gewährleisten. Dies führt zu sogenannten Five-Nines, also einer 99,999 prozentigen Verfügbarkeit. „Wir können hier selbst definierte Auslöse- und Schwellwerte einstellen.

Ein automatisches Alarmierungssystem informiert uns dann, wenn diese unter- oder überschritten werden, damit wir selbst die nötigen Schritte einleiten können“, erklärt IT-Administrator René Lange. Darüber hinaus erleichtert der Kundenservice die Planung der weiteren Skalierung des Storage-Systems, da sich ebenso Benchmarks zur Erreichung von Kapazitäten festlegen lassen. Ein CPU-, Cache- oder Festplatten-Upgrade lässt sich dann leichter vorhersagen und wirtschaftlicher planen, als dies bislang der Fall war.

Fazit und Ausblick

Es stellte sich heraus, dass auch nach der Teststellung der Live-Betrieb ähnlich gute IOPS-Zahlen aufweisen konnte. Nimble Storage ist damit doppelt, teilweise sogar 12-mal so schnell im Live-Betrieb als die inzwischen abgelöste Vorgängerlösung.

„Je nach Benchmark-Tool (verwendet wurden bonnie, bonnie++ und fio) und Messwert war die Nimble Storage-Lösung stets um den Faktor zwei bis zwölf besser (RandomRead IOPS: Faktor 12) als die bisher eingesetzte Hardware und bietet damit eine sehr gute Basis um die aDIS-Software mit den daran gekoppelten PostgreSQL-Datenbanken (Datenbank-Größen zwischen 60 GB und 430 GB) performant zu hosten“, fasst René Lange die positiven technischen Eindrücke zusammen.

Seit September 2013 wurde der Live-Betrieb nun sukzessive auf die Nimble umgestellt; seit Ende April 2014 wird ausschließlich die Nimble Storage-Lösung für die Produktivsysteme genutzt. Hier stand wiederum EUROstor mit Franz Bochtler und seinem Team beratend zur Seite, damit der Erweiterungsprozess nahtlos durchgeführt werden konnte.

„Nach der Umstellung waren alle beteiligten IT-Teams sehr zufrieden, obwohl es bei der Integration der Datenbank kleinere Schwierigkeiten gab, die sich aber nach dem Austausch des Betriebssystems auflösten. „Wir sind auch sehr zufrieden mit dem Support von Nimble Storage, der uns pro-aktiv über Vorkommnisse informiert und auch im 24/7 Rhythmus zu unserer Verfügung steht“, fasst Dr. Werner Dilling zusammen.

(ID:43153322)