Datengetrieben von der Edge bis zur KI Warum die Datenstrategie vor der Cloud-Strategie stehen muss

Autor / Redakteur: Daniel Metzger* / Dr. Jürgen Ehneß

Wer heute neue, datengetriebene Geschäftsmodelle entwickeln will, dem stellt sich unweigerlich die Frage nach der Cloud. Ähnlich wie eine Mannschaft und ihr Trainer aufeinander abgestimmt sein müssen, verhält es sich auch mit der Cloud und Daten – das eine geht nicht ohne das andere. Jedoch müssen Unternehmen vor der Wahl einer Cloud-Infrastruktur für sich beantworten, wie sie schnell auf ihre Daten zugreifen und diese auswerten können – egal, ob die Daten On-Premises, in der Private Cloud oder Public Cloud liegen. Damit dies gelingt, sind eine durchdachte Datenstrategie und der Enterprise-Data-Cloud-Ansatz entscheidend.

Firmen zum Thema

Die richtige Strategie ist grundlegend für den Erfolg.
Die richtige Strategie ist grundlegend für den Erfolg.
(Bild: gemeinfrei / Pixabay )

Unternehmen müssen sich im ersten Schritt überlegen, was sie mit ihren Daten machen wollen und inwieweit die Cloud ihnen dafür einen Mehrwert bietet. Dafür ist eine durchdachte Cloud-Strategie nötig. Zu beachten ist dabei, dass Cloud-Anbieter daran interessiert sind, neue Kunden und deren Daten aufzunehmen und zu halten. Problematisch wird es oftmals, wenn diese Daten aus der Cloud wieder zurück ins eigene Rechenzentrum geholt werden sollen.

Dieser Prozess gestaltet sich oftmals schwierig und ist mit hohen Kosten verbunden. Häufig erhalten Kunden lediglich Rohdaten zurück. Das ist insbesondere der Fall, wenn die Cloud im Sinne einer Platform-as-a-Service (PaaS) eingesetzt wurde. Eine Migration ist folglich mit großem Aufwand verbunden. Viele Unternehmen sehen sich dadurch in einem Vendor-Lock-in gefangen und haben ein Stück weit die Hoheit über ihre Daten verloren.

Zunächst die Datenfragen klären

Deshalb sollte vor der Cloud-Strategie eine Datenstrategie an erster Stelle stehen. Denn es sind die Daten, die heute den größten Wert eines Unternehmens und den Kern der Digitalisierung ausmachen. Sie bilden die Basis, um wertvolle Erkenntnisse zu gewinnen, Prozesse zu optimieren und neue Geschäftsmodelle zu entwickeln. Nicht umsonst gelten Daten als „digitales Gold“ unserer Zeit. Die Cloud kann Teil der zu schaffenden modernen Datenarchitektur sein, um diesen Schatz zu bergen.

Dazu muss die Infrastruktur unternehmensweit konsistente Datendienste und Analytics-Funktionen bereitstellen. So lassen sich Daten über die Grenzen des eigenen Rechenzentrums und über verschiedene Public-Cloud-Provider hinweg gemeinsam nutzen und einheitlich verwalten, unabhängig davon, wo sie sich befinden.

Eine Datenstrategie setzt voraus, dass ein Unternehmen weiß, wo in der Infrastruktur Daten in welchem Format vorliegen. Diese Dateninventur bildet den Auftakt, an den sich die Bewertung anschließt, wie geschäftskritisch die einzelnen Datensätze sind. Je nach ermittelter Kritikalität leiten sich Vorgaben ab, wie das Managen der Daten mit Blick auf Compliance und Sicherheit zu erfolgen hat. So lässt sich über rollenbasierte Zugangskonzepte regeln, wer worauf wie zugreifen darf, um Unbefugte und Cyberkriminelle außen vor zu lassen. Die Maßnahme schützt vor Datenverlusten, wofür aber hauptsächlich ein Disaster-Recovery-Konzept sorgt. Abgestimmt auf die Kritikalität der Daten ist dann gewährleistet, dass die geschäftskritischen Daten selbst bei einem IT-Ausfall hochverfügbar bleiben.

Auch im Hinblick auf die DSGVO gibt es einiges zu beachten: beispielsweise, welche Daten personenbezogen sind. Sie müssen klassifiziert werden, sodass ein Unternehmen jederzeit Auskunft darüber geben kann, welche Kundendaten es verarbeitet und wo sie gespeichert sind. Nur so ist man in der Lage, beispielsweise das Recht auf Vergessenwerden einzuhalten, also die Daten eines Kunden zu löschen, wenn dieser es fordert.

Enterprise Data Cloud als die logische Antwort

Interne und externe Daten sind das Fundament datengetriebener Geschäftsmodelle, weshalb das Datenmanagement ganz oben auf der Prioritätenliste jedes Unternehmens stehen sollte. Das ist den Firmen laut einer IDC-Studie bewusst. Die meisten der befragten Unternehmen haben allerdings noch Probleme bei der Integration aller Daten. Die Folge: Unternehmen kämpfen mit Inkonsistenzen und können ihre Daten nicht richtig analysieren. Aus diesen Gründen stocken Datenverarbeitungsströme, und die Speicherkosten steigen. Das mangelhafte Datenmanagement lässt sich jedoch mit einer Enterprise Data Cloud in Richtung Effizienz drehen, wofür es am Markt die nötigen Plattformen gibt.

Eine Enterprise Data Cloud bildet Software-technisch einen einfach zugänglichen, zentralisierten Datendrehpunkt ab. Dahinter steht folgendes Prinzip: Daten werden in verschiedenen Formaten von verschiedenen Systemen im ganzen Unternehmen bereits am Entstehungsort aufgenommen und in einem Big Data Cluster gespeichert. Dort erfolgen das Vorbereiten und das schnelle Bereitstellen für die weitere Verarbeitung, die über die Enterprise Data Cloud angestoßen wird.

Deren Hauptaufgabe besteht darin, ein konsistentes Datenmanagement für On-Premises-Systeme wie Private Clouds, aber auch Public Clouds zu etablieren. Auf diese Weise bleibt die Wahlfreiheit gewahrt, wo eine Firma ihre Daten hosten möchte. Außerdem kann sie ihre Datensätze leicht zwischen den unterschiedlichen Umgebungen verschieben, ohne an Sicherheit und Compliance denken zu müssen. Denn die Plattform setzt die aufgestellten Richtlinien einheitlich durch. Diese gelten ebenso für Partner, die man über APIs (Application Programming Interface) auf die Daten zugreifen lassen kann. Der API-Zugang ist ein auch ein Weg, um Daten – etwa über eine Gebühr – zu monetarisieren.

Storage-Management Teil 1 – Immer den Überblick behalten

Um einen umfassenden Überblick bieten zu können, behandelt dieses eBook unter anderem die folgenden Themen:
# Was ist Storage-Management?
# Nahe Verwandte des Speichermanagements
# Der Status quo der Storage-Systeme

eBook „Storage-Management“ downloaden

Den Datenfluss für As-a-Service-Modelle nutzen

An eine Enterprise Data Cloud richtet sich der Anspruch, die gut ausgearbeitete Datenstrategie konsequent umzusetzen. Diese Anforderung erfüllt eine Lösung wie die Cloudera Data Platform, indem sie einen durchgehenden Fluss vom Edge bis zur KI herstellt. Über das Dashboard einer solchen Plattform lässt sich so der gesamte Datenlebenszyklus (Collect, Enrich, Report, Serve und Predict) kontrollieren und managen. Zu welchen neuen Geschäftsmodellen das in der Praxis führen kann, zeigt ein Blick in die grüne Stromerzeugung.

Einige Windturbinenhersteller bieten Energieproduktion als Service an. Sie stellen Windkraftanlagen auf und garantieren Kunden damit einen bestimmten Energiegewinn innerhalb eines bestimmten Zeitraums. Die voraussichtlichen Megawattstunden werden anhand von Wetterdaten und anderen Metriken errechnet. Kunden kaufen die Windturbinen nicht, sondern zahlen nur für die Energie, die diese generieren. So wird Elektrizität zum As-a-Service-Modell. Unternehmen können ihre Energiebeschaffungsprozesse und die Energieeffizienz beziehungsweise deren Nutzung optimieren und bleiben gleichzeitig voll flexibel.

Ohne Enterprise Data Cloud steht eine Firma vor einer sehr anspruchsvollen Aufgabe, IT-seitig den gesamten Datenlebenszyklus vom Edge bis zur KI abzubilden. So müssen in der Regel Daten bereits am oder nahe dem Entstehungsort gefiltert, aggregiert oder in Echtzeit analysiert werden, um den Datenstrom (zum Big Data Cluster) zu reduzieren, beispielsweise wegen begrenzter Datenübertragungsbandbreite. Das Unterfangen fällt mit einer geeigneten Plattform leichter, da diese das Überwachen und Steuern des Geschehens am Edge gestattet. Für die Analyse wählen Unternehmen dann je nach Anwendungsfall die geeigneten Methoden aus, wozu ihre Enterprise Data Cloud die nötigen Tools vom einfachen statistischen Verfahren über Machine Learning bis hin zu Deep Learning und Künstlicher Intelligenz (KI) den Anwendern im Self-Service bereitstellt. Die KI-Werkzeuge stehen parat, um Prognosen zu produzieren, die abgeleitete Handlungsempfehlungen beinhalten.

Konsistente Daten- und Cloud-Strategie sowie die Erfahrung der anderen

Daniel Metzger, Regional Vice President Central & Eastern Europe, Cloudera.
Daniel Metzger, Regional Vice President Central & Eastern Europe, Cloudera.
(Bild: SEIDENABEL)

Sind sich Unternehmen im Klaren darüber, wie sie mit ihren Daten umgehen wollen und wie sie diese zielgerichtet nutzen werden, stellt sich die Frage nach dem Wie. Dabei führt an der Cloud als Teil der IT-Infrastruktur kaum ein Weg vorbei, den eine Enterprise Data Cloud erheblich vereinfacht. Um die passenden Workloads für die jeweilige Cloud zu finden, müssen Unternehmen das Rad aber nicht neu erfinden. Sie definieren die Anwendungsfälle, die sie in die Cloud verschieben oder die sie dort optimieren wollen. Dann lässt sich auf die Erfahrungen Dritter zurückgreifen. Das Adaptieren von Anwendungsfällen schafft wieder eine individuelle Lösung, die Mehrwert erzeugt.

*Der Autor: Daniel Metzger, Regional Vice President Central & Eastern Europe, Cloudera

(ID:47262990)