Aus Mustern entsteht Wissen

Big Data mit Business Intelligence nutzbar machen

01.09.2011 | Autor / Redakteur: Susanne Franke / Florian Karlstetter

Ansatz der Business Intelligence Group, Daten aus verschiedenen Social Media-Quellen zu monitoren und zu analysieren.
Ansatz der Business Intelligence Group, Daten aus verschiedenen Social Media-Quellen zu monitoren und zu analysieren.

Vorausschauende Analysen

„Das Potenzial in all diesen Daten liegt in den Mustern, die Unternehmen durch die Analyse erkennen können“, erläutert der Gartner-Marktforscher. „Dabei ist es von kritischer Bedeutung, nicht nur die Datenmenge im Auge zu haben, sondern auch die anderen Dimensionen wie Geschwindigkeit, mit der die Daten ankommen, die Vielfalt der Datentypen wie deren Komplexität“, warnt Prentice. Konnten Unternehmen mit „traditioneller“ Business Intelligence die Fragen, was passiert ist und warum, beantworten, so lasse sich nun mit der von Gartner benannten Pattern-based Strategy eine Antwort auf die Fragen finden, was passiert gerade, was wird wahrscheinlich passieren und welche Ereignisse beeinflussen die Zukunft. Vorausschauende Analysen, die die Zukunft antizipieren und Simulationen zum Auffinden von Mustern sind Funktionalitäten, die den Unternehmen zu gezielteren Entscheidungen verhelfen werden.

Prentice definiert eine Pattern-based Strategy als eine Reihe von Prozessen, mit deren Hilfe Anwender Informationen aus den Daten existierender und künftiger Quellen ziehen können, in einem nächsten Schritt die Auswirkungen ihrer Erkenntnisse in die Geschäftsprozesse einfließen lassen und schließlich im letzten und wichtigsten Schritt die Organisation danach ausrichten können. Eine solche Strategie schließt Technologien und Disziplinen wie bereits genannte Business Intelligence-Systeme, Analytics, Data Discovery, Business Process und Performance Management, Complex Event Management und Informationsverwaltung mit ein. Doch im Unterschied zu früher sollen diese Bereiche nicht mehr separat als Silos betrachtet werden sondern als sich bedingende Einheit, so der Gartner-Mann.

„Die technischen Voraussetzungen, um Big Data in Wissen zu verwandeln, sind vorhanden, wenn auch in einigen Details noch verbesserungswürdig“, erklärt Dr. Wolfgang Martin vom Wolfgang Martin Team. „Big Data treibt den Einsatz innovativer Datenbank-Technologien, um die PetaBytes, sogar Exabytes von Daten in Analysen auswerten zu können“, stellt der Analyst fest. Über spaltenorientierte Speicherung, In-Memory-Technik und parallelisierte Verarbeitung sind die analytischen Datenbanken in der Lage, mit der schieren Datenflut fertig zu werden.

Neue Ansätze und Technologien

Den Mix aus unüberschaubaren und fragmentierten Daten aus den externen Quellen zu identifizieren, zu extrahieren und zu analysieren, das ist die wahre Herausforderung. „Hier sind neue Ansätze und Technologien gefragt, denn traditionelle IT-Werkzeuge zur Datenextraktion und Integration helfen nicht wirklich weiter“, so Dr. Martin.

So hat sich eine neue Klasse von Analysewerkzeugen herausgebildet, die verschiedene Verfahren kombiniert und Data Mining erweitert für den Umgang mit unstrukturierten Daten. In der Textanalytik sind mathematisch-statistische Ansätze um linguistische Verfahren ergänzt worden, erläutert der Fachmann, sodass die Tools in der Lage sind, die Semantik der Sätze zu analysieren, Tonalitäten zu erkennen und so aus geschriebenem Text die gewünschten Erkenntnisse abzuleiten. Hinzu kommen semantische Suchmaschinen, die erst feststellen, welche Texte überhaupt in Frage kommen, und schließlich noch eine neue Komponente, statistische Lernverfahren, um nach Vorlage der Bewertung von einigen Texten durch Experten dies Verfahren selbst zu lernen und auf neue Texte anzuwenden.

Bei der Suche nach Mustern in Big Data lässt sich zudem anders als für den herkömmlichen Analyseprozess im Vorfeld keine konkrete Fragestellung festlegen. Diese neue Kategorie der Analysewerkzeuge löst das Problem, indem die Mining-Verfahren das Aufstellen von Hypothesen zulassen. Dr. Martin erläutert dies am Beispiel der Krebsforschung.

Es wurden erfolgreich Projekte zur Erforschung der Wirksamkeit von Medikamenten, zur Unterscheidung von Respondern und Non-Respondern und zur Klassifikation klinischer Patientendaten durchgeführt. Der Data Mining-Ansatz hilft hier der medizinischen Forschung bei der Hypothesenfindung, in dem man durch die SOM-Methodik klinische und genetische Daten kombiniert untersuchen und klassifizieren kann.

Des weiteren stellt die Vielfalt und Menge der Datenquellen ein Problem dar, zumal nicht alle eine dokumentierte Schnittstelle beinhalten. Neue Ansätze für den Zugriff und die Integration der Quellen können mit dieser Schwierigkeit umgehen. Dr. Martin verweist auf ETL-Tools (Extract, transform, load), die entsprechende Funktionen besitzen, wie etwa die Web Extraktions-Tools von SnapLogic mit ihrer REST-basierten Architektur, zertifizierten Konnektoren (Snaps) zu den unterschiedlichsten Anwendungen und einer Pipeline-Ausführungs-Engine.

Erwähnenswert in diesem Bereich ist auch Kapow Software, denn der Extraction Browser kann Daten aus fast jeder Quelle selbst dann extrahieren, wenn kein API vorhanden ist. Möglich machen das die Miniroboter, die direkt über die Web-Schnittstelle einer Anwendung (über JavaScript oder HTML), die anwendungslogische Ebene (über API, SOAP/REST/XML) oder die Datenbankebene (über SQL) auf Daten zugreifen. Hierzu ahmen die Kapow Robots eine Benutzerinteraktion Schritt für Schritt nach und automatisieren den Prozess für die Extraktion der relevanten Daten mit dem erforderlichen Kontext aus Eingabewerten und Auswahloptionen.

weiter mit: Social Media Monitoring

Inhalt des Artikels:

Kommentare werden geladen....

Was meinen Sie zu diesem Thema?

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Infos finden Sie unter www.mycontentfactory.de (ID: 2052561 / Daten)