Suchen

Data Mining – Datenanalyse mit Microsoft Aktuelle Trends zu Business Intelligence in SQL Server 2008

| Autor / Redakteur: Frank Castro Lieberwirth / Nico Litzel

Unsere Gesellschaft produziert riesige Datenmengen. Diese Daten sind potenziell wertvolle Ressourcen, wenn es gelingt, aus den Datenbeständen Informationen zu extrahieren. Data Mining ermöglicht eine halbautomatische Datenanalyse zur statistischen Auswertung und kann in nahezu allen Branchen eingesetzt werden. Dieser Artikel beschreibt Grundlagen und Anwendungsmöglichkeiten von Data Mining, die Sie mit Microsoft SQL Server 2008 durchführen können.

Firmen zum Thema

Data Mining – das Graben nach den richtigen Daten
Data Mining – das Graben nach den richtigen Daten
( Archiv: Vogel Business Media )

Mit Data Mining lassen sich Muster, Änderungen, Anomalien, Assoziationen und andere signifikante Zusammenhänge in Daten entdecken und für Vorhersagen nutzen. Die Extraktion aus dem Datenbestand erfolgt halbautomatisch, das heißt, Sie müssen beispielsweise Suchparameter eingeben. Die technische Basis von Data Mining sind Algorithmen zum Lernen von strukturellen Beschreibungen aus Beispielen.

Die strukturellen Muster repräsentieren implizit Muster, die zur Vorhersage von neuen Situationen und zum Verstehen der Vorhersage genutzt werden. Letzteres ist vielleicht noch wichtiger, da man beispielsweise verstehen möchte, warum einer Zielgruppe ein Kredit oder ein Merkmal zugeschrieben werden kann. Herkömmliche Verfahren (OLAP, Abfragen, Reporting) betrachten nur eine historische Sicht und werden nur interaktiv oder passiv ausgewertet (siehe Abbildung 1).

Bildergalerie

Bildergalerie mit 6 Bildern

Die Methoden des Data Mining stammen aus dem Bereich der künstlichen Intelligenz (KI), der Statistik und der Datenbankforschung. Data Mining wird oft als Teilgebiet von Business Intelligence betrachtet, auch Microsoft schließt sich dieser Meinung an. Viele Artikel und Webcasts auf den Internetseiten von Microsoft sprechen für die wachsende Bedeutung, die das Unternehmen diesem Aspekt entgegenbringt. Für SQLServer 2008 gibt es verbesserte Algorithmen für Zeitreihen und Vorhersagen sowie Add-ons für Office 2007.

Die Anwendungsmöglichkeiten sind breit gefächert

Die Zielgruppe von Data Mining ist quasi unbegrenzt: Jeder, der einen Datenbestand besitzt und gewisse Zusammenhänge und Vorhersagen treffen möchte. Die Palette reicht von Auswertungen in der Landwirtschaft bis hin zu Marketingstrategien oder Kreditvergaben, wie beispielsweise:

  • Analysen für das Customer Relationship Management, wie beispielsweise Kundenabwanderungsanalysen, Kundenbewertung und Zielgruppenmarketing,
  • Webshop-Analysen, Warenkorb-Analyse,
  • Entdeckung von Anomalien und Abweichungen, wie sie beispielsweise im Versicherungswesen (wann könnte ein Betrugsfall vorliegen?) oder bei der Produktion auftreten können und
  • Vorhersage von Risiken, beispielsweise für Banken und die Versicherungswirtschaft.

Artikelfiles und Artikellinks

(ID:2012900)