Mobile-Menu

Data Mining – Datenanalyse mit Microsoft

Aktuelle Trends zu Business Intelligence in SQL Server 2008

Seite: 3/4

Anbieter zum Thema

Wirklich interessant – mit Neuerungen beim Trainieren von Algorithmen – wird es bei der Wahl der Mining-Algorithmen (siehe Abbildung 4):

  • Clustering ist ein Segmentierungsalgorithmus, um gewisse Gemeinsamkeiten in Daten zu finden.
  • Der Association-Algorithmus (Association Rules) findet beispielsweise Produkte auf Basis anderer gekaufter Produkte. Der Algorithmus kann aber auch als Market-Basket-Analysis-Instrument angesehen werden.
  • Entscheidungsbäume (Decision Trees) ist ein Regressionsalgorithmus, der eine Vorhersage aufgrund bestehender historischer Daten tätigt.
  • Lineare Regression (Linear Regression) hilft ebenfalls, eine Vorhersage zu treffen.
  • Logistic Regression ist eine Variation eines neuronalen Netzwerks zur Regressionsanalyse.
  • Naive Bayes ist ein Klassifikationsalgorithmus, der beispielweise im Marketing eingesetzt wird, um zielgerecht Kunden Werbung zuzusenden.
  • Neurales Netzwerk (Neural Network) für Klassifikations- und Regressionsminingmodelle, die beispielsweise in Marketing-Analysen Verwendung finden.
  • Der Sequenz-Analyse-Algorithmus (Sequence Clustering) ermittelt beispielsweise, in welcher Reihenfolge ein Kunde Waren in den Online-Warenkorb legt.
  • Zeitreihen (Time Series) dienen für eine Zeitreihenanalyse (Börsendaten, Wetterbeobachtungen, etc.).

Ein wesentliches Feature bei Microsoft ist, dass Sie für ein Problem (Datensatz aus Tabelle oder Sicht) mehrere Algorithmen verwenden und diese in einem „Projekt“ vergleichen können (siehe Abbildung 5).

Kurzbeispiel Entscheidungsbaum

Sie können Entscheidungsbäume vielfältig einsetzen. Bei der Verkaufsanalyse helfen sie zu entscheiden, welche Käufergruppe voraussichtlich sich für ein Produkt entscheidet: Zum Beispiel für ein Fahrrad. Der Algorithmus bestimmt aufgrund vorhandener Daten, welche Haupteinflussgrößen hier vorliegen: Hier sind es das Alter und Anzahl der vorhandenen Pkw. Andere Größen wie Anzahl der Kinder, Bildungsgrad usw. spielen hier eine untergeordnete Rolle.

Anhand der Daten berechnet der Algorithmus einen Entscheidungsbaum (siehe Abbildung 6), wo Sie anhand der farbigen Balken ersehen können (Blau = Fahrradkäufer), wie hoch die Wahrscheinlichkeit ist, dass sich der Kunde für ein Fahrrad entscheidet.

Artikelfiles und Artikellinks

(ID:2012900)