Anbieter zum Thema
Data Mining wird in SQL Server 2008 mit Assistenten so konfigurierbar sein, dass eine Auswertung (Grafiken, Diagramme, Tabellen …) anhand von vorgegebenen Algorithmen vereinfacht ist. Die Schwierigkeit liegt insofern dann bei der Qualität der Daten und der Bedeutung der Auswertung, was letztlich heißt, dass sich der Anwender mit statistischer Auswertung vertraut gemacht haben sollte.
SQL Server Analysis Services (SSAS)
Data Mining gehört zu den Microsoft SQLServer 2008 Analysis Services, die Sie mit dem mitgelieferten Visual Studio 2008 (siehe Abbildung 2) auswerten. Beim Einrichten eines „Projekts“ finden Sie eine Reihe von vorgefertigten Data-Mining-Algorithmen zur Auswahl.
Unter Algorithmus ist hier eine programmierte Vorgehensweise zu verstehen, die dazu dient, Beziehungen aufzudecken. Mit „Data Mining Designer“ und „Data Mining Extensions (DMX)“, einer Erweiterung der SQL-Sprache, können Sie Vorhersagen von Mining-Modellen erstellen und verwalten.
Ein Mining-Modell ist eine Definition der Beziehungen. Microsoft-spezifisch ist eine sogenannte Mining-Struktur, die eine Metaebene zur Definition der Data-Mining-Variablen darstellt und worauf Sie ein Mining-Modell aufbauen können. Vorteil dieser Vorgehensweise ist, dass Sie für ein Problem verschiedene Data-Mining-Modelle anwenden können.
Beispieldatenbank AdventureWorks
Microsoft stellt derzeit zwei Beispieldatenbanken bereit: AdventureWorks und AdventureWorksDW für Data Warehouse mit etwa 18.000 Datensätzen. Beide Datenbanken sind nicht mehr über Microsofts Homepage erhältlich, sondern können über www.codeplex.com heruntergeladen und angehängt werden (siehe Abbildung 3). Beispielprojekte für Visual Studio finden Sie ebenfalls auf den Seiten dieser Quelle.
Data-Mining-Algorithmen
Mit der Datenbank AdventureWorksDW lässt sich ein anschauliches Beispiel konstruieren. Sie erstellen – wie üblich – ein Analysis-Projekt und wählen die Datenquelle aus. In der Vorgehensweise hat sich (bis dahin) gegenüber SQL Server 2005, wenig geändert, außer dass der Assistent optisch etwas netter daherkommt. Um später zu einer Data-Mining-Struktur zu gelangen, können Sie entweder die Quelldaten aus einem OLAP-Cube oder aus einer anderen Datenbank verwenden.
Artikelfiles und Artikellinks
(ID:2012900)