Suchen

SAS Text Analytics macht Wissen in unstrukturierten Daten verwertbar Lösungs-Suite zur Analyse von unstrukturierten Daten

| Redakteur: Florian Karlstetter

SAS hat mit Text Analytics eine Lösungs-Suite zur Analyse von unstrukturierten Daten wie E-Mails, Gesprächsnotizen und anderen digital vorliegenden Dokumenten vorgestellt. Die Ergebnisse sollen dabei helfen, aus relevanten Informationen automatisch und systematisch geschäftliche Erkenntnisse zu gewinnen. Manuell ist dies aufgrund der vorherrschenden Informationsflut kaum zu bewältigen.

Firmen zum Thema

SAS Text Analytics filtert aus unstrukturierten Daten geschäftlich relevante Informationen heraus.
SAS Text Analytics filtert aus unstrukturierten Daten geschäftlich relevante Informationen heraus.
( Archiv: Vogel Business Media )

Mit der von SAS Institute vorgestellten Lösung lassen sich in Texten verborgen liegende Informationen strukturieren und analysieren, um bislang unsichtbare Muster, Querverbindungen und Trends sichtbar zu machen. Die Suite besteht aus vier Komponenten: Das Herzstück ist SAS Enterprise Content Categorization, mit dem automatisch Inhalte kategorisiert werden.

Dafür kommen Techniken zur Verarbeitung natürlicher Sprache ebenso zum Einsatz wie moderne sprachwissenschaftliche Methoden. Fakten, Ereignisse und Zusammenhänge werden extrahiert, gegliedert und in Kategorien zusammengefasst. Daraus entstehen Regelwerke und Taxonomien, die es Unternehmen erlauben, auch große Mengen von Dokumenten voll automatisiert zu bewerten und sie für Geschäftsprozesse nutzbar zu machen.

Mit SAS Sentiment Analysis werden neben Fakten auch subjektive Kriterien wie positive und negative Meinungen, Stimmungen und Bewertungen differenziert. Als mögliche Quellen für diese Analyse nennt SAS Blogs, Tweets, E-Mails, Produktbewertungen bei Amazon oder eBay, oder auch aus Callcenter-Protokollen und von Umfragen.

Die dritte Komponente, SAS Text Miner nutzt die Data-Mining-Technologie von SAS und kombiniert diese mit modernen sprachwissenschaftlichen Methoden. So werden neue Zusammenhänge und Cluster auch in unstrukturiertem Text erkennbar – die zentrale Voraussetzung, um die Informationen aus verschiedensten Dokumenten zum Beispiel für Prognoseverfahren oder zur Textklassifikation mit SAS Enterprise Content Categorization zu erschließen und zu verfeinern.

Der vierte Baustein, SAS Ontology Management sorgt für konsistente Klassifikationstaxonomien, um mit SAS Enterprise Content Categorization komplexe Klassifikationshierarchien operativ bereitzustellen, zu warten und weiterzuentwickeln. Damit können etwa Unternehmen und Organisationen im Gesundheitswesen oder der Wissenschaft ohne großen Aufwand auf die schon vorbereitete Mesh Ontology zurückgreifen, ein Schema mit aktuell 25.186 Kategorien der Medizin und Biologie.

„SAS Text Analytics machen den gesamten Bestand innerhalb und außerhalb eines Unternehmens an unstrukturierten Textdaten ohne manuellen Aufwand zu einer qualifizierten Informationsbasis für Fachabteilungen und Management“ erläutert Jörg Petzhold, Manager Industry & Solution Marketing bei SAS. „Dabei spielt es keine Rolle, um welche Texte es sich handelt und wo diese liegen – das kann im Web ebenso sein wie in Wissensdatenbanken, beispielsweise aber auch in Pressearchiven oder in Marktforschungsergebnissen.“

(ID:2043953)