Autonome Archivierung Intelligente Dokumente und Autopiloten sorgen für Recht und Ordnung

Autor / Redakteur: Benjamin Schröder* / Dr. Jürgen Ehneß

Marie Kondo und ihr Kleiderschrankprinzip haben den Kampf gegen ungetragene Kleidungsstücke in unseren Haushalten lang aufgenommen. Doch was ist mit den vielen ungenutzten Daten und Dokumenten auf riesigen Speichersystemen in den Kellern von Unternehmen – wo ist die Marie Kondo für die digitalen Messis dieser Welt? Archivierung mittels Autopiloten sorgt für freie Kapazitäten in der Unternehmens-IT, Kosteneinsparungen durch autonom orchestrierte Storages und rechtskonforme Archivierung dank automatischer Löschvorschläge.

Firma zum Thema

Ordnung muss sein – in der analogen und erst recht in der digitalen Welt.
Ordnung muss sein – in der analogen und erst recht in der digitalen Welt.
(Bild: gemeinfrei / Pixabay )

Analog zum bewährten Kleiderschrankmanagementprinzip von Marie Kondo und anderen „Was ich ein Jahr nicht getragen habe, kann weg“, gestalten sich digitale Use-Cases des Aufräumens natürlich durchaus komplexer, aber die Resultate sind nicht weniger erleichternd. Ein rechtlich relevantes Dokument muss anders „gelagert“ werden als eine Alltagsnotiz. Es gibt unterschiedliche gesetzliche Aufbewahrungsfristen und unternehmensspezifische Regelungen oder Praxishandhabungen. Jede Frist, jedes Kriterium – alle Informationen sind wichtig beim „Aufräumen“ zu beachten, um am Ende nicht doch Wichtiges unwiederbringlich zu verlieren.

Aber dennoch, Dokumente, die jahrelang nicht geöffnet wurden, sollten zum Löschen vorgeschlagen oder automatisch und transparent auf einen günstigeren Speicher umgezogen werden – ganz abgesehen davon, dass einige Daten aufgrund gesetzlicher Vorschriften sogar zwingend gelöscht werden müssen. Doch hier braucht es intelligente Lösungen, die alle Trigger identifizieren, daraus lernen und selbstständig agieren.

Das intelligente Archiv

Das Archiv der Zukunft muss Muster selbst erkennen und vorausschauend Optimierungsvorschläge bringen. Übervolle Archive sollten reorganisiert, Vorschläge zum Löschen gemacht, teure Speicherplätze entlastet und günstiger Speicher umfänglich genutzt werden. Dies alles jedoch nicht wahllos, sondern diversen Informationen folgend, die unmöglich jedem einzelnen Dokument „aktiv“ via Metadaten oder gar durch manuellen Aufwand des Bearbeiters mitgegeben werden können.

Auf dem Weg zu einer vollständigen Automatisierung der Prozesse benötigt das intelligente Archiv genau diese Informationen, die es lernen lassen und Handlungen auslösen. Die spannendsten Informationen sind dabei häufig diejenigen, die ein Dokument selbst sozusagen „inaktiv“ erlebt und die es inhaltlich ausmachen. Ein lernfähiges System kann diese Daten aufnehmen und auf deren Grundlage vielleicht sogar besser – sehr wahrscheinlich jedoch verlässlicher und unfehlbarer – handeln als der Mensch.

Exkurs: Autonomes Fahren

Vom autonomen Fahren, also der fahrerlosen Fortbewegung mit einem Fahrzeug, hat heute jeder eine Vorstellung. Schon bei der Erfindung des Automobils wurde durch die Namensgebung das „Selbstbewegliche“ betont, auch wenn die Autonomie des Fahrers durchaus überschaubar war. Rückblick: Hinsichtlich der Autonomie in der Fortbewegung gab es zunächst die mittelbare Abhängigkeit vom Pferd, gefolgt von der absoluten Abhängigkeit vom Menschen. Doch in Zeiten von Tesla und Co. gibt es sie nun tatsächlich, die Steuerung eines Fahrzeugs ohne das Zutun des Menschen. In Bezug auf die Archivierung lassen sich frappierende Analogien erkennen: absolute Abhängigkeit vom Menschen (Organisation von Papierordnern), vielfache Abhängigkeit vom Menschen (Organisation von digitalisierten Ablagen), und nun befindet sich der Mensch auf dem Weg zur autonomen Archivierung.

Das intelligente Dokument

Es sind nicht die Straße oder der Zielort, die das Auto zum autonomen Fahren befähigen, sondern das Auto selbst. Wäre es beispielsweise die Straße, würde es sich wie beim Schienenverkehr verhalten und wäre weit weg von jeglicher freien Bewegung und Flexibilität. Genau dies lässt sich auch auf das Thema Dokumentenarchivierung übertragen: Weder die Software-Anwendung, in der das Dokument erstellt und bearbeitet wird, noch der Speicher, in dem das Dokument archiviert wird, können die Archivierung steuern. Eine dritte Ebene, so wie es häufig praktiziert wird – ein DMS (Dokumenten Management System) oder ECM (Enterprise Content Management System) – wäre ebenso eine übergeordnete Intelligenz. Diese bringt erstens weiteren „Systemballast“ mit sich und raubt zweitens ebenfalls Flexibilität. Der Grund: Systeme gehen, aber die Dokumente bleiben. Das Szenario: Bei einem Anwendungswechsel müssen meist jede Querverbindung und Datenreplikation zwischen den Anwendungen neu konzipiert, jedes Dokument migriert und gegebenenfalls jede ID neu vergeben werden. Der Austausch einer Instanz wird zum Großprojekt für die IT.

Das intelligente Dokument ist die Lösung für diesen Flickenteppich der Systeme. Dokumente tragen diverse Informationen in sich, wie beispielsweise den Content selbst, aber auch Meta- und kontextbezogene Daten. Die Metadaten etwa stammen aus den führenden Anwendungen, werden dem Dokument sozusagen „aktiv“ mitgegeben. Beim Abschalten einer Anwendung gehen diese Daten im Falle des intelligenten Dokuments nicht mehr verloren. Vielmehr machen sie das Dokument zu einer von der Anwendung unabhängigen, autonomen Instanz, die jederzeit in anderen Anwendungen angezeigt und bearbeitet werden kann.

tia – eine Autopilotin

Wie wird ein Dokument intelligent? Durch ein System, das die Daten des Dokuments an geeigneter Stelle erfasst, ausliest und weitergibt, um die „freien“ Dokumente in die richtigen Bahnen zu lenken. Die Managerin oder Autopilotin, die diese Anforderungen realisiert, nennt KGS „tia – the intelligent archive“. Schnittstellentechnisch setzt das intelligente Archiv dabei auf den Content-Management-Interoperability-Services-Standard (CMIS). Anders als etwa die SAP-ArchiveLink-Schnittstelle ermöglicht er die Verwaltung von Metadaten; eine weitere dafür geeignete Schnittstelle ist OData – verbreitet vor allem im SAP-Umfeld, aber auch bei Anwendungen wie MS SharePoint.

Die automatische KGS-Archivarin „tia – the intelligent archive“ sorgt für Ordnung.
Die automatische KGS-Archivarin „tia – the intelligent archive“ sorgt für Ordnung.
(Bild: KGS)

tia schafft über das intelligente Dokument in der Folge einen Single Point of Truth (SPoT) für Dokumente jeder Art. Ganz gleich, in welcher Anwendung gearbeitet wird – auf die Dokumente kann von überall zugegriffen werden.

Aus dem See fischen

Diese Fähigkeiten lassen sich über Statistics realisieren. Zunächst beschreibt Statistics nur die Disziplin, welche die Erfassung, Organisation, Analyse, Interpretation und Darstellung von Daten betrifft. Es ist die Basis für regelbasierte Operationen und ebnet den Weg zu einem selbstlernenden System (Machine Learning) und den vorausschauenden Services.

Metadaten sind nur eine der Quellen, aus denen Statistics schöpft. Die Kontext- und Contentdaten sind das eigentliche Gold, nach dem ein intelligentes Archiv schürft. Ein Beispiel sind Nutzungsdaten: Von wem, wann und wie oft wurde das Dokument zurück aus dem Archiv auf den Bildschirm geholt?

Technisch funktioniert dies über sogenannte Data-Lakes – wahrliche Seen von nicht validierten Daten. tia erfasst alle Daten und schreibt sie in entsprechende Lakes weg. Mit Zugriff darauf können Analysen und diverse Operationen durchgeführt werden. Dabei werden Daten erst strukturiert oder gegebenenfalls umformatiert, wenn sie konkret benötigt werden. Neben text- oder zahlenbasierten Daten können Data-Lakes auch Bilder, Videos oder andere Datenformate aufnehmen. Ein Content-bezogenes Beispiel aus dem Personalbereich und dem Datenschutz könnte demnach sein: Ex-Mitarbeiter X verlangt eine Löschung aller Fotos mit seinem Konterfei von Betriebsfeiern und offizieller Nutzung. Nun muss entsprechend auf Bilder- und Videodaten zurückgegriffen werden, aus denen entsprechende Inhalte extrahiert werden.

Viele große und mittelständische Unternehmen haben bereits Data-Lakes beziehungsweise ganze Datensysteme für ihre Business-Intelligenz-Anforderungen aus anderen Bereichen im Einsatz. Die autonome Archivierung mit tia zeichnet sich dadurch aus, dass sich die Archivmanagementfähigkeiten auch flexibel in diese bestehenden Systeme von zum Beispiel Google, AWS und SAP einfügen lassen.

Geht auch intelligent: Daten- und Dokumentenmigration

Das Thema Migration von Daten und Dokumenten kommt in nahezu jedem Archivierungsprojekt zum Tragen. Die meisten Unterlagen eines Unternehmens liegen bereits an einem Ort – also in dem abzulösenden System – und müssen schnell und unbemerkt vom Anwender umgezogen werden. Das wird häufig als der kritischste Teil des Projekts betrachtet. Die Angst vor Stillstand in den Abteilungen oder Produktionsketten aufgrund von fehlendem Dokumentenzugriff oder einer starken Verlangsamung der Anwendungen ist groß. Ebenso die Frage, ob Daten verloren gehen oder allzu viele korrupte Dokumente zum Vorschein kommen, treibt die Verantwortlichen um. Im Zweifel sind diese Bedenken berechtigt, umfassen solche Umzüge doch meist hunderte Millionen Dokumente und zweistellige Terabytes, was zu langen Laufzeiten der Migrationsprojekte führt und Ressourcen bindet. Auch hier heißt das Prinzip: weg von der manuellen hin zur autonomen Steuerung, um mittels statistischer Möglichkeiten Projekte schneller sowie performanceneutral abzuwickeln und Fehler zu vermeiden.

Die Entwickler von tia arbeiten beispielsweise an einem „Gaspedal“, das bei großen Dokumentenmigrationen selbstständig erkennt, welcher Migrationsumfang bei der aktuellen Last der Unternehmenssysteme sinnvoll ist. So können Migrationen stattfinden, von denen der Anwender nichts merkt, und das nahezu autonom bei maximaler Effizienz. Konkret orientiert sich tia dabei nicht an den vom Menschen assoziierten Auslastungsszenarien, sondern beginnt die Migration auf Basis einer ständigen Analyse der Zugriffszeiten. Wie lange dauert das Holen, Verarbeiten und Wegschreiben – also der Weg von der Quelle bis zum Ziel? Daraus leitet tia ab, wie viele gleichzeitig stattfindende Operationen in der entsprechenden Situation sinnvoll sind, und sorgt so für eine überzeugende Performanz des Gesamtlayers.

Benjamin Schröder leitet das R&D Team bei KGS.
Benjamin Schröder leitet das R&D Team bei KGS.
(Bild: oro-photography)

*Der Autor: Benjamin Schröder ist seit 2013 Teil von KGS und war bis Ende 2017 im Bereich Professional Service als Projektmanager tätig. Seit Anfang 2018 leitet der gebürtige Frankfurter das R&D Team. Er verfügt über 15 Jahre Erfahrung in Sachen Software für die Dokumentenverwaltung – zunächst selbst in der Projektdurchführung, steht er nun dem Entwicklungsteam voran und ist Innovationstreiber von KSG.

Ergänzendes zum Thema
KGS Software GmbH

Die KGS Software GmbH mit Hauptsitz in Neu-Isenburg bei Frankfurt am Main ist für Top-Unternehmen weltweit seit über 20 Jahren der digitale Archivspezialist. Daten und Dokumente aus SAP sowie Dokumente aus anderen führenden Applikationen werden mittels performanter, schlanker Software migriert und archiviert. Unter dem Brand „tia – the intelligent archive“ vereint der Archivhersteller seit 2020 alle KGS-Produktmodule zu einer gemeinsamen Vision des intelligenten Dokumentenarchivs. tia steht für autonome Archivierung, ist anschlussfähig an beliebige Anwendungen, Speicherlösungen und Cloud-Technologien und bietet Unternehmen den Single Point of Truth (SPoT) für den Zugriff auf Dokumente. Seit 2005 zertifiziert KGS für die SAP weltweit ArchiveLink- und ILM-Schnittstellen und ist globaler SAP Value Added Solutions Partner.

Das neue Storage-Kompendium zum kostenfreien Download

Die Zeiten, in denen Backups ausschließlich auf Tape angefertigt wurden, sind vorbei. Heute stellt sich die Situation bezüglich Backup-Medien und -Strategien deutlich vielfältiger dar, was auch zu Unsicherheiten führt.

Backup & Archivierung – gestern, heute und morgen

Storage-Kompendium Backup & Archivierung
Storage-Kompendium Backup & Archivierung
(Bildquelle: Storage-Insider)

Die Hauptthemen sind:
# Auf dem Weg zur passenden Backup-Strategie
# Cloud-Backup und Hybrid-Backup
# Tape – der wehrhafte Dinosaurier
# Datensicherheit und Storage: Welche gesetzlichen Vorgaben gelten?
# Langzeitarchivierung mit Objektspeicherung
# Unstrukturierte Daten ohne Backup schützen
# Erstklassige Backup- und Archivierungsstrategie


>>> Storage-Kompendium „Backup & Archivierung“ downloaden

(ID:47086350)