:quality(80)/images.vogel.de/vogelonline/bdb/1777000/1777070/original.jpg)
Autonome Archivierung Intelligente Dokumente und Autopiloten sorgen für Recht und Ordnung
Marie Kondo und ihr Kleiderschrankprinzip haben den Kampf gegen ungetragene Kleidungsstücke in unseren Haushalten lang aufgenommen. Doch was ist mit den vielen ungenutzten Daten und Dokumenten auf riesigen Speichersystemen in den Kellern von Unternehmen – wo ist die Marie Kondo für die digitalen Messis dieser Welt? Archivierung mittels Autopiloten sorgt für freie Kapazitäten in der Unternehmens-IT, Kosteneinsparungen durch autonom orchestrierte Storages und rechtskonforme Archivierung dank automatischer Löschvorschläge.
Firma zum Thema

Analog zum bewährten Kleiderschrankmanagementprinzip von Marie Kondo und anderen „Was ich ein Jahr nicht getragen habe, kann weg“, gestalten sich digitale Use-Cases des Aufräumens natürlich durchaus komplexer, aber die Resultate sind nicht weniger erleichternd. Ein rechtlich relevantes Dokument muss anders „gelagert“ werden als eine Alltagsnotiz. Es gibt unterschiedliche gesetzliche Aufbewahrungsfristen und unternehmensspezifische Regelungen oder Praxishandhabungen. Jede Frist, jedes Kriterium – alle Informationen sind wichtig beim „Aufräumen“ zu beachten, um am Ende nicht doch Wichtiges unwiederbringlich zu verlieren.
Aber dennoch, Dokumente, die jahrelang nicht geöffnet wurden, sollten zum Löschen vorgeschlagen oder automatisch und transparent auf einen günstigeren Speicher umgezogen werden – ganz abgesehen davon, dass einige Daten aufgrund gesetzlicher Vorschriften sogar zwingend gelöscht werden müssen. Doch hier braucht es intelligente Lösungen, die alle Trigger identifizieren, daraus lernen und selbstständig agieren.
Das intelligente Archiv
Das Archiv der Zukunft muss Muster selbst erkennen und vorausschauend Optimierungsvorschläge bringen. Übervolle Archive sollten reorganisiert, Vorschläge zum Löschen gemacht, teure Speicherplätze entlastet und günstiger Speicher umfänglich genutzt werden. Dies alles jedoch nicht wahllos, sondern diversen Informationen folgend, die unmöglich jedem einzelnen Dokument „aktiv“ via Metadaten oder gar durch manuellen Aufwand des Bearbeiters mitgegeben werden können.
Auf dem Weg zu einer vollständigen Automatisierung der Prozesse benötigt das intelligente Archiv genau diese Informationen, die es lernen lassen und Handlungen auslösen. Die spannendsten Informationen sind dabei häufig diejenigen, die ein Dokument selbst sozusagen „inaktiv“ erlebt und die es inhaltlich ausmachen. Ein lernfähiges System kann diese Daten aufnehmen und auf deren Grundlage vielleicht sogar besser – sehr wahrscheinlich jedoch verlässlicher und unfehlbarer – handeln als der Mensch.
Exkurs: Autonomes Fahren
Vom autonomen Fahren, also der fahrerlosen Fortbewegung mit einem Fahrzeug, hat heute jeder eine Vorstellung. Schon bei der Erfindung des Automobils wurde durch die Namensgebung das „Selbstbewegliche“ betont, auch wenn die Autonomie des Fahrers durchaus überschaubar war. Rückblick: Hinsichtlich der Autonomie in der Fortbewegung gab es zunächst die mittelbare Abhängigkeit vom Pferd, gefolgt von der absoluten Abhängigkeit vom Menschen. Doch in Zeiten von Tesla und Co. gibt es sie nun tatsächlich, die Steuerung eines Fahrzeugs ohne das Zutun des Menschen. In Bezug auf die Archivierung lassen sich frappierende Analogien erkennen: absolute Abhängigkeit vom Menschen (Organisation von Papierordnern), vielfache Abhängigkeit vom Menschen (Organisation von digitalisierten Ablagen), und nun befindet sich der Mensch auf dem Weg zur autonomen Archivierung.
Das intelligente Dokument
Es sind nicht die Straße oder der Zielort, die das Auto zum autonomen Fahren befähigen, sondern das Auto selbst. Wäre es beispielsweise die Straße, würde es sich wie beim Schienenverkehr verhalten und wäre weit weg von jeglicher freien Bewegung und Flexibilität. Genau dies lässt sich auch auf das Thema Dokumentenarchivierung übertragen: Weder die Software-Anwendung, in der das Dokument erstellt und bearbeitet wird, noch der Speicher, in dem das Dokument archiviert wird, können die Archivierung steuern. Eine dritte Ebene, so wie es häufig praktiziert wird – ein DMS (Dokumenten Management System) oder ECM (Enterprise Content Management System) – wäre ebenso eine übergeordnete Intelligenz. Diese bringt erstens weiteren „Systemballast“ mit sich und raubt zweitens ebenfalls Flexibilität. Der Grund: Systeme gehen, aber die Dokumente bleiben. Das Szenario: Bei einem Anwendungswechsel müssen meist jede Querverbindung und Datenreplikation zwischen den Anwendungen neu konzipiert, jedes Dokument migriert und gegebenenfalls jede ID neu vergeben werden. Der Austausch einer Instanz wird zum Großprojekt für die IT.
Das intelligente Dokument ist die Lösung für diesen Flickenteppich der Systeme. Dokumente tragen diverse Informationen in sich, wie beispielsweise den Content selbst, aber auch Meta- und kontextbezogene Daten. Die Metadaten etwa stammen aus den führenden Anwendungen, werden dem Dokument sozusagen „aktiv“ mitgegeben. Beim Abschalten einer Anwendung gehen diese Daten im Falle des intelligenten Dokuments nicht mehr verloren. Vielmehr machen sie das Dokument zu einer von der Anwendung unabhängigen, autonomen Instanz, die jederzeit in anderen Anwendungen angezeigt und bearbeitet werden kann.
tia – eine Autopilotin
Wie wird ein Dokument intelligent? Durch ein System, das die Daten des Dokuments an geeigneter Stelle erfasst, ausliest und weitergibt, um die „freien“ Dokumente in die richtigen Bahnen zu lenken. Die Managerin oder Autopilotin, die diese Anforderungen realisiert, nennt KGS „tia – the intelligent archive“. Schnittstellentechnisch setzt das intelligente Archiv dabei auf den Content-Management-Interoperability-Services-Standard (CMIS). Anders als etwa die SAP-ArchiveLink-Schnittstelle ermöglicht er die Verwaltung von Metadaten; eine weitere dafür geeignete Schnittstelle ist OData – verbreitet vor allem im SAP-Umfeld, aber auch bei Anwendungen wie MS SharePoint.
tia schafft über das intelligente Dokument in der Folge einen Single Point of Truth (SPoT) für Dokumente jeder Art. Ganz gleich, in welcher Anwendung gearbeitet wird – auf die Dokumente kann von überall zugegriffen werden.
Aus dem See fischen
Diese Fähigkeiten lassen sich über Statistics realisieren. Zunächst beschreibt Statistics nur die Disziplin, welche die Erfassung, Organisation, Analyse, Interpretation und Darstellung von Daten betrifft. Es ist die Basis für regelbasierte Operationen und ebnet den Weg zu einem selbstlernenden System (Machine Learning) und den vorausschauenden Services.
Metadaten sind nur eine der Quellen, aus denen Statistics schöpft. Die Kontext- und Contentdaten sind das eigentliche Gold, nach dem ein intelligentes Archiv schürft. Ein Beispiel sind Nutzungsdaten: Von wem, wann und wie oft wurde das Dokument zurück aus dem Archiv auf den Bildschirm geholt?
Technisch funktioniert dies über sogenannte Data-Lakes – wahrliche Seen von nicht validierten Daten. tia erfasst alle Daten und schreibt sie in entsprechende Lakes weg. Mit Zugriff darauf können Analysen und diverse Operationen durchgeführt werden. Dabei werden Daten erst strukturiert oder gegebenenfalls umformatiert, wenn sie konkret benötigt werden. Neben text- oder zahlenbasierten Daten können Data-Lakes auch Bilder, Videos oder andere Datenformate aufnehmen. Ein Content-bezogenes Beispiel aus dem Personalbereich und dem Datenschutz könnte demnach sein: Ex-Mitarbeiter X verlangt eine Löschung aller Fotos mit seinem Konterfei von Betriebsfeiern und offizieller Nutzung. Nun muss entsprechend auf Bilder- und Videodaten zurückgegriffen werden, aus denen entsprechende Inhalte extrahiert werden.
Viele große und mittelständische Unternehmen haben bereits Data-Lakes beziehungsweise ganze Datensysteme für ihre Business-Intelligenz-Anforderungen aus anderen Bereichen im Einsatz. Die autonome Archivierung mit tia zeichnet sich dadurch aus, dass sich die Archivmanagementfähigkeiten auch flexibel in diese bestehenden Systeme von zum Beispiel Google, AWS und SAP einfügen lassen.
Geht auch intelligent: Daten- und Dokumentenmigration
Das Thema Migration von Daten und Dokumenten kommt in nahezu jedem Archivierungsprojekt zum Tragen. Die meisten Unterlagen eines Unternehmens liegen bereits an einem Ort – also in dem abzulösenden System – und müssen schnell und unbemerkt vom Anwender umgezogen werden. Das wird häufig als der kritischste Teil des Projekts betrachtet. Die Angst vor Stillstand in den Abteilungen oder Produktionsketten aufgrund von fehlendem Dokumentenzugriff oder einer starken Verlangsamung der Anwendungen ist groß. Ebenso die Frage, ob Daten verloren gehen oder allzu viele korrupte Dokumente zum Vorschein kommen, treibt die Verantwortlichen um. Im Zweifel sind diese Bedenken berechtigt, umfassen solche Umzüge doch meist hunderte Millionen Dokumente und zweistellige Terabytes, was zu langen Laufzeiten der Migrationsprojekte führt und Ressourcen bindet. Auch hier heißt das Prinzip: weg von der manuellen hin zur autonomen Steuerung, um mittels statistischer Möglichkeiten Projekte schneller sowie performanceneutral abzuwickeln und Fehler zu vermeiden.
Die Entwickler von tia arbeiten beispielsweise an einem „Gaspedal“, das bei großen Dokumentenmigrationen selbstständig erkennt, welcher Migrationsumfang bei der aktuellen Last der Unternehmenssysteme sinnvoll ist. So können Migrationen stattfinden, von denen der Anwender nichts merkt, und das nahezu autonom bei maximaler Effizienz. Konkret orientiert sich tia dabei nicht an den vom Menschen assoziierten Auslastungsszenarien, sondern beginnt die Migration auf Basis einer ständigen Analyse der Zugriffszeiten. Wie lange dauert das Holen, Verarbeiten und Wegschreiben – also der Weg von der Quelle bis zum Ziel? Daraus leitet tia ab, wie viele gleichzeitig stattfindende Operationen in der entsprechenden Situation sinnvoll sind, und sorgt so für eine überzeugende Performanz des Gesamtlayers.
*Der Autor: Benjamin Schröder ist seit 2013 Teil von KGS und war bis Ende 2017 im Bereich Professional Service als Projektmanager tätig. Seit Anfang 2018 leitet der gebürtige Frankfurter das R&D Team. Er verfügt über 15 Jahre Erfahrung in Sachen Software für die Dokumentenverwaltung – zunächst selbst in der Projektdurchführung, steht er nun dem Entwicklungsteam voran und ist Innovationstreiber von KSG.
(ID:47086350)