Mobile-Menu

Grundlagen der Digitalisierung und Archivierung, Teil 5 Zukunft und Trends in der Archivierung

Von Michael Matzer 7 min Lesedauer

Anbieter zum Thema

Die Private, Public und Hybrid-Cloud sind zu einem wichtigen Ablageort für revisionssichere Archivierung geworden. Mit S3 Objekt Lock gibt es eine sichere Technologie, und der Zugriff wird durch den Dienstleister geregelt und geschützt. Viel Potenzial weist generative KI auf, denn damit lässt sich die Nutzung von Archiven sehr viel produktiver gestalten als bisher.

Richtig eingesetzt, könnte künstliche Intelligenz künftig auch Prozesse der digitalen Archivierung entscheidend unterstützen.(Bild:  ©Vertigo3d, Getty Images Signature via Canva.com)
Richtig eingesetzt, könnte künstliche Intelligenz künftig auch Prozesse der digitalen Archivierung entscheidend unterstützen.
(Bild: ©Vertigo3d, Getty Images Signature via Canva.com)

Bei den in Teil 3 beschriebenen Cloud-basierten Speicherklassen gibt es keine Vorabkosten und keine Wartungskosten – von den Energiekosten mal abgesehen. Gleichzeitig bieten sie in aller Regel schnelleren Zugriff als On-Premises-Bandarchive, nämlich im Millisekundenbereich. Da in der Hybrid-Cloud ähnliche Bedingungen herrschen wie in der Public Cloud, liegt der Schwerpunkt dieses Beitrags auf der Archivierung in der Public Cloud.

Merkmale eines Cloud-Archivs und Kriterien

Ein Cloud-Archiv muss verschiedene Grundbedingungen erfüllen, um in die Auswahl gelangen zu können. Wird auch nur ein einziges dieser Kriterien nicht erfüllt, beispielsweise Compliance, sollte der Unternehmenskunde sich woanders umsehen. In der Datenwirtschaft kann die geringste Nachlässigkeit ein Geschäftsmodell zum Scheitern verurteilen oder ein Unternehmen in die Insolvenz treiben (durch Erpressung, Konventionalstrafen usw.).

Das Archiv muss virtuell unbegrenzt skalierbar sein und eine maximale Datenbeständigkeit (99 plus 11 Neuner hinterm Komma) aufweisen. Die Abrechnung gemäß SLAs muss transparent sein. Die Preise sollten günstig und die Abrufmöglichkeiten sollten flexibel sein und nicht nur eine Speicherklasse anbieten. Denn nicht alle Inhalte sind gleich, und Workloads können sich ändern. Das bedeutet, dass der Lesezugriff auf die Daten zwar schnellstmöglich erfolgen können muss, die Wiederherstellung etwa eines Dokuments aber unter Umständen Stunden dauern darf. Das sollte der Interessent bei der Auswahl einer passenden Speicherklasse, gleichgültig bei welchem Dienstleister, beachten.

Bildergalerie
Bildergalerie mit 5 Bildern

Microsoft Azure

Archivierung ist auch bei MS Azure realisierbar. „Archiv“ ist die kostengünstigste Speicherklasse neben „Heiß“ und „Kalt“. „Archiv“ (ab 180 Tagen Speicherdauer) wird als „Offline-Speicherklasse“ bezeichnet, das bedeutet, dass die Zugriffs- und Latenzzeiten von erheblicher Bedeutung sein können. Für vorzeitige Löschung und so weiter fallen erhöhte Gebühren an. Die Archivebene wird für ZRS-, GZRS- oder RA-GZRS-Konten nicht unterstützt. Die Compliance-Angebote von Azure finden sich auf dieser Seite.

Google Storage

Google Storage ist der einzige große Public-Cloud-Anbieter, der die Preise für seine Archivierungs-Speicherklassen gleich auf der entsprechenden Landing-Page angibt. Sie beginnen ab einem Preis von 0,0012 US-Dollar pro GB und Monat. Datenverschlüsselung, EMEA-Compliance und Verwaltung des Datenzyklus sind selbstverständlich.

Multi-Cloud

Vawlt ermöglicht die Erstellung virtueller Speicherdienste, die an die Spezifikationen der Kunden angepasst sind und sich leicht in neue oder bestehende Datenspeicherstrategien integrieren lassen. Die Daten werden gleichzeitig bei mehreren Cloud-Anbietern gespeichert, was ein Höchstmaß an Sicherheit und Zuverlässigkeit gewährleistet.

Mit Vawlt können Nutzer eine beliebige Anzahl von maßgeschneiderten Datenvolumen erstellen, jedes mit einer einzigartigen Konfiguration und einem unabhängigen Preis. Nutzer können den Volume-Typ, ihre bevorzugten Cloud-Anbieter, die Speicherorte und die Speicherschnittstellen wählen. Mit nur einem Zugang können Nutzer festlegen, welche Benutzer auf jedes erstellte Datenvolumen zugreifen können. Sie können ihren Arbeitsablauf vereinfachen, da es nur ein Abrechnungskonto gibt.

Wichtig für die Archivierung: In jedem Volume können Nutzer eine Aufbewahrungsrichtlinie für ihre Dateien festlegen. Das bedeutet, dass sie einen Zeitraum festlegen können, in dem ihre Dateien noch für die Wiederherstellung verfügbar sind, selbst wenn sie gelöscht wurden.

Der Anbieter über sein Produkt: „Vawlt ist eine All-in-One-SaaS-Lösung für die Datenspeicherung in einer Multi-Cloud-Reise, die den Übergang zur Cloud vereinfacht, die Datensicherheitsstandards verbessert und die Nutzung der Speicherressourcen optimiert. Mit maßgeschneiderten Datenvolumina kann Ihr Unternehmen die Kosten effektiv senken, wenn eine große Menge an Datenspeicher benötigt wird. Dank der Fehlertoleranzkapazität und der Zero-Knowledge-Verschlüsselung sind Ihre Daten auch im Falle eines Ransomware-Angriffs stets geschützt.“

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Künstliche Intelligenz in der Archivierung

Generative KI wird die begrenzt einsetzbaren Chatbots ablösen, denn nun kann der Nutzer, der ein Archiv abfragen möchte, durch eine durchdachte Eingabeaufforderung („Prompt“) eine auf seine Anforderungen zugeschnittene Antwort erhalten, als Textausgabe oder in natürlicher Sprache. Auch die Erzeugung von Bildern und Videos aus Text ist inzwischen kein Hexenwerk mehr.

Die Abfrage, die binnen Millisekunden geliefert wird, kann sich auf firmeninterne Wissensdatenbanken oder Archive beziehen und diese kombinieren. So ist es beispielsweise einfach, herauszufinden: „Wer hat den Vertrag mit dem Vertragspartner unterzeichnet?“

Zudem kann die KI eine Filterfunktion erfüllen: Es ist zwar unwahrscheinlich, dass ein Archiv Dokumente enthält, die voller Hassrede, Diffamierung oder Pornografie sind, doch ein umfassendes Dokumentenarchiv zur Zeitgeschichte könnte auch solche fragwürdigen Inhalte umfassen. Ein KI-interner Filter könnte entweder den Zugang oder die Ausgabe einschränken.

Dokumentenmanagement-Software (DMS) und Enterprise-Content-Management-Systeme (ECM) können Archive verwalten und deren Inhalte automatisiert und unabhängig vom Quellsystem bereitstellen. Sie organisieren Zugriffsrechte und Aufbewahrungsfristen oder auch die Versionierung von Dateien. Die Nutzung dieses Wissens erreicht noch nicht das optimale Maß; viele manuelle Prozesse sorgen noch für viel Aufwand an Personal, Zeit und Kosten.

Eine generative KI kann Zusammenfassungen selbständig formulieren und Handlungsempfehlungen erteilen, sobald ein neues Dokument ins Archiv aufzunehmen ist. Denn die KI berücksichtigt nicht nur Kundenakten, sondern auch historische Daten wie Lieferantendaten oder Bonitätsauskünfte. Da die Archivdokumente meist strukturiert sind, kann eine KI sie rascher durchforsten als ein Mensch.

Ablagevorgänge lassen sich automatisieren. Entsprechende Plattformen erlauben die Integration unterschiedlicher Anbieter generativer KI, es gibt aber auch Spezialanbieter, die aus Dokumenten strukturierte Informationen extrahieren können. So lassen sich neue Rechnungen und Bestellungen automatisiert erfassen und ablegen. Sie können spezifischen Workflows zugeführt oder mit ERP- und CRM-Systemen integriert werden. Transparenz und der Grad der Automation werden gesteigert.

Zusammenfassung und Ausblick

Zu den Kernerkenntnissen der Ausführungen in dieser Artikelserie gehört, dass sich alte Technologien wie Tape immer noch bewähren, es aber eine zunehmende Palette alternativer Optionen gibt. Die wichtigste neue Technologie ist wohl die Cloud. Sie ist flexibel zu gestalten, sicher, verschlüsselt und vor allem skalierbar. Lediglich bei den Zugriffszeiten in den kostengünstigsten Speicherklassen muss der Nutzer Abstriche machen.

Auch die Kosten einer Cloud-Lösung können sich mitunter unerwartet entwickeln, so etwa weil sich eine Speicherklasse oder eine Zugriffsgebühr (API-Calls, Egress-Gebühren) ändert. Deshalb sollte der Nutzer so viele Überwachungs- und Nachverfolgungsdienste wie möglich hinzubuchen, um vor bösen Überraschungen sicher zu sein. Das gilt insbesondere auch dann, wenn Spot- und Spot-Flotten-Kapazitäten gebucht worden sind, die nur zeitweilig zur Verfügung stehen. In der Regel warnt der Dienstleister vor einem solchen Ausfall. Dedizierte Kapazitäten können sich vor allem große Unternehmen leisten.

Die meisten Nutzer einer Archivierungslösung verfügen über ein Dokumentenmanagementsystem, ein Enterprise-Content-Management-System oder eine branchenspezifische Archivierungslösung. Auch Endverbrauchern werden verschiedene Archivierungsmöglichkeiten geboten. In jedem Fall sollte der Nutzer auf Cyber- und Zugriffsicherheit, Datenschutz und Compliance achten. Diese Vorgaben können sich laufend ändern, dementsprechend flexibel sollte die Lösung ausgelegt sein.

Tape ist nach wie vor unentbehrlich. Nicht nur lassen sich damit hohe Speicherkapazitäten kostengünstig verwalten, auch der Energieaufwand und Platzbedarf sind minimal. Eine Peta- oder Exabyte-Bandbibliothek kann die Kapazität eines Server-Racks mit mehreren Storage-Appliances ersetzen. Bei letzteren zieht immer mehr SSD-Technologie mit NVMe-Protokoll ein, so dass sehr geringe Latenzzeiten bei hoher Speicherkapazität erzielt werden können. Nur der Preis für solche Appliances lässt so manchen Interessenten noch zurückschrecken.

Die größte Umwälzung in Sachen digitaler Archivierung dürfte wohl Künstliche Intelligenz mit sich bringen. Die Steigerungen an Produktivität und Effizienz können nach Ansicht von Experten auf Anhieb bis zu 30 Prozent erreichen, allerdings nur, wenn es der Nutzer versteht, generative KI in seine Prozesse einzubeziehen. Denn nur dann lässt sich generative KI für die Automation von Abläufen nutzen. Bleibt die Automation aus, erzeugt die KI noch mehr manuelle Abläufe, und das wäre kontraproduktiv.

Bildergalerie
Bildergalerie mit 5 Bildern

Handlungsempfehlungen für Unternehmen

Die bürokratischen Vorschriften für die Erfassung, Verarbeitung, Speicherung und Lieferung von Belegen, Verträgen und anderen Dokumenten werden rasant ausgeweitet. Viele Unternehmer und Endverbraucher klagen darüber. Zumal diese Prozesse nicht nur immer mehr Arbeitszeit verschlingen, sondern auch Investitionen erfordern. Kurzfristige Lösungen mögen Endverbrauchern helfen, aber Unternehmen sollten bei der Auswahl von Archivierungslösungen vorausschauend planen und langfristig investieren.

Die obigen Ausführungen über die Nutzung von Tape, Cloud und KI – von Blockchain ganz zu schweigen – sollen ein paar Hinweise geben, wo sich Potenzial für Einsparungen sowie für höhere Effizienz und Produktivität entwickeln lässt.

Aktuelles eBook

Storage-Software als Effizienzbooster

eBook Storage-Software als Effizienzbooster
eBook „Storage-Software als Effizienzbooster“
(Bild: Storage-Insider)

Mit der geeigneten Storage-Software kann sich ein Unternehmen einen Effizienzbooster ins Haus holen oder in der Cloud abonnieren. Dieser Booster steigert nicht nur die Performance der geschäftskritischen Anwendungen, sondern optimiert auch die Kosten der bereits installierten Speichersysteme.

Die Themen im Überblick:

  • Herausforderungen eines modernen Speichersystems
  • Methoden und Technologien effizienter Speichersysteme
  • Effizienter Speicher mit Pure Storage, AWS, Cohesity und Dell

(ID:50161601)