Das kleine Open-Source-Tool fdupes hilft dabei, in Linux doppelte Dateien zu identifizieren. Dadurch lässt sich Speicherplatz freiräumen. Außerdem verringert die Deduplizierung auch die Menge der zu sichernden Daten und verkürzt das Sicherungsfenster.
Mit Hilfe der Open-Source-Software fdupes lassen sich Daten in Linux deduplizieren.
Das Open-Source-Tool fdupes identifiziert auf Datenträgern und in Verzeichnissen doppelt gespeicherte Dateien und kann diese entfernen. Die Vorteile sind mehr Speicherplatz, kürzere Zeitfenster für Backups und auch kleinere Wartungsfenster.
Das Tool ist interessant für Admins, da es in der Befehlszeile auch über Skripte gesteuert werden kann. Das Programm ist unter der MIT-Lizenz verfügbar, die es erlaubt, die Software frei zu nutzen, zu modifizieren und zu verteilen. fdupes wird ohne Gewährleistung bereitgestellt, der Autor übernimmt also keine Haftung für eventuelle Schäden oder Datenverluste.
Fdupes verstehen
Das Tool fdupes ist ein Programm zur Identifizierung von Duplikaten. Die grundsätzliche Nutzung erfolgt über den Befehl „fdupes“, gefolgt von den entsprechenden Parametern und den Verzeichnissen, die durchsucht werden sollen. Mit den Parametern „-r“ oder „--recurse“ durchsucht fdupes alle Unterverzeichnisse der angegebenen Verzeichnisse. Mit den Parametern „-s“ oder „--symlinks“ folgt fdupes symbolischen Links, und mit „-H“ oder „--hardlinks“ behandelt das Programm Hardlinks als Duplikate, auch wenn diese normalerweise nicht als solche erkannt werden. Die Optionen „-G“ und „-L“ legen dabei eine Mindest- beziehungsweise Höchstgröße der Dateien fest, die berücksichtigt werden sollen, und erlauben so eine Filterung nach Dateigröße.
Durch den Einsatz von „-c“ oder „--cache“ wird der Abgleich beschleunigt, da fdupes die Dateisignaturen in einer Datenbank speichert. Der Parameter „-x“ erlaubt es, spezielle Cache-Optionen wie „readonly“, „prune“, „clear“ und „vacuum“ zu verwenden. Diese Optionen ermöglichen das Lesen von Signaturen ohne Änderungen, das Entfernen verwaister Einträge, das Leeren des Caches oder das Reduzieren der Datenbankgröße.
Um leere Dateien aus der Prüfung auszuschließen, kann „-n“ oder „--noempty“ genutzt werden, während „-A“ oder „--nohidden“ versteckte Dateien ignoriert. Mit „-f“ oder „--omitfirst“ lässt sich die erste Datei eines Duplikatsets aus der Liste der doppelten Dateien ausblenden. fdupes bietet zudem an, Dateien auf einer einzelnen Zeile mit „-1“ oder „--sameline“ anzuzeigen oder die Größe („-S“) und das Änderungsdatum („-t“) der Duplikate auszugeben.
Die Option „-m“ oder „--summarize“ erstellt eine Zusammenfassung der gefundenen Duplikate, während „-q“ oder „--quiet“ die Fortschrittsanzeige unterdrückt. Besonders wichtig sind die Optionen zur Löschung von Dateien. Mit „-d“ oder „--delete“ fordert fdupes den Nutzer auf, Dateien zu behalten oder zu löschen. Hierbei kann es in Kombination mit „--symlinks“ oder mehrfacher Angabe eines Verzeichnisses zu Datenverlust kommen, wenn Dateien versehentlich gelöscht werden. Der Parameter „-D“ oder „--deferconfirmation“ verschiebt die Byte-für-Byte-Bestätigung von Duplikaten auf den Zeitpunkt kurz vor der Löschung. Mit „-P“ oder „--plain“ wird die zeilenbasierte Eingabeaufforderung älterer Versionen genutzt, während „-N“ oder „--noprompt“ automatisch die erste Datei eines Duplikatsets behält und den Rest ohne Rückfrage löscht. Die Option „-I“ oder „--immediate“ löscht Duplikate direkt beim Auffinden, ohne diese zu Gruppen zusammenzufassen, und impliziert „--noprompt“.
fdupes bietet auch die Möglichkeit, Dateien nach bestimmten Kriterien zu sortieren, wie nach Änderungszeit („-o time“), Statusänderungszeit („-o ctime“) oder Dateiname („-o name“). Die Sortierung kann mit „-i“ umgekehrt werden. Mit „-l“ kann eine Logdatei für die gelöschten Dateien erstellt werden.
Mit der geeigneten Storage-Software kann sich ein Unternehmen einen Effizienzbooster ins Haus holen oder in der Cloud abonnieren. Dieser Booster steigert nicht nur die Performance der geschäftskritischen Anwendungen, sondern optimiert auch die Kosten der bereits installierten Speichersysteme.
Die Themen im Überblick:
Herausforderungen eines modernen Speichersystems
Methoden und Technologien effizienter Speichersysteme
Effizienter Speicher mit Pure Storage, AWS, Cohesity und Dell
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.