Mobile-Menu

Speichertipp: Leistungsfähige Datenbereinigung durch Duplicate-Erkennung mit rmlint Speicherplatz und Systemintegrität optimieren

Von Thomas Joos 3 min Lesedauer

Anbieter zum Thema

Das Tool rmlint stellt eine effiziente Lösung zur Erkennung von Speicherplatzverschwendung und beschädigten Dateien im Dateisystem bereit. Mit einer Vielzahl an Optionen ermöglicht es, doppelte Dateien, leere Verzeichnisse und beschädigte Symlinks aufzuspüren und zu entfernen, was für eine nachhaltige Speicherplatzverwaltung sorgt.

Mit dem Tool rmlint lässt sich ein nachhaltiges Storage-Ressourcenmanagement erreichen.(Bild:  ©DAPA Images via Canva.com)
Mit dem Tool rmlint lässt sich ein nachhaltiges Storage-Ressourcenmanagement erreichen.
(Bild: ©DAPA Images via Canva.com)

Das Tool rmlint kann unnötige Dateien und defekte Einträge im Dateisystem identifizieren. Zu den Kernfunktionen gehört die Erkennung von Duplikaten, defekten Symlinks sowie Dateien mit ungültigen Benutzer- oder Gruppenkennungen. Darüber hinaus spürt das Tool ungenutzte Dateien wie leere Verzeichnisse und Binärdateien ohne Debug-Informationen auf. Durch die Bereinigung solcher Elemente verbessert rmlint nicht nur die Speicherplatzausnutzung, sondern trägt auch zur Integrität und Ordnung im Dateisystem bei. Am Beispiel von Ubuntu erfolgt die Installation mit:

sudo apt install rmlint

Die Möglichkeiten von rmlint

Das Open-Source-Tool rmlint bietet eine hohe Flexibilität bei der Dateiverarbeitung und nutzt dafür verschiedene Hash-Algorithmen zur Duplikaterkennung. Optional lässt sich eine byteweise Überprüfung aktivieren, um absolute Genauigkeit bei der Dateivergleichung zu gewährleisten. Die Auswahl des Hash-Verfahrens ermöglicht es, zwischen Geschwindigkeit und Genauigkeit abzuwägen, was insbesondere bei großen Dateimengen vorteilhaft ist. Anwender können außerdem gezielt bestimmen, welche Dateien als „Original“ behalten und welche Duplikate entfernt werden sollen. Diese Auswahloption erlaubt eine präzise Kontrolle über die Bereinigungsprozesse und verhindert versehentliches Löschen wichtiger Dateien.

Bildergalerie

Ein weiterer Vorteil von rmlint liegt in der Option, nur kürzlich hinzugefügte Dateien zu scannen. Durch die Speicherung des letzten Scanzeitpunkts reduziert das Tool bei wiederholten Scans den Zeitaufwand erheblich, indem nur neue oder geänderte Dateien analysiert werden. Diese Funktion eignet sich besonders für die kontinuierliche Wartung umfangreicher Dateibestände, da sie die Effizienz des Scanvorgangs maximiert und redundante Berechnungen vermeidet.

Auch die Eingabefilter von rmlint tragen zur Anpassungsfähigkeit bei. Mit spezifischen Befehlen lässt sich die Überprüfung auf bestimmte Dateitypen oder -größen beschränken. So ist es möglich, nur Dateien innerhalb eines definierten Größenbereichs zu analysieren oder das Tool auf bestimmte Dateiformate wie PNG-Dateien einzuschränken. Die gezielte Filterung minimiert den Rechenaufwand und beschleunigt die Analyse, was bei großen Dateisätzen einen erheblichen Performancegewinn bringt.

Datenträgernutzung mit rmlint prüfen

Neben den reinen Scanfunktionen stellt rmlint umfangreiche Möglichkeiten zur Berichterstellung bereit. Standardmäßig erstellt das Tool eine Shell-Skriptdatei, die die identifizierten Duplikate und andere Speicherplatzverschwender mit vorbereiteten Löschbefehlen listet. Das Skript kann vor der Ausführung überprüft und bearbeitet werden, was ein hohes Maß an Kontrolle über die endgültigen Löschaktionen gewährleistet. Zusätzlich zur Standardausgabe lassen sich Berichte in verschiedenen Formaten wie JSON oder einfachen Textdateien erzeugen, um die Scanergebnisse individuell anpassbar und leicht weiterverarbeitbar zu machen.

Für die Verwaltung großer Dateisammlungen bietet rmlint zudem die Möglichkeit, über die Konfigurationsoptionen die Fortschrittsanzeige zu aktivieren. Diese Funktion hilft Anwendern, den Fortschritt bei langen Scanvorgängen zu überwachen, ohne in einer großen Menge an Dateiausgaben den Überblick zu verlieren. Gerade bei Scans von Millionen von Dateien schafft diese visuelle Unterstützung eine strukturierte Arbeitsumgebung.

Mit erweiterten Optionen zur Datumssteuerung lassen sich zudem Dateien nach dem letzten Änderungszeitpunkt filtern. Diese Funktion bewährt sich bei inkrementellen Scans oder bei Anwendungen, in denen nur neu hinzugefügte Dateien untersucht werden sollen. Die Zeiteinsparung wird durch die Möglichkeit erreicht, die älteren Dateien zu überspringen und nur aktuelle Dateisystemänderungen zu prüfen.

Aktuelles eBook

Open-Source-Storage – Speicher-Software zum Nulltarif

eBook Open-Source-Storage
eBook „Open-Source-Storage“
(Bild: Storage-Insider)

Der Bedarf an Speicherkapazität steigt von Tag zu Tag – nicht nur, um die Daten von Produkten, Kunden und Transaktionen zu sichern, sondern auch, um Compliance-Anforderungen zu erfüllen und Auditierungen gut zu überstehen. Eine leistungsfähige Storage-Lösung ist also gefragt. Eine kostenlose Option bietet Open-Source-Software für Storage, insbesondere dann, wenn man sie selbst den eigenen Anforderungen anpassen darf.

Die Themen im Überblick:

  • Warum Storage als Open Source?
  • NAS & Objektspeicher
  • Backup & Disaster Recovery
  • Dateisysteme
  • Technologiestapel & Ökosysteme

(ID:50220621)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung