Deduplizierung

Deduplikation war (neben Cloud Computing und Virtualisierung) eines der meist genutzten Worte der letzten Jahre, wenn es darum ging fortschrittliche Technologien in der Welt der IT zu verdeutlichen.

Doch tatsächlich ist es so, dass in heutigen Unternehmensnetzen eine gigantische Vielzahl an unerwünscht redundanten Daten vorhanden ist. Das beste Beispiel ist dabei sicherlich der E-Mail-Verkehr. Wie oft versenden Sie Excel Tabellen oder Präsentationen als Anhang einer E-Mail an einen Kollegen? Dieser Dateianhang wird dadurch nun nicht nur auf einem Fileserver sondern auch in Ihrem Postausgang und auch dem Posteingang des Kollegen gespeichert, vermutlich noch in einem persšnlichen Netzordner aus der E-Mail heraus gesichert. Bei einem Backup der Serverinfrastruktur beansprucht diese Datei nun ein unnötiges Vielfaches ihrer eigentlichen Kapazität.

Durch Deduplikation ließe sich an dieser Stelle erkennen, dass bereits eine Kopie dieser Datenblöcke besteht und diese müssten somit nicht nochmal gesichert werden. Stattdessen wird auf dem Sicherungsmedium nur ein Verweis zum ursprünglichen Datenblock erstellt.

Unsere Deduplikationsverfahren funktionieren dabei nicht nur auf Datei-Ebene, sondern auf der viel effizienteren Block-Ebene. Dies bedeutet, selbst wenn ein Teil der Datei sich unterscheiden sollte (unterschiedliche Fassungen eines Dokumentes zum Beispiel), so können die gemeinsamen Datenblöcke trotzdem dedupliziert werden. Andere Lösungen würden an dieser Stelle auf Dateiebene nicht merken, dass es "überschüssige" Gemeinsamkeiten in diesen Daten gibt.

Gerade die niedrigen Kosten führen aber dazu, dass die Datenmengen auf den stetig größer werdendenFestplatten kaum noch für ein Backup zu managen sind. Lokaler Speicherplatz in nur wenigen von Hunderten PCs in einem Unternehmen ist heute schon nahezu um den Faktor 10 größer als der Platz auf dem Backup-Server mit teuren Hochleistungsfestplatten oder SAN. Als kritischer Faktor gilt immer noch das Zeitfenster, welches für ein Backup zur Verfügung steht. Je weniger doppelte Daten an den Backup-Server gesendet werden müssen, desto mehr Bandbreite steht anderen Systemen zur Verfügung.

Nichts desto trotz ist die Erfolgsquote einer Deduplikation stark von den verwendeten Daten abhängig und bedarf deswegen einer genauen Analyse im Vorfeld. Sprechen Sie uns an!

Kontaktformular