Der Topf des Umweltinnovationsprogramms beim Minister für Umwelt, Naturschutz und Reaktorsicherheit finanziert ein Pilotprojekt der erecon AG. Die Zusage traf am Ende der letzten Woche bei Harald Rossol ein, dem Vorstandsvorsitzenden der erecon AG. Im Projekt geht es darum, mit Hilfe der sogenannten „Datendeduplizierung“ den Speicherbedarf von Rechenzentren erheblich zu reduzieren – um so zugleich die Ressourcen- und Energieeffizienz zu erhöhen. Einsparungen von bis zu 90 Prozent beim Speicherbedarf wie beim Energiebedarf der installierten Datenträger dürften mit Hilfe dieses Verfahrens möglich sein.
Die meisten Menschen machen sich kaum Gedanken über die massive Gleichförmigkeit unserer Datenbestände. Vergleichbar wäre diese große Monotonie mit den 26 Buchstaben unseres Alphabets: Dank einiger weniger Symbole bauen wir alle Literatur, alle Publizistik, sogar unsere Sprache und unsere Kultur auf diesen 26 Pfeilern auf. Auch hier handelt es sich um eine wiederkehrende Datenstruktur, die aber eine enorme Vielfalt erzeugen kann, selbst wenn bestimmte Bruchstücke oder –Datenketten– wie z.B. „das“, „ein“, „-tion“, „-ung“ oder „-keit“ tausendfach in allen Texten wiederholt werden.
Ähnlich ist es mit den Datenbeständen der virtuellen Welt. Auch hier kehrt das meiste ständig wieder. Durch eine intelligente Zerlegung des Datenstroms ist es deshalb möglich, diesen –Flow– so zu zerlegen, dass gleichförmige Strukturen nur noch einmal unter einer einzigen physikalischen Adresse vorhanden sind, während ein schlichter –Zeiger– diese eine Datei zahllosen Fundstellen zuweist. Ein solcher Vorgang heißt –Deduplizierung– – aus dem Bereich der Datensicherung ist er uns längst bekannt.
Neu aber ist es, den Datenstrom schon im Moment seines Entstehens zu –zerlegen–. Gleichförmige Daten wären dann von Anfang an nur einmal im Speicher vorhanden. Das Bundesumweltministerium schreibt in seiner Presseerklärung zur Bewilligung:
„Das Unternehmen führt zu diesem Zweck die neuartige Inline-Daten-Deduplizierung ein. Bei diesem innovativen Verfahren werden die zu speichernden Daten bereits während des Speichervorgangs in einzelne Dateifragmente zerlegt und mittels eines Algorithmus auf bereits bestehende Fragmente untersucht. Dadurch entfällt die Zwischenspeicherung der Daten und es werden nur solche Fragmente gespeichert, die tatsächlich noch nicht vorhanden sind.“
Sollte das Projekt sich als erfolgreich und betriebssicher bewähren, dann wäre für die Wirtschaftlichkeit, die Energieeffizienz und die Nachhaltigkeit im Bereich der Green IT wieder ein enormer Fortschritt erreicht.