... und Ihre IT trägt Früchte!

Datenkompression – verlustfrei oder verlustbehaftet

Um große Datenmengen speichern zu können, benötigt man enorm viel Speicherplatz. Wenn der Platz irgendwann voll ist, sorgt man in der Regel für neuen Speicherplatz. Meist in Form von neuen Festplatten, Serversystemen oder ähnlichem. Doch es gibt eine weitere Möglichkeit, um mehr Daten speichern zu können: die Datenkompression.

Datenkompression funktioniert wie ein Kopfkissen, das man zusammendrückt

Bildlich gesprochen funktioniert eine Datenkompression ungefähr so, wie wenn man ein Kopfkissen zusammendrückt. Die ganze Luft zwischen Kissenbezug und Federn wird nicht unbedingt benötigt. Durch das Zusammendrücken komprimiert man das Kissen, indem man die Luft entfernt (so gut es geht) – das Kissen wird kleiner, sprich komprimierter, als vorher.

So ähnlich verhält es mit der Datenkompression. Auch hier werden nicht unbedingt notwendige Elemente, in diesem Fall Daten, entfernt und der Speicherplatz, den die übrigen Daten noch benötigen, wird kleiner.

Verschiedene Kodierungsmethoden der verlustfreien Kompression

Bei der Datenkompression unterscheidet man in verlustfreie und verlustbehaftete Kompression, wobei man nochmals in verschiedene Komprimierungsarten unterteilen kann.
Verlustfreie Kompression findet meist nur bei Textdateien statt. Wenn Text als Zeichenkette und nicht als Bild oder ähnliches gespeichert wird, kann beispielsweise mithilfe der Wörterbuch-Methode Speicherplatz eingespart werden. Hier werden wiederkehrende Zeichenkettenteile einfach durch Abkürzungen ersetzt.

Text:               Hallo Welt. Hallo User.
Kodierung:      X5    Welt.   X5    User.

 

Mithilfe des Run Length Encoding (RLE) werden identische Textbestandteile, die hintereinander stehen, nur einmal abgespeichert. Auch so kann Speicherplatz gespart werden.

Text:              Heute war es schön, schön, schön, und morgen wird es schöner.
Kodierung:   Heute war es        /3/ schön,/            und morgen wird es schöner.

 

Bei einer Entropiekodierung, wie es beispielsweise beim Huffman-Code oder der Arithmetischen Kodierung der Fall ist, werden Textelemente nach ihrer Häufigkeit binär sortiert und codiert, wobei das Element, das am häufigsten vorkommt, die kleinste binäre Zahl erhält.

Mittels jener Zahlen werden die Textelemente dann in einem eigenen Wörterbuch gespeichert.

Text:              WENN HINTER FLIEGEN FLIEGEN FLIEGEN, FLIEGEN FLIEGEN FLIEGEN NACH.
Kodierung:      10        100          1              1              1    101     1             1              1           11

Unterschied zwischen verlustfreier und verlustbehafteter Kompression

Der Vorteil der verlustfreien Kodierung ist klar: Sie gewährleistet, dass man sich alle „wegkomprimierten“ Daten aus dem komprimierten Datenpaket erschließen und wiederherstellen kann.

Neben der verlustfreien Kompression gibt es noch die verlustbehaftete Kompression. Hier werden irrelevante Informationen nicht kodiert, sondern direkt entfernt. Daher spricht man auch von einer Irrelevanzreduktion.

Verlustbehaftete Kompression – das MP3-Format

Diese Vorgehensweise sorgt natürlich unter Umständen für enorm hohe Kompressionsraten. Allerdings werden jene irrelevanten Informationen unwiderruflich gelöscht. Somit ist nach einer Kompression der Ursprungszustand nicht wiederherstellbar.

Häufig werden verlustbehaftete Kompressionen bei Bild-, Audio- und Videodateien angewendet, da hier meist große Volumenaufkommen verwaltet werden müssen. Als klassisches Beispiel gilt in diesem Zusammenhang das MP3-Format. Hier werden bei einer Audio-Datei Frequenzmuster entfernt, die für das menschliche Ohr fast gar nicht hörbar sind. So kann Speicherplatz eingespart werden.

Wenn man Datenpakete komprimiert, kann man die Kapazität der eigenen Datenspeicher also durchaus besser ausnutzen, als mit nicht komprimierten Datenpaketen. Allerdings sollte man sich immer darüber im Klaren sein, welche Art der Kompression man anwendet. Denn nicht immer ist eine verlustbehaftete Kompression wünschenswert.

Weitere Informationen zu Datenkompression:

Verwandte Artikel auf netzorange zum Thema Datenkompression:

Kontakt


* Pflichtfeld
Rückruf


* Pflichtfeld
Termin


* Pflichtfeld