Metadaten

Der Begriff Metadaten ist seit einigen Jahren in aller Munde. Heutzutage nutzen weltweit Milliarden von Menschen digitale Medien. Dabei fallen laufend große Mengen an Metadaten an. Zur Beschreibung des sich daraus ergebenden Datenschutzrisikos wird manchmal der Begriff des „gläsernen Bürgers“ verwendet.

Die Auswertung von Metadaten durch künstliche Intelligenz liefert Vorhersagen über das Verhalten von Menschen. Perspektivisch ergibt sich daraus eine ernstzunehmende Bedrohung für die Privatsphäre der Bürger und die gelebte Demokratie. Dabei sind Metadaten für sich genommen nichts Schlimmes. Worum es sich bei Metadaten tatsächlich handelt, erklären wir in diesem Artikel.

Um sich den Begriff Metadaten besser vertraut zu machen, stellen Sie sich ein einfaches Beispiel vor: Sie verschicken einen Brief auf dem Postweg. Dann entspricht das im Briefumschlag enthaltene Schriftstück den eigentlichen, primären Daten. Diese sind privat und vor dem Zugriff durch Dritte gesetzlich besonders geschützt — es greift das Briefgeheimnis.

Der Briefumschlag enthält die Metadaten des Briefes. Es handelt sich um zusätzliche Daten, welche die primären Daten begleiten:

Anschrift und Absender
Briefmarke, Poststempel
ggf. weitere Markierungen wie Strichcodes

Wie Sie sehen, handelt es sich insgesamt um Daten, welche den Versand des Briefes erst ermöglichen. Die Metadaten des Briefes sind auf der Außenseite für jeden frei einsehbar. Damit sind sie durch das Briefgeheimnis nicht besonders geschützt, wobei das Postgeheimnis auch für sie gilt.

Worin beruht nun die Gefahr, welche von Metadaten ausgeht? Für sich genommen ist es nicht problematisch, wenn einzelne Metadaten lesbar sind. Hat beispielsweise ein Dritter Wissen über einen einzelnen Briefumschlag erlangt, ist dies in der Regel kein Anlass zur Sorge. Jedoch verhält sich dies in der Summe, bei massiver Speicherung und Auswertung anders. Dann zeichnen sich Muster ab, die viel über das Verhalten eines Menschen verraten: Wer hat wann mit wem kommuniziert? Man kann so Netzwerke und Kommunikationsketten erkennen.

Die Unterscheidung zwischen Daten und Metadaten ist fließend. Die Einordnung hängt vom Kontext und der jeweiligen Perspektive ab. Dazu ein weiteres Beispiel. Ein Buch enthält primäre Daten, wie den Titel des Buches und dessen Inhalt. Weiterhin liegen für die Veröffentlichung eines Buches eine Reihe von Metadaten vor:

Autor
Verlag
Datum und Ort der Veröffentlichung
Auflage
ISBN

Stellen wir uns vor, Metadaten vieler Veröffentlichungen werden in einer Datenbank gesammelt. In Bezug auf eine solche Datenbank wären die Veröffentlichungsinformationen primäre Daten. Dazu käme für jede Veröffentlichung ein neuer Satz Metadaten. Beispielsweise könnte in der Datenbank für jede Veröffentlichung hinterlegt sein, wann und von welchem Benutzer ein Eintrag hinzugefügt wurde.