Meine Merkliste Geteilte Merkliste PDF oder EPUB erstellen

Offenheit in der Probephase - über das Potential von Open Data | Open & Big Data | bpb.de

Offenheit in der Probephase - über das Potential von Open Data

Michael Hörz

/ 4 Minuten zu lesen

Offene Daten sind nützlich. Richtig verarbeitet können sie für mehr Transparenz sorgen oder von Entwicklern genutzt werden, um intelligente Anwendungen zu entwickeln. In manchen Ländern wie den USA ist die Offenlegung von Verwaltungsdaten daher bereits gesetzlich festgelegt. In Deutschland (noch) nicht. Michael Hörz sagt, es braucht auch hierzulande eine verbindliche Open Data Strategie.

Offen Daten sind eine Chance für staatliche Institutionen wie Bürger/-innen. (CC, Antti T. Nissien) Lizenz: cc by/2.0/de

Offenheit in der Erprobungsphase

Bereits im Mai 2013 legte US-Präsident Barack Obama fest, dass Daten von Regierungsbehörden künftig standardmäßig offen veröffentlicht werden müssen (“Externer Link: open by default”). Dies betrifft nicht-persönliche Verwaltungsdaten, die jeder Bürger uneingeschränkt nutzen darf, etwa Zahlen zu Gesundheitsausgaben oder digitales Kartenmaterial.

Der Nutzen aus offenen Daten ist ihre leichte Verarbeitbarkeit und ein möglicher Erkenntnisgewinn – Bürger wie Unternehmen können sie verwenden, auswerten und etwa sehen, wie hoch Regierungsausgaben im Detail sind. Wie weit diese Transparenz gehen kann, zeigt die Stadt Chicago, die sämtliche städtische Externer Link: Gehälter mit Namen veröffentlicht. Wichtig ist dabei immer die Frage: Wie können die Daten nutzbar gemacht werden? Beispiele dafür sind visuelle Externer Link: Aufbereitungen öffentlicher Haushalte, von Externer Link: Unfall-Schwerpunkten oder auch Anwendungen, die mit Hilfe von Miet-, Schul- und weiteren Daten Eltern ermöglichen, den Externer Link: bestmöglichen Wohnort für die ganze Familie zu finden.

Wichtige Voraussetzung für die Verarbeitung offener Daten ist dabei auch das Format: Bislang wurden Daten häufig als PDFs veröffentlicht, weil Menschen sie leicht verstehen können. Wenn jedoch Computer aus den Daten schlau werden sollen, stoßen sie dabei schnell an ihre Grenzen. Daher müssen offene Daten auch immer maschinenlesbar sein, also in einem Format wie Excel vorliegen.

Open Data - in Deutschland noch in den Kinderschuhen

In Deutschland liegt zurzeit kein Plan vor, der mit dem US-Vorhaben vergleichbar wäre. Einzelne Bundesländer wie Berlin, Hamburg oder Bremen waren in den vergangenen Jahren Vorreiter, nach Daten anderer Ländern suchen Nutzer auf Datenportalen bislang vergeblich. Gebündelt sind die offenen Daten bei Externer Link: GovData.de, das im Frühjahr 2013 an den Start ging. Auf der Internetplattform finden sich Daten von Bundeseinrichtungen, Ländern und auch kleinen Städten wie etwa Moers. Das Portal ist noch in der Erprobungsphase – Ende 2013 wurde es bewertet und soll nach einigen Verbesserungen in den Regelbetrieb übergehen.

Tatsächlich ist auch ganz Deutschland in Sachen Open Data in einer Erprobungsphase. Manche Daten liegen nur in einem schlecht nutzbaren Format vor, andere sind schlecht beschrieben und tauchen daher kaum in den Suchergebnissen auf. Damit sich das ändert braucht es zentrale Festlegungen für eine Open-Data-Infrastruktur in Deutschland. Also Rahmenbedingungen die bestimmen, welche Daten wichtig sind, in welchen Formaten und mit welchen Beschreibungen sie minimal veröffentlicht werden müssen.

Hoffnung macht grundsätzlich die Externer Link: Open-Data-Charter der G8-Staaten, die festlegt, dass bis 2015 eine festgelegte Zahl von Datensätzen offen werden muss. Diese sind allesamt wichtige Daten, etwa Haushalte, digitale Karten oder Unternehmensregister. Unter anderem einigten sich die Staaten auch darauf, bis wann sie welche Schritte unternommen haben müssen. Bis Ende 2013 sollte eigentlich ein Ablaufplan für jedes Land stehen, in Deutschland hat sich die Umsetzung wegen der Koalitionsverhandlungen über den Jahreswechsel verzögert.

Die Verwaltungsdaten häufen sich – wie Open Data zu Big Data wird

Die Zahl der Daten auf Portalen und innerhalb von Behörden wächst immer weiter. Nicht immer wird man aus ihnen auf den ersten Blick schlau, einige Datensätze können mehrere Millionen Einträge haben. Dazu braucht es Big-Data-Werkzeuge, die etwa Unternehmen zur Auswertung enormer Datenmengen verwenden. Big Data können erweiterte Zugriffsdaten einer Website sein oder Detaildaten zum Gesundheitssystem. Sie sind im Gegensatz zu Open Data nicht frei zugänglich, da sie häufig nicht anonymisiert sind. Aus solchen Daten lassen sich teilweise in Echtzeit Muster und Zusammenhänge erkennen. Möglich machen das leistungsfähige Rechner und Software die hilft, die Daten „lesbar“ zu machen.

Der Online-Streamingdienst Netflix etwa nutzte seine ausführlichen Nutzerdaten, um die Erfolgschancen einer selbst produzierten Serie einzuschätzen. Im Gegensatz zu repräsentativ erhobenen Einschaltquoten konnte Netflix auf die genauen Abrufzahlen für jedes einzelne Video der Website zugreifen und so erkennen, welche Inhalte besonders gut bei den Nutzern ankommen. Eine Konsequenz daraus war die von Netflix produzierte Serie „House of Cards“, Externer Link: die zu einem großen Erfolg für das Portal wurde. Für Netflix sind die Daten ein wertvolles Gut, deswegen geben sie diese auch nicht heraus: Über die Nutzungszahlen der Serie ist nichts zu erfahren.

Big Data ist im Umfeld von Open Data nicht unproblematisch: Niemand dürfte etwas dagegen haben, etwa aus unzähligen Wetterdaten interaktive Karten zu programmieren, die Wetter-Rück- und Ausblicke bis auf Ebene von Ortsteilen ermöglichen. Andererseits halten Behörden viele Daten bisher nebeneinander vor, die mit Hilfe der Big-Data-Technologie nun in Zusammenhang gebracht werden können. Die Technologie ermöglicht durch das Kombinieren vieler Daten eine De-Anonymisierung an sich anonymer Daten – Merkmale lassen sich durch Verkettung wieder zuordnen. Eine Nutzungsmöglichkeit, die zum Zeitpunkt der Datenerhebung zumeist noch gar nicht angedacht war.

Damit weckt Big Data insbesondere bei Kriminalisten Begehrlichkeiten. Sie hoffen darauf, sich unterschiedlichste Quellen zu erschließen, um Verbrechen schon zu erkennen, ehe sie begangen werden. Derartiges verstößt zurzeit aber noch gegen deutsche und europäische Datenschutzregeln wie die Zweckbindung von Daten und die informationelle Selbstbestimmung.

Die Konsequenzen von Big Data für den Einzelnen können groß sein. Was es braucht ist Aufklärung darüber, welche Daten wirklich erhoben werden und wie sie weiterverarbeitet werden. Für eine bessere Verkehrsregelung oder medizinische Fortschritte würden viele ihre Daten hergeben, für Werbung dagegen nicht.

Zum Weiterlesen:

Michael Hörz

Michael Hörz lebt und arbeitet in Berlin. Er ist Redakteur, Journalist und Dozent für Internationale Medieninformatik an der Hochschule für Technik und Wirtschaft in Berlin. Vor allem interessiert er sich für alles, was mit Daten zu tun hat: Daten finden, aufbereiten, visualisieren, kontextualisieren und mit ihnen zu erzählen.

Externer Link: http://www.michael-hoerz.de

Weitere Inhalte

Weitere Inhalte

Dossier

Open Data

Open Data steht für die Idee, Daten öffentlich frei verfügbar und nutzbar zu machen. Welches Potential verbirgt sich hinter den Daten, die Behörden und Ministerien, Parlamente, Gerichte und andere…

Netzdebatte - Zukunft der Arbeit

Debatte bedingungsloses Grundeinkommen

Was wäre, wenn jede_r von uns jeden Monat vom Staat einen festen Betrag aufs Konto überwiesen bekäme - ohne etwas dafür tun zu müssen? Das ist, vereinfacht gesagt, die Idee eines Bedingungslosen…

Netzdebatte - Zukunft der Arbeit

Pro und Contra zur Robotersteuer

Machen uns Roboter in Zukunft überflüssig? Oder schaffen sie neue Freiräume? Gewiss ist, dass die Automatisierung unsere Arbeitswelt verändern wird. Wie Politik, Gesellschaft und Wirtschaft darauf…

Debatte

Open & Big Data

Open und Big Data - zwei Begriffe, deren Bedeutung für die Gesellschaft momentan sehr unterschiedlich verhandelt wird. Während Open Data in der öffentlichen Wahrnehmung zumeist für Offenheit und…

Michael Hörz lebt und arbeitet in Berlin. Er ist Redakteur, Journalist und Dozent für Internationale Medieninformatik an der Hochschule für Technik und Wirtschaft in Berlin. Vor allem interessiert er sich für alles, was mit Daten zu tun hat: Daten finden, aufbereiten, visualisieren, kontextualisieren und mit ihnen zu erzählen.

Externer Link: http://www.michael-hoerz.de/