Der erste Flug mit Hilfe eines Autopiloten wurde auf der Pariser Weltausstellung 1914 gezeigt; was damals ein faszinierendes Novum war, ist heute selbstverständlich. Inzwischen steuert ein Pilot bei einem durchschnittlichen Flug die Maschine nur noch rund drei Minuten selbst. "Big Data" nimmt inzwischen auch in Autos immer größeren Platz ein: Geschwindigkeit, Abstand, Bremsen, Spurtreue – die Palette der Hilfsfunktionen wird immer größer und akzeptierter. In einem Pkw ist heute mehr Informationstechnologie verbaut als in der Apollo-Rakete, die 1969 auf dem Mond landete. Genauso hat sich die Medizin weiterentwickelt; den medizinischen Autopiloten gibt es jedoch (noch) nicht – oder doch?
Wenn wir Big Data in der Medizin verstehen wollen, ist ein weiter Blick notwendig, schließlich geht es um die Automatisierung des (medizinischen) Alltags. Und Automatisierung, so der Psychologe Raja Parasuraman, "ersetzt menschliche Tätigkeiten nicht einfach, sondern verändert sie, und dies oft in einer Art und Weise, die ihre Entwickler weder beabsichtigten noch vorhersahen". Auf dem Weg dorthin geht es also um weit mehr als um technische Machbarkeit. Big Data – auch in der Medizin – verändert die Welt vielleicht stärker, als wir bisher verstehen, uns wünschen oder wahrhaben wollen.
Alter Wein in neuen Schläuchen?
Die Wissenschaftlichen Dienste des Deutschen Bundestags erläutern im "Aktuellen Begriff" zu Big Data: "Nach Schätzungen des McKinsey Global Institute wären durch den Einsatz von Big Data allein im US-amerikanischen Gesundheitswesen Effizienz- und Qualitätssteigerungen im Wert von ca. 222 Mrd. € und für den gesamten öffentlichen Sektor in Europa von jährlich 250 Mrd. € möglich. Das Besondere bei Big-Data-Analysen ist vor allem die neue Qualität der Ergebnisse aus der Kombination bisher nicht aufeinander bezogener Daten."
Unser Gesundheitssystem besteht derzeit allerdings noch zu einem großen Teil aus Papier. Der Digitalisierungsgrad und damit die Menge an digitalen Daten in der Medizin wachsen jedoch enorm. Dafür gibt es drei wesentliche Gründe: Erstens gibt es eine Vielzahl neuer diagnostischer Instrumente, nicht nur in der Genetik, auch in bildgebenden Verfahren – hier entstehen riesige Mengen neuer digitaler Daten. Zweitens bringen Patientinnen und Patienten heute immer mehr Daten selbst mit. Alltagsdaten, die es früher so gar nicht gab, werden nun mittels Smartphone oder einfacher Sensoren gesammelt und gespeichert. Drittens ist die Digitalisierung an sich Treiber für Innovationen.
Im Krankenhauskontext – dieser Bereich steht beispielhaft für die gesamte Gesundheitswirtschaft – werden jedoch schon seit Langem Daten erzeugt, gesammelt und ausgewertet. Handelt es sich bei der großen Digitalisierung also im Grunde nur um alten Wein in neuen Schläuchen? Was ist neu und erklärt die Aufregung um Big Data? Folgende drei Faktoren könnten eine Erklärung bieten:
1. Technologisch gibt es heute die Möglichkeit, riesige Datenmengen in kürzester Zeit zu verarbeiten. Das war bis vor wenigen Jahren unvorstellbar. Das bedeutet, dass (fehlende) Technologien praktisch kein Hindernis mehr darstellen.
2. Dazu kommt in jedem Krankenhaus etwas, das "Siloerfahrung" genannt werden kann. Daten sind in so vielen einzelnen und separaten Systemen verteilt und verborgen, dass es sowohl bei Ärzten und Forschern als auch bei Controllern und im Managemant den Wunsch gibt, diesen zersplitterten "Datenschatz" zu heben und mit den neuen Daten zusammenzuführen.
3. Durch die neuen Technologien ergeben sich neue Anwendungsmöglichkeiten. Ein Beispiel dafür könnten wissensbasierte Programme sein, die durch das Zusammenführen großer Informationsmengen einen Behandlungsprozess wirklich "coachen" könnten.
Der Begriff "Big Data" führt alle diese Faktoren zusammen. Big Data ist damit zentral mit der Integration von verschiedenen Perspektiven verbunden: Medizincontrolling sollte auch unter Qualitätsgesichtspunkten gesehen werden – nicht nur unter monetären. Qualitätssicherung und evidence-based medicine müssen sich umgekehrt auch ökonomischen Dimensionen stellen. Die traditionelle Trennung zwischen Management (Finanzen), Medizin (Klinik) und potenziell auch Forschung gilt es aufzuheben. Diese Forderung ist vielleicht nicht neu – aber unter den neuen Voraussetzungen von Big Data ist es vielleicht das erste Mal realistisch, dass sie umgesetzt wird. Um im Bild vom alten Wein zu bleiben: Wir haben heute nicht nur neue Schläuche, sondern – zumindest potenziell – eine hochmoderne Abfüllstation. Und die ermöglicht nicht nur "alten Wein" für alle, sondern viele verschiedene, auf individuelle Geschmäcker abgestimmte Getränke.
Big-Data-Framework
Um einen Überblick zu erhalten, welche Szenarien im Kontext von Big Data in der Medizin möglich sind, habe ich die verschiedenen Dimensionen in einem Framework zusammengestellt. Im Folgenden werden die Bereiche (in der Abbildung von unten nach oben) kurz erklärt:
Unter Governance sind vor allem organisatorische und rechtliche Rahmenbedingungen zu verstehen. Diese können sich auf die einzelne Institution beziehen, aber auch auf nationale oder internationale Rahmenbedingungen. Dazu zählen insbesondere der Datenschutz, die IT-Sicherheit sowie die Möglichkeiten informationeller Selbstbestimmung. Dies umfasst technische, rechtliche, aber auch soziale und organisatorische Elemente.
Die Datenquellen im medizinischen Kontext sind vielfältig: Zum einen gibt es die medizinischen Daten, wie sie primär in Krankenhäusern vorliegen. Dazu lassen sich Daten von öffentlichen Einrichtungen ergänzen oder korrelieren – zum Beispiel von Gemeinden, Gesundheitsämtern, Ministerien oder auch internationalen Organisationen. Weitere Quellen sind natürlich die Krankenkassen (etwa was die Inanspruchnahme von Leistungen angeht) oder andere Versicherungen. Eine weitere Rubrik stellen Forschungsdaten dar, die oft sehr spezielle Ausprägungen haben und in der Regel unter besonderen ethischen und datenschutzrechtlichen Anforderungen erhoben wurden. Individuelle, durch Patienten generierte Daten (zum Beispiel aus Schmerztagebüchern oder über Sensoren erfasste Daten) sind heute größtenteils noch nicht Teil des Gesundheitssystems, werden aber deutlich an Bedeutung zunehmen. Keine Rolle spielen bislang die sogenannten nicht-traditionellen Marktteilnehmer (non-traditional players), also soziale Netzwerke, Mobilfunkanbieter oder auch Einzelhändler.
Unter Infrastruktur sind primär physikalische Voraussetzungen für Datentransport und -speicherung zu verstehen, etwa Datenleitungen oder Endgeräte wie PCs oder Smartphones. Die Dimension Datensammlung und Archivierung hat in der Medizin eine besondere Bedeutung – zum einem unter dem Aspekt der Datensicherheit, aber auch hinsichtlich der rechtlichen Anforderungen der Langzeitarchivierung. Datenmanagement bedeutet unter anderem die Integration von Daten, damit sie bestimmten Standards genügen und kompatibel ausgetauscht werden können. Aber auch die Rollenzuweisung und Zugriffskontrolle, um festzulegen, wer welche Daten wie nutzen darf, gehört in diesen Bereich.
Die letzte Dimension im Framework ist das eigentliche Zusammenführen der Daten, um sie den verschiedenen Nutzergruppen präsentieren und analysieren zu können. Sie bildet damit die "Oberfläche". Daten können hier "nur" angezeigt werden, bestimmte Konstellationen können aber auch als Entscheidungsunterstützung dienen. Künftig ist denkbar, dass Algorithmen Handlungen nicht nur empfehlen, sondern selbst veranlassen (etwa in der Intensivmedizin).
Handlungsfelder
Aus den Dimensionen des Frameworks ergeben sich die Handlungsfelder für Big-Data-Anwendungen in der Medizin. Sie sind schon heute vielfältig, und künftig werden weitere Szenarien möglich sein, die noch vor Kurzem geradezu unvorstellbar waren. Die wichtigsten möglichen Handlungsfelder sollen im Folgenden skizziert werden.
Unter Health Education und Information fallen alle Bereiche, die Daten für unterschiedliche Akteure (neu) zusammenstellen oder erweitern. Beispiele hierfür sind das Re-Design von Disease-management-Programmen oder auch die Quantified-self-Ansätze (Daten, die von Patienten oder Bürgern primär selbst erhoben werden, teilweise mit eigenen Sensoren oder Apps).
Die datengestützte Analyse des Inputs (Ressourcen) ermöglicht zudem neue Formen der finanziellen Ressourcensteuerung und damit auch des Outputs (medizinische Qualität, Effektivität). Dies erleichtert zum Beispiel organisationsbezogene Ansätze wie pay-per-performance, bei dem die Qualität der medizinischen Behandlung stärker mit der Bezahlung gekoppelt wird, oder das Design von neuen, integrierteren Versorgungsformen zum Beispiel im Rahmen einer stärkeren Verzahnung von ambulanten und stationären Leistungen.
Im Rahmen von Public Health Monitoring könnten zum Beispiel im Falle von Epidemien bestimmte kollektive oder individuelle Gesundheitsmaßnahmen schneller und gezielter in die Wege geleitet werden. Ein bekanntes Beispiel ist "Google Flu Trends", dessen Ziel es ist, die Verbreitungen von Erkältungen durch die Analyse bestimmter Suchbegriffe besser vorherzusagen. Ein anderes Beispiel ist der Versuch, die Verbreitung des Ebola-Fiebers anhand der Diskussionen in sozialen Netzwerken besser nachvollziehen und auch hier gezielter intervenieren zu können.
Das unmittelbare Feedback durch subjektive und objektive Daten von Geräten und Patienten könnte auch zur Produktentwicklung beitragen – etwa in Form neuer Services im Betreuungsbereich, aber auch mit Blick auf besseres medizinisches Gerät. Für Unternehmen, die bisher nicht zu den "traditionellen Playern" gehören, könnten sich ganz neue Geschäftsfelder ergeben: etwa für die Post, die Pflegeservices übernimmt, für den Supermarkt, der Teil eines Diätprogramms wird, oder für den Telekommunikationskonzern, der telemedizinische Services anbietet.
Ein Beispiel für den Versuch verbesserter Prognosen von Krankheiten ist der Individual-health-analytics-Ansatz, bei dem alltägliche Daten aus der Lebenswelt der jeweiligen Person integriert werden. Hierdurch könnte auch ein besseres Verständnis von bestimmten Krankheiten erzielt werden. Diese Analyse von Daten – zum Beispiel im Zusammenspiel mit anderen Informationen aus dem sozialen oder beruflichen Umfeld – ermöglicht perspektivisch eventuell raschere und zielgerichtetere Formen der Prävention von Krankheiten und Epidemien.
Disease-management-Programme, worunter insbesondere Programme für chronisch Kranke zu verstehen sind (etwa an Asthma oder Diabetes Erkrankte), könnten durch den Einsatz von Big Data zukünftig individualisierter angeboten werden. Die Rekrutierung für klinische Studien sowie die "Simulation" von Daten würde zudem neue, schnellere Studienformen ermöglichen und bed and bench (Klinik und Forschungslabor) besser miteinander vernetzen. Die schnellere Implementierung von Evidenz könnte ebenfalls ein wichtiger Fokus von Big-Data-Anwendungen sein. Ein wichtiges Problem in der Medizin ist die Umsetzung von aktuellem Wissen aus der Forschung oder aus Leitlinien. Bisher dauert es oft viele Jahre, bis das Wissen, das in modernen Forschungseinrichtungen etabliert ist, "in die Breite" getragen wird.
Ein weiteres Handlungsfeld ist die medizinische Performance-Optimierung. Hier könnte Big Data zum Beispiel die bessere Umsetzung von aktuellen Leitlinien ermöglichen (coach the doctor/medical decision support). Big Data kann Patienten möglichweise die richtige Leitlinie oder die passende klinische Studie zuordnen und anbieten – und damit eine umfangreiche Suche abkürzen.
Die neuen Formen digitaler Entscheidungsunterstützung würden nicht nur neuartige Visualisierungen umfassen, sondern beispielsweise auch die bessere Integration genetischer und klinischer Daten sowie neuester Forschungsdaten. Nicht zuletzt könnten Big-Data-Szenarien auch einen besseren Schutz vor Behandlungsfehlern ermöglichen. Ein Beispiel sind Lösungen aus dem Bereich Arzneimitteltherapiesicherheit (AMTS) – hier überprüfen Programme unter anderem, ob eingenommene Medikamente sich gegenseitig ausschließen, interagieren können oder ob etwa die Dosierung angepasst werden müsste.
Neue Möglichkeiten würden sich auch auf dem Feld der Adhärenz ergeben. Adherence (engl. für Einhaltung, Befolgung) bedeutet, dass Patienten sich (besser) an die mit dem Therapeuten vereinbarten Empfehlungen halten – etwa, was die Einnahme von verschriebenen Medikamenten oder ein Diätregime betrifft.
Durch die Integration von Kennzahlen sind schließlich bessere Coaching- oder Kontrollszenarien denkbar, die stärker auf individuelle oder geografische Komponenten eingehen können. Beispiele sind hier Apps, die die Luftbelastung (Stickstoff, Pollenflug) messen und einzelnen Orten zuordnen – für Allergiker oder Asthmatiker schon heute ein nützliches Werkzeug, ebenso wie potenziell für Gesundheitsbehörden, die hier kurzfristig auf Veränderungen reagieren könnten.
Noch ein Handlungsfeld ist schließlich der Informationsaustausch zwischen Arzt und Patient (sowie zwischen Krankhaus- und niedergelassenen Ärzten). Hier ist zum Beispiel an telemedizinische Services oder Echtzeit-Datenanalysen über Sensoren zu denken. Hier sind sowohl Szenarien möglich, die stärker prozessual ansetzen (zum Beispiel Diabetes-Monitoring), als auch Anwendungen, die die schon existierenden Daten kumulieren und analysieren. Für den digitalen Informationsaustausch von Patient zu Patient gibt es bereits zahlreiche Beispiele. Eines der bekanntesten ist die Internetplattform "Patientslikeme", auf der Patienten andere Patienten mit ähnlichen Symptomen und Erfahrungen finden und sich mit ihnen austauschen können (peer to peer).
Wie können die zahlreichen skizzierten Handlungsfelder von Big Data in der Medizin nun strukturiert und systematisiert werden? Es bietet sich hierfür die folgende Einteilung in eine horizontale, eine vertikale und eine temporäre Dimension an:
1. Horizontale Dimension: Hierunter könnte man die bessere Integration von Daten entlang der Behandlungskette sehen. Damit ist nicht nur die Verbindung von ambulanter, stationärer und rehabilitativer Therapie gemeint, sondern möglicherweise auch die Kombination mit Informationen aus dem Alltag.
2. Vertikale Dimension: Damit ist die "tiefere" Verzahnung von Datenbeständen gemeint – etwa die bessere Verbindung von administrativen, klinischen und forschungsnahen Daten. Ein Beispiel hierfür ist die "Open Data Initiative" des British Medical Journal (BMJ). Die renommierte Fachzeitschrift wird künftig nur noch Artikel publizieren, die vorab registriert wurden und transparent mit ihren Ergebnissen und Daten umgehen. Dies ist keinesfalls belanglos: Laut BMJ wurde die Hälfte aller klinischen Studien nie registriert oder publiziert. Zahlreiche Daten, die zu Forschungszwecken erhoben wurden (mit erheblichem Aufwand und Engagement und möglicherweise mit Risiken für Patienten) stehen nach der Publikation nicht mehr zur Verfügung. Wenn wir all diese Daten hätten – was wüssten wir mehr?
3. Temporäre Dimension: Big-Data-Analysen sind nicht nur retrospektiv, sondern erlauben das Echtzeit-Monitoring von Geschäftsprozessen. Der nächste Schritt ist nun von "was passiert" zu "warum passiert etwas". Vertiefende Analysen könnten hier neue Einsichten ermöglichen. Ein besonders spannender Bereich ist die Simulation oder gar "Vorhersage" zukünftiger Szenarien: Einen (potenziell) komplizierten Therapieverlauf schon früh überwachen und gegebenenfalls gar geeignete Maßnahmen ergreifen zu können, könnte zur Königsdisziplin von Big Data in der Medizin werden.
Der faszinierendste Bereich ist also der Blick in die Zukunft – und hier treffen sich Sehnsüchte, Visionen und Wunschvorstellungen: Was wird passieren, welche Risikoprofile gibt es – und wie können wir dadurch früher präventiv eingreifen, Diagnostik verändern oder erweitern und Therapien anpassen? Gesundheit findet ja nicht nur im Krankenhaus statt – sondern "draußen" im "echten Leben". Ob sich dieser Bereich durch Big-Data-Anwendungen tatsächlich besser integrieren lässt, wird die weitere Entwicklung zeigen.
"Personalisierte" Medizin?
Als ein weiteres wichtiges Anwendungsfeld von Big Data in der Medizin wird die sogenannte personalisierte oder auch individualisierte Medizin gesehen. Hierunter wird häufig das individuelle "Zuschneiden" einer Therapie verstanden, basierend auf dem genetischen Code eines Patienten, was bis heute nur in sehr wenigen, häufig onkologischen Fällen gelingt. Da jedoch die Dimension der Genetik sehr betont wird und andere Bereiche (Soziales, Psychologisches) vernachlässigt werden, lehnen Organisationen wie der Deutsche Ethikrat oder die Bundeszentrale für gesundheitliche Aufklärung den Begriff "personalisierte Medizin" ab. Grundsätzlich sollen sich alle diagnostischen und therapeutischen Maßnahmen ja nicht erst seit heute oder seit Aufkommen der Genetik an der besten verfügbaren Evidenz, sondern auch an individuellen Merkmalen des Patienten und, unter dem Aspekt der Angemessenheit, dessen Wünschen im Sinne einer Patientenautonomie orientieren. Medizinisch-kritischer Sachverstand ist hier dringend vonnöten, um das ein oder andere Mal ein wenig Luft aus dem Hype zu nehmen. "Computer heilt Krebs" – so einfach ist das nicht.
Das Deutsche Netzwerk Evidenzbasierte Medizin ist in diesem Kontext eine relevante Organisation, die hilft, medizinisches Wissen einzuordnen. Da immer schneller und immer mehr Wissen generiert wird, stehen wir vor der Herausforderung, dieses und das bekannte Wissen – welches sich konsequenterweise ebenso mehrt – rascher und direkter in den Alltag medizinischer Behandlung zu integrieren (von bed to bench and from bench to bed). Innovative Modelle zu entwickeln, das Expertenwissen und die neuen Publikationen in das tägliche Handeln zu integrieren, ist ein zentrales Potenzial von Big Data.
Ein größtenteils unterentwickeltes Potenzial ist im Bereich Public Health zu sehen: Wenn wir wissen, dass bis zu 80 Prozent der Gesundheit von psychosozialen Faktoren abhängig ist – warum konzentrieren wir uns so sehr auf das Genom? Sind Fahrradwege (Organisation) und der Kauf eines Fahrrades (persönliches Handeln) bessere Ansatzpunkte, um Gesundheit nachhaltig zu fördern? Kann Big Data helfen, hier auch neue Zusammenhänge zu erkennen – sowohl auf individueller als auch auf epidemiologischer Ebene? Welche Faktoren sind entscheidend für das Vermeiden, Entstehen und den Verlauf von Krankheiten? Was macht und hält gesund? All dies sind große Fragen – für deren Beantwortung einige Hoffnung auf Big Data liegt.
Big Data – Big Grauzone?
Wie bei allen Prozessen – ob mit IT oder ohne – müssen Datenschutz und die Persönlichkeitsrechte gewahrt bleiben. Wenn Datenschutz allerdings zu einem Vorwand wird und wichtige Einsichten verhindert, um Patienten besser zu behandeln, dann steht er selbst auf dem Prüfstand. Wer heute in Deutschland wissen möchte, welcher niedergelassene Arzt wirklich gute Medizin macht, kommt praktisch nicht an valide Informationen, obwohl sie zum großen Teil digital vorliegen – aber nicht ausgewertet oder publiziert werden. Wohl zu Recht klingt in dem Wort "Big Data" ja aber auch "Big Brother" an – unter dem Aspekt der laufenden Diskussion um geheimdienstlichen Missbrauch von Daten ist das Sammeln von Daten im Gesundheitsbereich ein besonders sensibles Thema.
Wir sind erst am Anfang einer wohlgemerkt politischen und nicht technischen Diskussion um Big Data – und damit um einen der wichtigsten Rohstoffe globalisierter Ökonomie. Der Vergleich mit der Diskussion um den Nutzen der Atomenergie in den 1940er und 1950er Jahren ist hier durchaus hilfreich: Heute sind Nuklearwaffen geächtet, Atomkraftwerke umstritten und nuklearmedizinische Abteilungen willkommen – aber wir sprechen im Kern über die gleiche Technologie.
Wo, wann und wem stelle ich wie meine Daten und damit "mein Innerstes" zur Verfügung, welche Organisationen und Unternehmen dürfen was nutzen? Hier brauchen wir klare Regeln und Gesetze und keine ungeklärten "Big Grauzonen". Heute haben wir in Deutschland nicht nur ein Bundesdatenschutzgesetz, sondern zudem lokale Ausprägungen von Landesdatenschutz. Eine Regelung von Datenschutz auf der europäischen Ebene, wie im Entwurf des Europäischen Parlamentes für eine Datenschutz-Grundverordnung vorgeschlagen, wird notwendig sein.
Der Schutz der Privatsphäre und der persönlichen Daten von Bürgern ist ein gesamtgesellschaftliches Anliegen. Dies gilt für alle Lebensbereiche – die Anwendungen rund um das Thema Big Data unterliegen hier einer besonderen Sensibilität. Auch die Themen informationelle Selbstbestimmung und das "Recht auf Nichtwissen" oder das "Recht auf Vergessenwerden" spielen hier eine Rolle – womit wir uns mitten in einer ethischen Diskussion befinden, der sich die Akteure im Gesundheitswesen, die Politik und die Gesellschaft insgesamt stellen müssen.
Ausblick
Wir verstehen Gesundheit nur, wenn wir über die Silogrenzen von Krankenhaus, Krankenkasse und niedergelassenem Bereich hinaus denken. Das heißt, es gibt immer mehr Daten, die wir noch miteinander vernetzen müssen, um Gesundheit und Krankheit besser nachvollziehen zu können. Dazu kommen die Daten aus der Forschung und die entsprechenden Publikationen: Dieses Wissen besser und schneller in den Behandlungsprozess einzubeziehen – etwa als digitaler Coach oder auch als "Dr. Algorithmus" – würde die Gesundheitsversorgung dramatisch verändern.
Natürlich müssen wir hier über Datenschutz sprechen. Aber auch darüber, wer denn die Daten davor schützt, dass sie nicht nicht benutzt werden – also zur Verfügung stehen, aber nicht ausgewertet werden. Das Potenzial von Big Data in der Medizin liegt damit vor allem in der Transparenz. Die Diskussion darüber, dass dies nicht der "gläserne Patient" sein kann, aber auch nicht der in Sachen Gesundheitsdaten digital ausgeschlossene Bürger, hat gerade erst begonnen.