Ein Blick in die Vergangenheit zeigt, wie weit die medizinische Wissenschaft gekommen ist. Wer im antiken Griechenland bis hinein ins 18. Jahrhundert krank wurde, musste eine Untersuchung der vier Körpersäfte – Blut, Schleim, schwarze und gelbe Galle – über sich ergehen lassen. Die damalige Vorstellung war, dass Krankheiten durch ein Ungleichgewicht dieser Säfte verursacht wurden. Zur Wiederherstellung des Gleichgewichts wurden unterschiedliche Behandlungsmethoden eingesetzt, etwa der Aderlass, die Blutegel- oder die Hydrotherapie. Vor etwa 500 Jahren, im Zeitalter von Paracelsus, dem bedeutenden Arzt und Alchemisten der Renaissance, begann sich dieses Verständnis zu wandeln. Paracelsus stellte das traditionelle Wissen infrage und ergänzte es um empirische Forschung und Beobachtungen. Sein Ansatz legte den Grundstein für eine wissenschaftlich basierte Medizin. Doch selbst zu seiner Zeit passte das bekannte medizinische Wissen noch in wenige Bücher.
Seitdem hat sich der medizinische Fortschritt rasant beschleunigt. Allein 2022 erschienen knapp eine Million von Experten begutachtete wissenschaftliche Artikel auf PubMed, einer der größten medizinischen Onlinebibliotheken.
Eine vielversprechende Lösung für diese Herausforderungen ist der Einsatz von künstlicher Intelligenz (KI). Während herkömmliche Algorithmen bereits große Datenmengen verarbeiten und relevante Informationen in Echtzeit bereitstellen, bietet KI zusätzliche Vorteile: Sie kann aus Daten lernen und Muster erkennen, die für fundierte Behandlungsentscheidungen und die Vereinfachung von Prozessen entscheidend sind. Mit dem anhaltenden, beispiellosen Wachstum medizinischen Wissens hat KI das Potenzial, ein unverzichtbares Werkzeug für medizinisches Fachpersonal zu werden.
KI-Entwicklung im Gesundheitswesen
KI-Algorithmen erlernen medizinische Konzepte und Zusammenhänge durch die Analyse großer Datensätze. Diese enthalten historische medizinische Informationen etwa aus elektronischen Patientenakten, genetischen Daten oder Wearables wie Smartwatches oder Langzeit-Elektrokardiogrammen (Langzeit-EKGs). Unter historischen Datensätzen sind also nicht geschichtliche Texte zu verstehen, sondern Daten aus früheren Behandlungen, die genutzt werden, um die KI zu trainieren. Allerdings haben historische Daten Grenzen: Medizinische Standards entwickeln sich stetig weiter, basierend auf neuer Forschung und neuen Technologien und Erfahrungen. Eine vor zehn Jahren optimale Therapie kann heute schon überholt sein. Ohne Berücksichtigung des zeitlichen Kontexts können ältere Daten zu KI-Fehlschlüssen führen.
Bei der Entwicklung von KI sind Auswahl und Beschaffung der richtigen Daten von entscheidender Bedeutung: Je nach Aufgabe werden unterschiedliche Arten von Daten benötigt. Nehmen wir zum Beispiel die Entwicklung eines KI-Algorithmus zur Diagnose seltener Formen von Demenz: Hierfür sind Magnetresonanztomographie-Bilder (MRT-Bilder) des Gehirns sowohl von Patientinnen und Patienten mit verschiedenen Demenzformen als auch von gesunden Personen notwendig. MRT-Bilder bieten detaillierte Schnittbilder und zeigen Strukturen und Gewebemerkmale, die auf normalen Röntgenbildern nicht zu sehen sind. Die hier zum Einsatz kommende Funktionsweise der KI-Algorithmen wird als "überwachtes Lernen" bezeichnet. Dabei müssen die Bilder vorher sorgfältig klassifiziert sein und jedem Bild eine spezifische Diagnose zugeordnet werden, um die Genauigkeit der KI zu gewährleisten. Der KI-Algorithmus nutzt dann diesen annotierten Datensatz, um Muster und Zusammenhänge zwischen gesunden und erkrankten Gehirnen zu erkennen. Auf diese Weise kann er später die Diagnose von neuen MRT-Bildern unterstützen. Wenn dagegen die KI dazu verwendet wird, um Patientengruppen zu identifizieren, bei denen ein bestimmtes Medikament besonders gut wirkt, werden sogenannte Clustering-Algorithmen eingesetzt. Dabei werden nur Krankenakten benötigt, ohne spezifische Diagnosen oder Bewertungen, da die KI selbstständig Muster und Ähnlichkeiten zwischen den Daten erkennt. Dieses Verfahren wird als "unüberwachtes Lernen" bezeichnet. Heutzutage werden vor allem Deep-Learning-Modelle verwendet, die verschiedene Arten von Daten verarbeiten können, wie zum Beispiel Tabellen, Zeitverläufe, Texte, Bilder, Videos, Sprache und Audioaufnahmen oder eine Kombination davon. Wenn auf mehrere Datenquellen zugegriffen wird, nennt man das "multimodale Datenquellen".
Nach dem Training wird der KI-Algorithmus mit neuen, unbekannten Daten getestet, um seine Generalisierungsfähigkeit und die Genauigkeit der Vorhersage zu prüfen. Beispielsweise könnte ein auf Demenzerkennung trainierter Algorithmus mit MRT-Bildern unbekannter Patienten getestet werden. Die Evaluierung umfasst nicht nur den Test mit neuen Daten, sondern auch den Leistungsvergleich mit bereits entwickelten KI-Algorithmen, die ähnliche Aufgaben erfüllen sollen. Der Prozess folgt strengen regulatorischen Vorschriften zur Gewährleistung der KI-Sicherheit. Entscheidend für die Güte von KI-Algorithmen ist die Qualität und Vielfalt der Trainingsdaten. Sie müssen repräsentativ für die Bevölkerung sein und eine hohe Varianz aufweisen, also zum Beispiel Patienten und Patientinnen verschiedenen Alters oder mit unterschiedlichen Vorerkrankungen einschließen.
Die Vielfalt der KI-Algorithmen spiegelt sich in ihren individuellen Stärken und Schwächen wider. So haben unterschiedliche KI-Algorithmen jeweils spezifische Einsatzbereiche. Manche eignen sich besonders für die Diagnose bestimmter Krankheiten oder das Prognostizieren von Vitalparametern auf der Intensivstation. Während Clustering-Algorithmen effektiv Patienten mit ähnlichen Merkmalen gruppieren, sind neuronale Netze aufgrund ihrer Eigenschaft, mehrere Eingangssignale parallel zu bearbeiten und zu gewichten, effektiv darin, große Datensätze zu komprimieren und Zusammenhänge zu extrahieren. Neuronale Netze, die von der Funktionsweise des menschlichen Gehirns inspiriert wurden, bestehen aus vielen miteinander verbundenen Neuronen. Jede Verbindung hat dabei ein Gewicht, das während des Trainings angepasst wird. Algorithmen des verstärkenden Lernens (Reinforcement Learning) können optimale Handlungssequenzen bestimmen, etwa für erfolgreiche Patientenbehandlungen. Daher ist es entscheidend, den passenden Algorithmus für die jeweilige Aufgabe auszuwählen, damit er den spezifischen Anforderungen und Herausforderungen gerecht wird.
KI-Einsatz heute und in Zukunft
KI hat das Potenzial, in vielen Bereichen des Gesundheitswesens signifikante Unterstützung zu bieten.
Radiologie
KI-Algorithmen haben sich schon vor geraumer Zeit als vielversprechend im Bereich der Radiologie erwiesen – und werden dort bereits auf vielfältige Weise eingesetzt. Sie können die Bildqualität verbessern, beispielsweise durch den Einsatz virtueller Raster bei bettseitig angefertigten Röntgenaufnahmen von Thorax und Abdomen, was zu schärferen Abbildungen bei reduzierter Strahlenexposition führt.
Kardiologie
KI bietet auch in der Kardiologie enorme Potenziale, insbesondere bei der Analyse von EKGs und der Echokardiographie. Durch den Einsatz neuronaler Netze können EKG-Abnormalitäten und Herzrhythmusstörungen präziser diagnostiziert werden als durch durchschnittliche Kardiologen, was zu einer Reduzierung falscher Diagnosen und einer Priorisierung dringender Fälle führt.
Intensivmedizin
Personen mit schweren, oft lebensbedrohlichen Krankheiten werden auf Intensivstationen rund um die Uhr überwacht und betreut. Diese hochkomplexe Umgebung erfordert schnelle Entscheidungen des medizinischen Fachpersonals, oft innerhalb von Sekunden. KI-Algorithmen zeigen vielversprechende Ansätze zur Verbesserung der Intensivpflege, indem sie in Echtzeit Patientendaten analysieren und unerwünschte Ereignisse vorhersagen. Eine Sepsis beispielsweise, eine systemische Entzündungsreaktion auf eine Infektion, ist eine der häufigsten Todesursachen auf Intensivstationen. Die frühzeitige Erkennung und Behandlung einer Sepsis ist entscheidend für die Verbesserung der Überlebenschancen. Ein von Wissenschaftlern entwickelter KI-Algorithmus kann septische Schocks 28 Stunden im Voraus vorhersagen, was eine frühzeitige Antibiotikatherapie ermöglicht und zu geringeren Raten an Organversagen und Sterblichkeit führt.
Pharmakologie
Die Entwicklung von Arzneimitteln ist ein komplexer, zeitaufwendiger und kostenintensiver Prozess. Dabei werden Moleküle gesucht, die gesundheitliche Probleme lösen, ohne dabei unerwünschte Nebenwirkungen zu verursachen. Die Herausforderung besteht darin, die chemischen Wechselwirkungen zwischen Wirkstoffen und verschiedenen Zellen und Organen zu berücksichtigen, die je nach Person variieren können. Traditionell werden viele Wirkstoffe durch iterative Tests im Labor entdeckt. Schätzungen zufolge existieren etwa 1060 arzneimittelähnliche Moleküle,
Prozessoptimierung
Die digitale Transformation des deutschen Gesundheitswesens ermöglicht den zunehmenden Einsatz von KI, was vor allem Fachkräfte bei zeitintensiven manuellen Aufgaben unterstützen kann. KI hilft beispielsweise bei der Optimierung von Prozessen wie der Dienstplanerstellung in Krankenhäusern. Durch die Analyse von Faktoren wie Wetter, historischer Belegungszahlen und externen Events kann vorausgesagt werden, wie viele Patienten stündlich die Notaufnahme aufsuchen werden.
Ein erheblicher Innovationsschub im Bereich der generativen KI durch große Sprachmodelle (Large Language Models, LLMs) wie ChatGPT und Gemini hat Anfang 2023 große Aufmerksamkeit auf sich gezogen. Diese Modelle, die auf Grundlage umfangreicher Datenmengen aus dem Internet trainiert wurden, liefern bemerkenswerte Antworten auf Freitextanfragen. Studien zeigen vielfältige Anwendungsmöglichkeiten im klinischen Alltag,
Umsetzungslücke zwischen Forschung und Praxis
Obwohl zahlreiche erfolgreiche KI-Algorithmen entwickelt wurden, kommen – mit Ausnahme der Radiologie – nur wenige KI-basierte Tools zur praktischen Anwendung. Dies ist auf eine Vielzahl an ungelösten technischen und wissenschaftlichen Herausforderungen zurückzuführen, die die Sicherheit von KI-basierten Systemen gefährden.
Der Einsatz von KI-basierten Tools in der medizinischen Praxis bringt in erster Linie Sicherheitsbedenken mit sich. Ein wesentlicher Aspekt ist hier der Schutz von Patientendaten (Security). Der Einsatz von KI in Kliniken erfordert die Verarbeitung und Analyse großer Mengen sensibler Gesundheitsdaten, deren Schutz höchste Priorität hat. Der Schutz der Privatsphäre und die Möglichkeit des unbefugten Zugriffs oder der Offenlegung sensibler Gesundheitsdaten sind die größten Probleme. Die Sicherheit von KI-Systemen selbst ist ebenfalls ein kritischer Punkt, da die Möglichkeit von Cyberangriffen besteht. Daneben gibt es erhebliche Sorgen um die Patientensicherheit (Safety), da Fehlentscheidungen unter Umständen zu ernsthaften gesundheitlichen Konsequenzen führen können. KI-Tools werden häufig anhand von Daten aus klinischen Studien oder speziell aufbereiteten retrospektiven Datensätzen entwickelt und getestet, die möglicherweise nicht repräsentativ für den medizinischen Alltag sind. Dies kann einige Folgen haben:
1. Die Diskrepanz kann zu einem Bias, also einer Verzerrung der Daten, führen, da KI-Algorithmen nur so unvoreingenommen sind wie die Daten, mit denen sie trainiert wurden. Um diese Voreingenommenheit zu minimieren, sind Fairness-Maßnahmen bei der Validierung erforderlich.
2. Ein weiteres Problem ist der Umgang mit fehlenden Daten. In der klinischen Praxis kommt es häufig vor, dass Informationen zu einem Patienten fehlen oder unvollständig sind. Zum Beispiel werden spezifische medizinische Tests bei Patienten häufig nicht mehr durchgeführt, wenn ein anderer Test bereits den ausschlaggebenden Hinweis für die Diagnose geliefert hat, oder es gibt Änderungen im Anamneseverfahren, wodurch manche Vorerkrankungen bei einigen Patienten nicht erfasst werden. KI-Systeme müssen in der Lage sein, mit diesen fehlenden Werten umzugehen, ohne dass sich Fehler in ihrer Funktionsweise ergeben. Die Forschung entwickelt deshalb Methoden, um die fehlenden Daten zu kompensieren und die Algorithmen robust gegen solche Lücken zu machen. Für die bestmöglichen Ergebnisse ist es wiederum wichtig, dass bereits die Trainingsdaten solche Lücken aufweisen; die retrospektiven Daten aus klinischen Studien sind daher oft "zu perfekt", da hier genau definiert wurde, was erfasst wird und was nicht.
3. Ein großes Problem ist die mangelnde Verallgemeinerungsfähigkeit von KI-Algorithmen. Ein Beispiel: Ein auf EKG-Daten von Erwachsenen trainierter KI-Algorithmus für die Diagnose von Herzrhythmusstörungen erzielt in der Evaluierung eine hohe Genauigkeit. Beim Einsatz auf EKGs von Kindern sinkt die Genauigkeit jedoch erheblich, da die Trainingsdaten keine Kinder-EKGs enthielten. Ähnlich bei der KI-basierten Erstellung des Medikationsplans anhand von ähnlichen Patienteninformationen und Krankheitsbildern: Die Prävalenzen von Volkskrankheiten – wie Herz-Kreislauf-Erkrankungen, Adipositas und Diabetes – können zwischen Ländern aufgrund unterschiedlicher sozioökonomischer Faktoren, Gesundheitssysteme und Lebensstile variieren. Ein nur auf Daten eines Landes trainierter KI-Algorithmus kann für andere Länder ungenaue oder unerwartete Ergebnisse liefern, da sich die Krankheitsprofile der Bevölkerungen unterscheiden. Generalisierbare KI ist ein Forschungsfeld, bei dem KI-Algorithmen flexibler und effizienter in verschiedenen Situationen eingesetzt werden können. Das ist notwendig, da große KI-Algorithmen wie neuronale Netze nicht für jede Situation spezifisch angepasst werden können, weil dieser Prozess zu zeit- und ressourcenintensiv wäre. Zudem mangelt es oft an hochwertigen Daten – vor allem im Bereich von seltenen Krankheiten. Forschende entwickeln Methoden, um das Generalisieren von KI-Algorithmen zwischen verschiedenen Bereichen zu verbessern. Gleichzeitig arbeiten sie an Möglichkeiten, um die Datengrundlage für das KI-Training zu erweitern, zum Beispiel durch föderiertes Lernen – dabei kann eine KI über mehrere Krankenhäuser hinweg trainiert werden, ohne sensible Gesundheitsdaten zu teilen. Eine weitere Methode ist das Transferlernen, bei dem ein bereits trainierter KI-Algorithmus für ähnliche Aufgaben als Grundlage genutzt und auf die neue Aufgabe übertragen wird.
4. Ein weiterer kritischer Punkt ist die Transparenz und Erklärbarkeit von KI-Algorithmen. Viele, insbesondere tiefe neuronale Netze und generative KI wie Chatbots, sind so komplex, dass es schwierig ist, ihre Entscheidungsprozesse nachzuvollziehen. Dies mindert das Vertrauen in KI-erstellte Diagnosen und Behandlungsempfehlungen. Erklärbare KI (Explainable Artificial Intelligence, XAI) ist ein Forschungsgebiet mit dem Ziel, Vorhersagen und Entscheidungen transparenter zu gestalten. Zum Beispiel können wichtige Pixel in medizinischen Bildern hervorgehoben oder spezifische Laborwerte angegeben werden, um zu zeigen, wie sie eine KI-basierte Entscheidung beeinflusst haben. Aktuelle XAI-Lösungen haben jedoch Schwächen: Je nach Methode variieren die Ergebnisse stark, und die technischen Erklärungen sind oft für medizinisches Personal und Patienten unverständlich. Zudem mangelt es an eindeutigen Referenzdaten für die systematische Bewertung, und Erklärungen sind oft unpräzise. Ein Beispiel: Bei der Diagnose von Wirbelsäulenfrakturen mithilfe von KI markiert eine XAI-Methode die ganze Wirbelsäule als relevant, während für Ärzte nur bestimmte Stellen eines einzelnen Wirbels interessant sind.
Die genannten Herausforderungen verdeutlichen die Komplexität der Integration von KI in die medizinische Praxis. Um diese vielfältigen Aspekte zu adressieren, ist ein holistischer Ansatz erforderlich, der den gesamten Lebenszyklus eines KI-Systems umfasst: von der Datenauswahl und dem Modelltraining über die Validierung und Verifikation bis hin zur sicheren Bereitstellung. Nur durch die Zusammenführung und Harmonisierung verschiedener Methoden und Forschungsschwerpunkte können wir die Lücke zwischen innovativer KI-Forschung und der sicheren, effektiven Anwendung in der klinischen Praxis schließen.
KI als Assistent des Menschen
Die Frage, ob KI ein Assistent oder ein Konkurrent in der medizinischen Praxis ist, spiegelt Unsicherheit und Bedenken bezüglich der Rolle von KI im Gesundheitswesen wider. Studien zeigen, dass KI in bestimmten Bereichen schneller und genauer diagnostizieren kann als medizinisches Fachpersonal. Allerdings basieren solche Vergleiche oft auf kleinen Datensätzen ohne Sonderfälle, bei denen sich die KI unsicher wäre. Der Mensch kann dank Transferleistung dennoch eine mögliche Diagnose stellen, was KI nicht kann. Solche Ergebnisse können daher irreführend sein. In der Praxis wird KI als unterstützendes Werkzeug verwendet, das Vorschläge macht, während der Mensch die finale Entscheidung trifft. Die KI fungiert dabei als "zweite Meinung", die den Ärzten und Ärztinnen zusätzliche Informationen und Perspektiven bietet. Viele aktuelle Studien untersuchen, wie die Kombination aus menschlichem Fachwissen und KI-Assistenz zu besseren Ergebnissen führen kann. Diese Zusammenarbeit zielt darauf ab, die Stärken beider zu nutzen: die Rechenleistung und Datenanalysefähigkeiten der KI sowie das klinische Urteilsvermögen und die Erfahrung des Menschen.
Zusammenfassung
Die Integration von KI ins Gesundheitswesen bietet immense Chancen, jedoch auch erhebliche Herausforderungen. Der Fortschritt in der medizinischen Wissenschaft hat sich seit der Antike erheblich beschleunigt, wobei Digitalisierung und KI als potenzielle Schlüssel zur Bewältigung der stetig wachsenden Komplexität im Gesundheitsbereich gelten. Die diskutierten Anwendungsfelder von KI im Gesundheitswesen veranschaulichen lediglich einen Teil ihres Potenzials, bieten jedoch einen Einblick in ihre vielfältigen Möglichkeiten.
Mit der weiteren Entwicklung des Feldes rücken die Sicherheit von Patientendaten und die Patientensicherheit in den Mittelpunkt. Hierbei ist es entscheidend, Aspekte wie Zuverlässigkeit, Genauigkeit und Transparenz der KI zu verbessern und durch rigorose Test- und Validierungsverfahren auf regulatorischer Ebene zu gewährleisten. Die erfolgreiche Anwendung von KI im Gesundheitswesen erfordert einen ganzheitlichen Ansatz, der technische, ethische, rechtliche und gesellschaftliche Aspekte gleichermaßen berücksichtigt.