So funktioniert Stable Diffusion
Sogenannte Diffusionsmodelle wie Stable Diffusion (SD) "zerstören" Bilddaten, mit denen die KI-Modelle vorher trainiert wurden, indem sie diesen Daten Rauschen hinzufügen. Dann lernen sie, wie sie die Daten wiederherstellen können, indem sie das Rauschen wieder entfernen. Aus diesem Rauschen entsteht ein neues Bild
Damit ein Bild mittels einer Texteingabe entstehen kann, muss es im Trainingsprozess vorher möglichst präzise "beschrieben“ werden. Nur so weiß das Stable-Diffusion-Modell, was es tun soll. Das macht man, indem man ein Sprachmodell mit den Bildern verknüpft. Dieser Vorgang wird einerseits von Menschen durchgeführt, die auf einzelne Elemente in einem Bild klicken und es damit beschreiben, in letzter Zeit aber auch verstärkt von KIs selbst.
Im Vergleich zu früheren KI-Bildmodellen, deren Rechenprozesse sehr aufwändig, langsam und somit kostspielig waren, kann das Open-Source-Modell Stable Diffusion schon in wenigen Sekunden Bilder in hoher Qualität erzeugen. Zudem ist das Modell über einfache Web-Oberflächen wie DALL-E 2 von OpenAI oder Midjourney auch Nicht-Programmier:innen zugänglich.
Stable Diffusion in der historischen Bildung
In der historischen Bildung spielt die Visualisierung seit jeher eine wichtige Rolle, um komplexe Ereignisse und Zusammenhänge besser verstehen und vermitteln zu können. Auch wenn Stable Diffusion keine exakte Rekonstruktion historischer Szenen liefern kann, sondern vielmehr kreativ interpretiert: Mit dieser Technologie können Historiker:innen nun zusätzlich auf innovative Art und Weise vergangene Szenen rekonstruieren und visualisieren. So kann es Schüler:innen und Student:innen ermöglicht werden, ein tieferes Verständnis für historische Ereignisse entwickeln und ein lebendigeres und anschaulicheres Bild von Geschichte zu erhalten.
Es gibt eine breite Palette an Einsatzmöglichkeiten von SD im Unterricht:
Durch Textbeschreibungen, die in das in das Modell eingegeben werden, können Lehrkräfte Bilder generieren, die den Schüler:innen dabei helfen, sich historische Szenen besser vorzustellen.
SD kann auch dazu verwendet werden, historische Orte und Gebäude zu rekonstruieren. Durch die Eingabe von Beschreibungen historischer Stätten, werden Bilder generiert, die zeigen, wie diese Orte in der Vergangenheit wahrscheinlich ausgesehen haben. So können Schüler:innen einen virtuellen Rundgang durch historische Stätten vornehmen.
Das Bildmodell kann außerdem historische Artefakte generieren. Wenn Lehrkräfte Beschreibungen von Artefakten wie antiken Münzen, Gemälden oder Schriftrollen eingeben, werden mithilfe des Modells Bilder erzeugt, die diesen Artefakten ähneln.
Lehrer:innen, Schüler:innen und Student:innen können also ihre Vorstellungskraft und Kreativität nutzen, um alternative Darstellungen von Geschichte zu generieren und eigene Interpretationen historischer Ereignisse zu entwickeln.
Gefahren, Grenzen und Herausforderungen
Wie bei vielen bahnbrechenden Entwicklungen, bestehen auch bei der Nutzung von Stable Diffusion potenzielle Gefahren und Herausforderungen – insbesondere im Zusammenhang mit Geschichtsrevisionismus und der Erstellung von Desinformation.
Vermeintliches Handyfoto von Olaf Scholz auf einer Irak-Mission im Juni 2023. Dieses Ereignis hat so nicht stattgefunden. Das Bild wurde mit dem KI-Bildgenerator Midjourney 5.2 erstellt. (© Michael Katzlberger, 3LIOT.ai, Technologie: Midjourney 5.2)
Vermeintliches Handyfoto von Olaf Scholz auf einer Irak-Mission im Juni 2023. Dieses Ereignis hat so nicht stattgefunden. Das Bild wurde mit dem KI-Bildgenerator Midjourney 5.2 erstellt. (© Michael Katzlberger, 3LIOT.ai, Technologie: Midjourney 5.2)
So birgt Stable Diffusion das Risiko, dass gefälschte Bilder erzeugt werden können, die als "authentischer Beweis" für Ereignisse oder Situationen verwendet werden, die in der Realität so nicht stattgefunden haben. Es besteht außerdem die Gefahr, dass mit Tools wie Midjourney beispielsweise Bilder erzeugt werden, die bestimmte historische Ereignisse in einem veränderten Licht darstellen oder diese sogar ganz leugnen.
Diffusionsmodelle können auch dazu genutzt werden, Bilder zu manipulieren und zu verfälschen. Personen oder Objekte können in Bildern hinzugefügt, entfernt oder verändert werden, um bestimmte Narrative zu unterstützen. Mit den manipulierten Bildern kann wiederum Propaganda verbreitet, können Wahlkämpfe beeinflusst und das Vertrauen in authentische Bildquellen im Allgemeinen untergraben werden.
Barack Obama umarmt Papst Franziskus in Schönbrunn, Wien 2023. Dieses Treffen hat nie stattgefunden, das Bild wurde mit dem KI-Bildgenerator Midjourney 5.2 erstellt. (© Michael Katzlberger, 3LIOT.ai, Technologie: Midjourney 5.2)
Barack Obama umarmt Papst Franziskus in Schönbrunn, Wien 2023. Dieses Treffen hat nie stattgefunden, das Bild wurde mit dem KI-Bildgenerator Midjourney 5.2 erstellt. (© Michael Katzlberger, 3LIOT.ai, Technologie: Midjourney 5.2)
Mit fortschreitender Technologie wird es auch für geschulte Expert:innen immer schwieriger werden, gefälschte Bilder von echten Bildern zu unterscheiden. Problematisch ist auch die Verstärkung von Vorurteilen und Stereotypen. So zeigt eine Eingabe des Wortes "Frau" in herkömmliche KI-Bildertools in der Regel eine weiße, mitteleuropäische Frau zwischen 20 und 30 Jahren.
Um solchen Verzerrungen und Bias entgegenzuwirken, sollten Menschen unbedingt über die Möglichkeiten und Grenzen von Technologien wie Stable Diffusion aufgeklärt werden. Dies umfasst die Förderung von Medienkompetenz, kritischem Denken und der Fähigkeit, gefälschte Inhalte zu erkennen und zu hinterfragen.
Immer wieder gibt es auch urheberrechtliche Bedenken rund um Modelle wie Stable Diffusion. Im Januar wurde bekannt, dass die Bildagentur Getty Images die Entwickler:innen von SD wegen des sogenannten "Scrapings" von urheberrechtlich geschützten Inhalten verklagt hat. Getty behauptet, Stability AI habe Millionen von Bildern von seiner Website unrechtmäßig abgegriffen.
Entwicklungsperspektiven von Stable Diffusion für die historische Bildung
Stable Diffusion kann dazu genutzt werden, lebendige, interaktive Lehrmaterialien für den Geschichtsunterricht herzustellen. Man stelle sich vor, wie Schüler:innen nicht nur über historische Ereignisse lesen, sondern diese auch visuell mitgestalten können, indem sie Bilder oder Szenen erzeugen, die auf historischen Beschreibungen basieren. Museen könnten Stable Diffusion nutzen, um ihre Ausstellungen zu bereichern und so den Besucher:innen einen weiteren Zugang zu Geschichte ermöglichen.
Nicht zuletzt ist die Technologie interessant für die Film- und Unterhaltungsindustrie, um realistische Kulissen und Szenen aus verschiedenen historischen Epochen zu erstellen. Basierend auf schriftlichen Beschreibungen aus Tagebüchern, Briefen oder anderen historischen Dokumenten entstehen mit SD beispielsweise Bühnenbilder und Kostüme aller Art.