Einleitung
Schrift und Bild gelten allgemein als Konkurrenzmedien, obwohl sie so zusammengehören wie zwei Seiten einer Medaille. Historisch gesehen, erscheinen Bilder 25 000 Jahre vor der Schrift. Die Höhlenbilder des Paläolithikums sind zwischen 30 000 und 20 000 Jahren vor Chr. angefertigt worden, die Schrift entstand dagegen erst im 4. Jahrtausend vor Chr. Man muss schon bis zu analphabetischen Gesellschaften zurückgehen, um Bilder ohne Schrift zu finden.
Während Schrift und Bild zeitlich auseinander gehalten werden können, ist das bei Bild und Wort nicht so einfach. Gesellschaften ohne Schrift sind noch lange keine Gesellschaften ohne Sprache. Auch in oralen Kulturen wurden Bilder hergestellt; es gibt wohl keine bilderproduzierende "Gesellschaft" ohne Sprache. Es existieren zwar Bilder, die ohne einen schriftlichen Kontext entstanden sind, aber wohl kaum Gesellschaften ohne Sprache. Bilder entstehen in einem sprachlichen Kontext und werden auch nur in einem solchen wahrgenommen. Sie ergeben nur in einem sprachlichen Kontext Sinn: in einem diskursiven Rahmen.
In pädagogisch-didaktischer Tradition wird dieser Zusammenhang nicht akzeptiert. Das Bild gilt vielmehr als rivalisierender Konkurrenzmodus, dem eine größere Potenz zugesprochen wird als der Sprache. Die Bilder könnten alles, was Sprache auch kann und darüber hinaus noch viel mehr. Diesen pädagogisch-didaktischen Irrtum gibt es seit dem ersten pictorial turn bei Johann Amos Comenius (1592) und Johann Bernhard Basedow (1723 - 1790). Für beide sind allgemeine Wahrnehmungsfähigkeit und "piktorale Kompetenz" (Arthur C. Danto) identisch. Sie holen nur mittels Bild die Sachverhalte heran, die räumlich und zeitlich fern liegen. Es ist ein räumlich und zeitliches "Nahebringen". Dafür steht der pädagogisch-didaktische Begriff der "Anschauung". Den Tätigkeiten von Lehrern, Fachjournalisten, Buchautoren und Ausstellungsdesignern ist Didaktik eingeschrieben. Sie wollen "vermitteln": Wissen, Einsichten und Erkenntnisse.
Im Folgenden wird das Verhältnis von Sprache und Bild an zwei Problemkreisen untersucht.
Dieses Problem wird im Folgenden nur an einen kleinen Teil der Kompositmedien - Medien, die aus Bildern und Text bestehen - dargestellt. Es geht nur um bestimmte Printmedien: Zeitungen, Illustrierte, Sach- und Schulbücher; andere, bei denen dieses Problem auch auftaucht (Film, Cartoon, Comic, Werburg, Plakat, Theater), werden hier nicht einbezogen.
Zuschreibungen
Viele Begriffe, Topoi und Redensarten verweisen bis heute auf ein ungeklärtes Verhältnis von Sprache und Bild. Im Begriff Photographie sehen wir schon gar nicht mehr den Bezug zur Schrift, obwohl er wörtlich übersetzt "Lichtschrift" bedeutet. Definitionen werden sowohl zur Abgrenzung als auch durch den Vergleich mit Sprache vorgenommen. Angeblich können Bilder reden, erzählen, verleumden und lügen. Wenn das der Fall wäre, wären sie eine besondere Form von Rede, Erzählung, Verleumdung und Lüge. Sie wären Sprechakte, sprachliche Handlungen, die all das vollziehen können, was Sprache auch kann, und damit eigentlich überflüssig. Was wäre dann ihr "Mehrwert",
Bilder werden vier sprachliche Handlungsakte zugeschrieben. Wobei man nicht übersehen darf, dass es sich dabei um Metaphern handelt.
Das Bild als Plappermaul: Kurt Tucholskys Formulierung, ein Bild sage mehr als tausend Worte (in der Formulierung von Mitchell: ein "Bild ist mehr als tausend Worte wert") ist eine solch missverständliche Metapher. Der Ausdruck, ein Bild sage mehr als tausend Worte, hat nur in einem eng begrenzten Sektor seine Berechtigung. Ein Bild ist "unaussprechlich". Wollte man das, was es darstellt, in Worte fassen, müsste man ein dickleibiges Buch schreiben. Es müsste jede Linie, Fläche, müsste Farben, Posen Gesten Perspektiven beschreiben: sprachlich ausdrücken. Abgesehen von diesem technischen Problem der Übersetzung fehlen uns auch in anderem Sinne die Worte, um Anmutungen in Sprache zu fassen. Einem durchschnittlich sprachbegabten Betrachter gehen die Worte aus, es verschlägt ihm vielmehr die Sprache. Das heißt aber nicht, dass das Bild redet, sondern dass der Betrachter unendlich viele Worte benötigen würde, um es auszubuchstabieren.
Das Bild als Lügner und Verleumder: Das Bild als Verleumder wurde im Zusammenhang mit der Kriegspropaganda des Ersten Weltkrieges entdeckt. Es waren nicht nur die Kriegspostkarten, sondern die Bilder der Kriegsgegner, durch die man sich verleumdet fühlte. Bilder lügen und verleumden - so Ferdinand Avenarius.
Das Bild als Erzähler: Bildern wird die Fähigkeit zugeschrieben, erzählen zu können.
Das Bild als Text: Da das Bild als sprachbegabtes Wesen angesehen wird, liegt die Vermutung nahe, dass man die "Rede" des Bildes auch als Texte lesen könne. Aufgrund dieser dem Bild zugeschriebenen Sprachhandlungen wird das Bild zum Buch erklärt, das der Betrachter lesen könne. Ein Bild zu "lesen", aus ihm Sinn zu entnehmen, ist aber nicht identisch mit hermeneutischer Deutbarkeit, wie sie die Sprache benutzt. Es gibt keine strukturelle Parallele zwischen piktoraler und sprachlicher Kompetenz. Hier liegt noch ein Forschungsdesiderat. Im "linguistic turn" haben die qualitativen Methoden Fortschritte gemacht, sie bezogen sich in erster Linie auf Texte.
Schwächen und Defizite
Die angeführte angebliche Sprachbegabung des Bildes und seiner Lesbarkeit beruht darauf, dass ihm alle möglichen Stärken bzw. Leistungen zugesprochen werden, die es aber nicht besitzt. Seine Schwächen sind bislang nur unzureichend analysiert worden. Wenn Bilder als eine Art Schrift angesehen werden, taucht eine Reihe von Problemen auf, die auf einem bestimmten Unvermögen der Bilder beruhen.
Bilder - gemeint sind hier stets Einzelbilder - sind nicht-narrative Medien. Sie können weder erzählen noch Entwicklungen darstellen. Nur durch besondere Techniken und sprachliche Einbindungen sind sie in der Lage, dem Betrachter einen narrativen Zusammenhang nahe zu legen. Erzählen muss dieser aber selbst. Aus der Sicht des Historikers sind Bilder zeitlos. In ihnen ist die Zeit eingefroren: es herrscht Gleichzeitigkeit. In der Sprache wird eine Geschichte nacheinander erzählt, im Bild erscheinen die Ereignisse gleichzeitig. Ein Vorher und Nachher, das es erlaubte, zu erzählen, muss erst hergestellt werden. Im Bild wird jeder Prozess zu einem Zustand und jede menschliche Handlung zu einer Pose. Wie die analytische Sprachphilosophie gezeigt hat, besteht eine Erzählung aus sprachlichen Operationen; dabei werden mindestens zwei zeitdifferente Ereignisse sinnbildend miteinander verbunden.
Dass wir dennoch häufig den Eindruck haben, Bilder erzählten, beruht auf dem Prozess des Selbsterzählens mit den Mitteln des schlussfolgernden Denkens. Bei einem Bild von einem Auto mit eingebeulter Motorhaube schlussfolgern wir auf die Vorgeschichte dieses Bildes. Es muss ein Unfall geschehen sein, und vermutlich wird eine Reparatur folgen.
Bilder stellen stets konkrete Sachverhalte dar und können keine Abstraktionen und Begriffe bilden. Auf ihnen sind Ereignisse, Personen, Gegenstände, Landschaften und Orte zu sehen. Armut und Reichtum sind nicht darstellbar, nur kostbar oder ärmlich gekleidete Menschen. Auch "Krise" und "Streik" lassen sich nicht darstellen, erst recht nicht formale Begriffe wie Identität oder Kausalität. Dass die konkreten Dinge, die das Bild darbietet, von uns in Begriffen gedacht wird, ist eine Leistung unseres Verstandes und nicht des Bildes selbst.
Genau so wenig wie Bilder generalisieren können, können sie individualisieren, das heißt, sie können keine Eigennamen darstellen. Dass eine dargestellte Person Otto von Bismarck, Martin Luther oder Angela Merkel heißt, geht aus dem Bild selbst nicht hervor, vielmehr handelt es sich beim Erkennen der jeweiligen Person um (durch einen vorhergehenden assoziativen Lernprozess) erworbenes Wissen. Namensgeber der dargestellten Personen ist entweder der Betrachter selbst oder es gibt eine Bildlegende. Das gleiche Problem ergibt sich bei Bildern von Orten (das Lechfeld, Schlacht an der Marne, Schlacht bei Grundwald).
Bilder sind auch unfähig, Negationen auszudrücken; sie können nicht sagen, dass etwas nicht der Fall ist. Diese zentrale Leistung der Sprache vermag das Bild nicht hervorzubringen. In seinem sprachanalytischem Vergleich von Sprache und Bild fragt Danto, ob es "negative Bilder" geben könne, also "Negationen, die in den Bildern abgebildet werden".
Bilder können auch nur begrenzt quantifizieren und deshalb auch keine Aussagen über die Häufigkeit von Ereignissen machen. Ob ein dargestelltes Ereignis "einmalig" war oder "häufig" vorgekommen ist, kann im Bild nicht ausgedrückt werden. Auch die Begriffe "alle" oder "wenige" lassen sich nicht bildlich fassen. Und schließlich verzerren Bilder die Proportionalität von Welt, da sie in der Regel verkleinerte Abbildungen außerbildlicher Sachverhalte sind. Beim Aufkommen der "Großen Maschinerie" im 19. Jahrhundert wurden auf Fotografien neben die großen Maschinen, damals nie zuvor gesehene Wunderwerke der Technik, immer ein Mensch zum Größenvergleich gestellt. Umgekehrt werden Dinge, die das bloße Auge ohne Hilfsmittel nicht wahrnehmen kann, im Bild mit einem Maßstab wiedergegeben ("Mikrofotografie").
Diesen Schwächen des Bildes suchte man mit bildimmanenten und bildeigenen Mitteln zu begegnen. Es entwickelten sich diskursive Konventionen, die das bildnerischer Unvermögen ausgleichen sollten. Die mittelalterlichen Simultanbilder zeigen mehrere Phasen eines Vorganges innerhalb des gleichen Bildrahmens (vgl. Bild 1 der PDF-Version).
Bei dieser Technik handelt es sich um eine Vorform der Bildgeschichte, da es sich ja im Grunde um zwei bzw. drei Bilder handelt. Eigennamen werden durch Bildzeichen kenntlich gemacht. Das gilt besonders für solche Personen, von denen wir kein authentisches Bildnis besitzen. Den bildlichen Darstellungen der Evangelisten beispielsweise sind Tiere zugeordnet (Adler, Stier, Löwe). Handwerker werden durch typische Werkzeuge kenntlich gemacht; nationale Zugehörigkeiten durch Klischees (etwa Baskenmützen zur Kennzeichnung von Franzosen) oder abstrakte Begriffe wie "Gerechtigkeit" durch eine Frau mit verbundenen Augen. Aber das alles sind keine Leistungen des Bildes selbst, sondern beruhen auf vorgängigen assoziativen Lernprozessen.
Bilder im Netz der Sprache
Diese bildimmanenten Mittel haben jedoch ihre Grenzen. Sie sind auf Bekanntes anzuwenden. Neues, bisher Unbekanntes lässt sich mit ihnen nicht darstellen. Deshalb werden Bilder stets mit einem sprachlichen Kontext verwoben. Schrift befindet sich im Bild selbst, unter ihm und meist um das Bild herum. Auch wenn ein Bild ohne schriftlichen Kontext präsentiert wird, wie es manchmal im Schulunterricht oder in einer Ausstellung geschieht, so ist es bereits durch das Unterrichtsthema oder das Thema der Ausstellung in einen sprachlichen Kontext eingebunden. In den modernen Druck- und elektronischen Medien sind sie stets von Sprache umgeben. Die Art und Weise dieser Verbindung von Sprache und Bild stellt ein besonderes Problem dar.
Text im Bild: Bilder bestehen zwar aus ikonischen Zeichenkomplexen, aber um ihre Schwächen zu beheben, werden in sie manchmal Texte integriert. Solche "Ikonotexte"
Eine entwickeltere Variante stellt die bildliche Darstellung von Schriftträgern dar: ein Schriftband oder ein aufgeschlagenes Buch, in dem der Text zu lesen ist. In der dritten Variante ist die Schrift kein Zusatz, sondern Teil einer Handlung, die dieses Bild darstellt. In diesem Sinn wehrt sich der Bildinhalt gegen eine andere Sinnbildung, oder besser gesagt, der Bildhersteller will sichergehen, dass der Betrachter den Sachverhalt in seinem Sinn auffasst. Einem Panzer in der Werkstatt sieht man nicht an, ob er fertig ist oder ob noch Teile fehlen (vgl. Bild 2 der PDF-Version). Oder: Dass eine auf einem Foto zu sehende Gruppe von Männern vor einem geschlossenen Tor Streikende und nicht etwa Arbeitslose sind, die einen Job suchen, geht aus dem betreffenden Bild nicht hervor. Erst ein Schild reduziert Ambivalenzen. Im Zeitalter der Visualität ist eine Demonstration ohne Transparent nicht mehr denkbar.
Text unter dem Bild: Die in unserer Schriftkultur häufigste Form, Bilder in sprachlichen Kontexte einzubeziehen, sind die sogenannten Legenden, die Bildunterschriften.
Bildproduzent und Legendenverfasser sind nur in seltenen Fällen identisch. Insofern gibt es auch keine "originalen" Legenden.
Idealtypisch lassen sich drei Legendenformen unterscheiden, die aber in der Praxis in verschiedenen Mischungsverhältnissen auftreten: technische, denotative und signifikative Legenden.
Bilder benötigen in historiographischen Texten, in publizistischen Medien sowie in schulischen Lernprozessen technische Legenden. Diese beziehen sich in der Regel nicht auf den Inhalt, sondern geben die Urheberschaft (Maler, Fotograf etc.) und die technischen Verfahren an, die zu seiner Darstellung geführt haben (Gemälde, Stich, Foto etc.). Sie gehen auch auf die Zeitdifferenz von Ereigniszeit und Herstellungszeit des Bildes ein.
Denotative Legenden bezeichnen den Anschauungsgegenstand und erwähnen die näheren Umstände. Sie "verbürgen" sich für eine bestimmte Anschauungsweise, dass der dargestellte Sachverhalt dem entspricht, was die Legende bezeichnet. Unterschiedliche denotative Legenden variieren nur in puncto Genauigkeit und Ausführlichkeit. Sie bezeichnen nur das, "was unbeschadet ihrer Deutung in allgemeiner Evidenz gegeben ist".
Signifikative Bildlegenden dagegen schreiben vor, unter welchem Gesichtspunkt man das Bild betrachten soll. Sie können bei ein und demselben Foto grundverschiedene Anschauungsinhalte hervorbringen. Signifikative Legenden sind eine Form manipulierender Texte. Sie können die Bedeutung eines Bildes auf den Kopf stellen. Dieser Legendentypus findet sich besonders häufig bei Fotos, obwohl er auch bei anderen Bildgattungen vorkommt.
Das Foto (vgl. Bild 3 der PDF-Version) ist in zwei verschiedenen Büchern abgedruckt. Es zeigt zwei sowjetische Soldaten, erkennbar an ihrer Uniform und Bewaffnung. In beiden Büchern trägt das gleiche Foto unterschiedliche Legenden:
"Ein verwundeter Offizier feuert seine Männer an, weiter vorzudringen, 1941"
"Ein Soldat der Roten Armee, der verwundet um Hilfe fleht".
Was ist hier der Bildgegenstand, "Sowjetischer Fanatismus" oder "Grausamkeit des Krieges"?
Sprache um das Bild herum: Manche Bilder entstehen als direkte Illustrationen von Texten: Griechische Mythologien, Homers Epen, die biblische Geschichte etc. Sie werden aber meist aus diesem erzählerischen Kontext herausgenommen und sollen etwas anderes als die sprachliche Überlieferung illustrieren: griechische Sachkultur, Schiffbau, technologische Entwicklung, epochenspezifischer Malstil. Dadurch entstehen besondere Probleme in der Beziehung von Text und Bild. Die überall beklagte zunehmende Bilderflut, das ausgerufene visuelle Zeitalter oder der behauptete visual turn betreffen weniger die Vielzahl der Bilder selbst, sondern das Unvermögen, die Bildinhalte sprachlich einzuholen. Bilder sind aber stets in Sprache eingebettet. Selbst die sonst so bildabstinenten Historiker haben 2006 zum ersten Mal in ihrer Verbandsgeschichte den Bildern einen Historikertag gewidmet, um diese in die Geschichtsschreibung einzubeziehen. Deshalb stellt sich die Frage, wie Text und Bild aufeinander bezogen werden. Mitchell benutzt dafür - es wurde oben bereits erwähnt - den Begriff der "Vernähung" von Schrift und Bild. Dieser Frage hat sich Hartmut Stöckl gewidmet und anhand der Werbung 13 Formen der Text-Bild-Interferenz herausgearbeitet.
Textverfasser und Bildproduzent sind in den Kompositmedien selten die selbe Person. Federführung hat in der Regel der Schreiber. Er ist es, der die "Vernähung" vornimmt. Es geht um die verschiedenen Weisen, wie Text und Bild neben- und ineinander gestellt werden. Dafür gibt es unterschiedliche Strategien.Bilder ergänzen den Text, weil die Sprache nicht ausreicht, einen Sachverhalt zu beschreiben. Das gilt besonders für Sachverhalte und Gegenstände, die dem Leser unbekannt sind. Die Sprache kann beispielsweise ein Gesicht beschreiben, sie überlässt es aber der Imaginationsfähigkeit des Lesers, sich dieses vorzustellen. Es ist aber dann ein vorgestelltes und nicht das dokumentarische Gesicht.
Bilder werden durch signifikative Legenden dem Sinn des Textes angeglichen, obwohl der Bildinhalt etwas anderes darbietet. Das muss nicht immer in fälschender Absicht geschehen, oft weiß es der Autor des Textes nicht besser und projiziert seinen Sinn in das Bild hinein.
Bilder werden gefälscht, damit das Bild dem Text nicht widerspricht.
Sprache im Kopf des Betrachters: Die These dieser Überlegung war, dass wir visuell dargestellte kulturelle Gehalte (z.B. politische, historische, religiöse) stets mit Hilfe von Sprache dekodieren. Als Gegenargument könnte vorgebracht werden, dass Erinnerungen und vorhergehende Lernprozesse den Weg über Sprache überflüssig machen. Wenn die Erinnerung am Werk ist, meint der Betrachter, Ähnliches schon gesehen zu haben. Auch wenn man einmal davon absieht, dass in unserer Gegenwartskultur alles durch Sprache präsentiert wird, bleibt die Sprache im Kopf des Betrachters dennoch am Werk.
Wie die Differenz zweier kleiner Worte bei einem Bild einen unterschiedlichen Dokumenten- und Erzählsinn erzeugen, zeigt ein Bild - eigentlich ein Standfoto - aus dem jugoslawischen Bürgerkrieg (vgl. Bild 4 der PDF-Version). Es wurde von der Reporterin Penny Marshall und ihrem Kameramann Jeremy Irvin am 5. August 1992 im serbischen Trnopolje aufgenommen.Auch wenn ein Betrachter bestimmte Bildzeichen nicht für sich in Sprache übersetzt (Stacheldraht, abgemagerter Mensch), erschließt sich der Bedeutungsgehalt dieser Bildzeichen durch visuelle Erinnerung und assoziative Lernprozesse. Die Begriffe Stacheldraht und Hunger verbinden sich semantisch zu "Konzentrationslager". Den Betrachter verleitet seine Kenntnis der Bilder aus deutschen Konzentrationslagern zu einer bestimmten Sichtweise: Er deutet die Aufnahmen so, dass sich die Personen hinter dem Stacheldraht befinden. In Wirklichkeit stehen sie vor ihm. Trnopolje war als Transit- und Flüchtlingslager nicht eingezäunt. Der abgemagerte Mann in der Mitte, der Bosnier Fikret Alic, war erst vor neun Tagen nach Trnopolje gekommen. Die Begriffe "vor" und "hinter" konstituieren eine fundamentale Differenz. Sie legen zwei gegensätzliche Legenden nahe: "Opfer ethnischer Säuberungen" oder "Neugierige Flüchtlinge".