Es geht ein Gespenst um in den Feuilletons: Durch zunehmende "Cancel Culture" sich verengende Debatten- und Meinungskorridore, mögliche "Schweigespiralen" (Elisabeth Noelle-Neumann, 1980), durch die Forderung nach "Safe Spaces" (sicheren Orten) seien das kritische Denken und die Universität in Gefahr. Dagegen wettern andere, dieser Alarmismus sei lediglich Ausdruck schwindender Privilegien mancher Gruppen, die aggressiv darüber lamentierten, nicht mehr unwidersprochen rassistische oder sexistische Ansichten vertreten zu können. Diese Debatte wird seit Jahren auch in den USA geführt und ist von wechselseitigen Missverständnissen, Empörungsrhetorik, Abwehr und Polemik geprägt. Das wird nachvollziehbar vor der Geschichte dieser Debatte, an der deutlich wird, wie sehr die scheinbar über jeden Zweifel erhabene Verteidigung von Meinungs- und Wissenschaftsfreiheit auch dazu genutzt werden kann, Bedrohungs- und Untergangsszenarien zu inszenieren,
Was also ist empirisch dran an diesen Warnungen? Unter dem Titel "Ist die Meinungsfreiheit an der Universität in Gefahr? Einige vorläufige Befunde anhand eines ‚Most likely case‘" haben wir, Matthias Revers und Richard Traunmüller, Ende 2020 eine Studie vorgelegt,
Insbesondere innerhalb der deutschsprachigen Soziologie gab es neben interessierter Würdigung auch kritische Reaktionen auf den Artikel, einschließlich und vornehmlich angestoßen von der Ko-Autorin dieses Beitrags, Paula-Irene Villa. Sie hat sich insbesondere auf Twitter mit Kolleg_innen aus der Soziologie und benachbarten Sozialwissenschaften über Fragestellung, Methode, Ergebnisse und framing des Textes ausgetauscht. Matthias Revers hat sich an dieser geringfügig beteiligt, und so kamen wir zu dritt in ein Fachgespräch, das wir im Dezember 2020 bei einem ersten virtuellen Treffen produktiv vertieft haben.
Ziel dieses Beitrags ist es, gemeinsam soziologisch und als Beteiligte über die Debatte rund um die Studie zu reflektieren und zur weiteren Fachdiskussion über Methoden und Kontexte, aber auch Grenzen der empirischen Forschung zum Themenkomplex "Meinungsfreiheit, Toleranz und Debattenkultur" in der deutschen Hochschullandschaft anzuregen. Zweck dieses Beitrags ist es außerdem, an diesem Thema die enorme Breite und Vielseitigkeit der Soziologie zu "testen", sie miteinander (stärker als bislang) ins (auch und gern kontroverse) Gespräch zu bringen, und die Debatte als Bereicherung zu nutzen und nicht als Behinderung zu verstehen. Dass dies punktuell misslingen kann und nicht mit einem Mal getan ist, auch das gehört zur guten Wissenschaft dazu. Gerade insofern wir als Sozialwissenschaftler_innen höchst unterschiedliche Methoden nutzen, verschiedene Forschungsschwerpunkte haben und auch divergierende normative Standpunkte vertreten, möchten wir uns nicht verachtungsvoll gegeneinander abschotten, sondern das Fachgespräch entlang von Fachfragen voranbringen.
Eine empirische Studie und ihre kritische Rezeption
Die Studie von Revers und Traunmüller hat an einem konkreten empirischen Fall, Studierende der Sozialwissenschaften an der Goethe-Universität Frankfurt am Main, die Frage untersucht, ob es empirische Hinweise auf die im öffentlichen Diskurs, im Feuilleton, in den Medien vielfach unterstellte oder verneinte (Selbst-)Zensur und eine Einschränkung der Meinungsvielfalt gibt. Werden also manche Themen und Ansichten, manche Begriffe oder (politische) Positionen in der Universität "gelöscht"/zensiert, aus Sorge um Stigma oder aus anderen politischen, also nicht fachlich immanenten Gründen vermieden? Wird das Sagbare in deutscher academia eingeschränkt? Dazu wurden Items zu Toleranz, Konformismus, Diskussionsbereitschaft beziehungsweise -unwille und Zurückweisungserfahrungen in universitären Debatten operationalisiert und Studierende befragt.
Klar ist, dass ein solches Design nicht die gesamte Breite und Komplexität dessen abbilden kann, was unter "Cancel Culture" diskutiert wird. Schon allein deshalb nicht, weil der Begriff derart vage und mehrdeutig ist, dass er umso besser politisch funktioniert, aber schwer zu operationalisieren ist. So ist beispielsweise in Bezug auf "Sagbares" und "Protest" gegen bestimmte Perspektiven wesentlich, zwischen Personen und Positionen zu unterscheiden. Auch ist nicht zu vernachlässigen, dass alle verwendeten Begriffe – wie "Zensur" oder "Kritik" – immer schon in normativen, teilweise (tages-)politischen Konstellationen stehen. Hier schon, beim Design, wird deutlich, wie sehr eine empirische Beforschung der Problematik davon abhängt, als was und wie das Problem gerahmt, bezeichnet, dann auch operationalisiert wird. Es bedarf hierbei auch qualitativer und nicht zuletzt auch historisch informierter Forschung, um den untersuchten Konstellationen nicht naiv "nach dem Mund" zu reden.
Die Ergebnisse lassen sich in drei zentralen Punkten zusammenfassen. Erstens, spreche sich ein beträchtlicher Anteil der Studierenden für eine Einschränkung der Meinungsfreiheit an der Universität aus. Je nach Thema würden zwischen 30 Prozent ("der Islam ist mit dem Westen unvereinbar") und 54 Prozent ("Homosexualität ist unmoralisch") der Studierenden einem Redner nicht erlauben, auf dem Campus zu sprechen. Und noch höhere Anteile, zwischen 64 Prozent ("es gibt biologische Unterschiede in den Talenten zwischen Männern und Frauen") und 83 Prozent ("Homosexualität ist unmoralisch"), waren der Meinung, dass Personen, die solche Ansichten vertreten, nicht an der Universität lehren dürfen. Etwa ein Drittel der Studenten würde auch ein Verbot der Bücher dieser Personen in der Universitätsbibliothek befürworten.
Zweitens, gebe es Hinweise auf Konformitätsdruck, der die Studierenden hemmt, sich frei zu äußern. So gibt etwa ein Viertel der befragten Studierenden an, für eine von ihnen gemachte Äußerung bereits persönlich attackiert worden zu sein. Ein Drittel der Befragten berichtet, dass sie es lieber vermeiden, in einer Seminardiskussion ihre ehrlichen Ansichten zu teilen.
Drittens, bestünden sowohl hinsichtlich des Wunsches, die Redefreiheit einzuschränken, als auch hinsichtlich der Hemmung, seine Meinung offen zu äußern, politisch-ideologische Unterschiede zwischen den Studierenden. Studierende, die sich politisch als links beschreiben, seien weniger bereit, "umstrittene" Standpunkte zu Themen wie Gender, Einwanderung oder sexuelle und ethnische Minderheiten zu tolerieren. Studierende, die sich selbst rechts der Mitte verorten, neigten eher dazu, sich zu zensieren.
An diesen Befunden wurde vielfach Kritik formuliert. So wandte etwa Paula-Irene Villa ein, dass es wichtig sei, zwischen Personen und Positionen zu unterscheiden. Dass Studierende also jemanden nicht einladen würden, der bestimmte Positionen vertritt, heißt nicht, dass sie diese Positionen nicht lesen, diskutieren, analysieren, verstehen würden. Anders ist es aber, wenn auch Bücher aus Bibliotheken "verbannt" werden sollten. Das ist tatsächlich ein Hinweis darauf, dass Positionen aus dem Raum der Universität ausgeschlossen werden sollten.
In dem Vortragsszenario sind Studierende wohlgemerkt nicht gezwungen, sich diesen Rednern beziehungsweise ihren Positionen auszusetzen. Sie könnten sich einfach "umdrehen und weggehen".
Paula-Irene Villa gibt des Weiteren zu bedenken, dass "persönlich attackiert" zu werden Unterschiedliches bedeuten kann: Die Übergänge zwischen Kritik, Angriff, Beleidigung, Debatte sind fließend, womöglich wird auch von den befragten Studierenden als Angriff gewertet, was als Kritik gemeint ist (eine Position sei "rassistisch" beispielsweise ist kein Angriff auf eine Person und kann sehr wohl als Sachargument gewertet werden). In dieser Hinsicht wäre eine vertiefende qualitative Analyse von Aussagen sinnvoll. Denn womöglich ist Widerspruch und Kritik soziologisch – wenn wir die Aussagen der Befragten ernstnehmen, diese aber nicht unkritisch-affirmativ glauben – tatsächlich ein Ausdruck von Debatte und Meinungsvielfalt. Denn Debatte bedeutet ja genau nicht, alle Positionen unkritisch und unwidersprochen gelten zu lassen. Hier ergibt sich weiterer Forschungsbedarf, insbesondere mit qualitativen Methoden, deren Erkenntnisse wiederum in die Itemformulierung einfließen können.
So wichtig die unterschiedlichen Schattierungen der gegenseitigen Kritik, des Widerspruchs und ihre Folgen für das Diskussionsklima sind, ein Fokus sollte auf Diskussionen liegen, die gar nicht erst stattfinden, und vor allem Stimmen, die sich nicht trauen, sich zu Wort zu melden. Die Konformitätsforschung Marie Jahodas, gemeinsam mit Stuart W. Cook,
Kritik, Lösungsvorschläge und Forschungsansätze
Die Kritik an der Studie von Revers und Traunmüller lässt sich grob auf zwei Ebenen verorten: erstens auf einer inhaltlich-methodischen, die Fragen des Designs, der Itemformulierung und den daraus abgeleiteten Schlüssen berührt; zweitens auf einer übergeordneten Ebene, die normative framings und die mögliche politische Rezeption der Ergebnisse betrifft. Viele der vorgetragenen Kritikpunkte sind klug, berechtigt und willkommen, andere wiederum leicht zu widerlegen, sachlich falsch oder schlicht überzogen. Die Fülle und Vielfalt zeigen, wie wichtig und diskussionswürdig das Thema ist, und wie sehr es dabei guter, reflexiver Forschung bedarf.
Im Folgenden geht es nicht um eine "Replik" auf die an der Studie geäußerte Kritik und auch nicht darum, die Einwände abzutun, zu entkräften, oder zu "erledigen". Unser Anspruch ist es vielmehr, die vorgetragene Kritik als Anregung zu nehmen, um über einzelne Aspekte der Studie nachzudenken, die richtigen Folgefragen zu stellen und möglicherweise lohnende nächste Untersuchungsschritte zu skizzieren.
Repräsentativität und Generalisierung
Eine erste Kritik der Studie betrifft die mangelnde Repräsentativität und die damit verbundene Frage, welche Schlüsse sich überhaupt aus den Ergebnissen ziehen lassen – und welche nicht. Diese Kritik betrifft zunächst das Studiendesign als Einzelfallstudie (most likely case design). Paula-Irene Villa hat darauf aufmerksam gemacht, dass die Auswahl des Einzelfalls als "most likely case" eine nicht hinreichend evidenzgestützte Wahl ist. Sie beruhe nämlich darauf, dass dieser Fachbereich im Lichte der in Frankfurt entwickelten Kritischen Theorie (Theodor W. Adorno, Max Horkheimer und andere) und damit auch die Studierenden deutlich "links" seien. Das mag anekdotisch (und im Fach zur Karikatur hin über-)evident sein, und warum auch nicht? Aber als Begründung für einen argumentativ-empirisch tragenden Einzelfall ist das prekär. So oder so, die Studierenden der Gesellschaftswissenschaften in Frankfurt sind nur ein und zudem ein besonderer Fall. Das wären die Soziologie Studierenden in Berlin, Kassel, München, Leipzig oder sonst wo allerdings ebenso. Was lässt sich anhand des Frankfurter Falles sagen?
Ein weiterer Kritikpunkt war die geringe Rücklaufquote und mögliche Verzerrung der Stichprobe. Selbst innerhalb der interessierenden Population war die Rücklaufquote sehr gering (14 Prozent). Die Netto-Rücklaufquote sinkt auf 7,5 Prozent, wenn nur diejenigen betrachtet werden, die auch mindestens 80 Prozent des Fragebogens ausgefüllt hatten. Wie beeinflusst dies die Interpretation der Befunde? Wir wollen an dieser Stelle keine technische Debatte zu Umfragemethodologie und der Frage führen, wie sich Rücklaufquoten in Onlineumfragen erhöhen lassen. Vielmehr möchten wir diese Kritik zum Anlass nehmen, uns die allgemeinere Frage zu stellen, inwieweit Studierende (und andere Hochschulangehörige) überhaupt nur selektiv erreichbar sind und was dies für Erforschung des Themenkomplexes Toleranz, Meinungsvielfalt und Diskussionskultur bedeutet. So besteht etwa die Gefahr, dass moderate Stimmen oder solche Stimmen, die ohnehin nur leise zu vernehmen sind, auch in der Untersuchung nicht zum Vorschein kommen.
Unabhängig davon, wie man Probleme von Einzelfallstudien im Detail einschätzt, erscheint es unmittelbar naheliegend und dringend geboten, die Untersuchung wie folgt zu erweitern: Erstens wissen wir bislang wenig über die mögliche Verbreitung von Intoleranz und ideologischem Konformitätsdruck an anderen Fachbereichen oder darüber, inwieweit sich die Ergebnisse auf andere universitäre Kontexte verallgemeinern lassen. Es ist daher ausdrücklich zu begrüßen, dass einige Kollegen Replikationen oder ähnlich gelagerte Studien an weiteren sozialwissenschaftlichen Fachbereichen vorgenommen haben. Dies ist etwa an der Universität Konstanz der Fall, was auch insofern aufschlussreich sein dürfte, als der Konstanzer Fachbereich einer gänzlich anderen Forschungstradition verpflichtet ist und als most dissimilar case zur Goethe-Universität Frankfurt am Main betrachtet werden kann. Die Konstanzer Befragung von 207 Studierenden harrt noch der Veröffentlichung und Diskussion, erste interne Ergebnisse
Zweitens lässt sich bislang nicht sagen, ob sich die Situation in den vergangenen Jahren wirklich verschlimmert oder womöglich verbessert hat. Denn politische Auseinandersetzungen und Auseinandersetzungen um Politik auf dem Campus sind mitnichten neu. Man denke etwa im deutschen Kontext nur an die Studierendenbewegung Ende der 1960er und in den 1970er Jahren, an den Widerstand von Studierenden im NS, an die Studentenproteste zum Ende der DDR hin. Politik auf dem Campus inklusive mehr oder minder massiver Proteste gegen einzelne Professor_innen oder Veranstaltungen, gegen bestimmte Inhalte oder Formen (etwa von Feierlichkeiten) gehören zu modernen Gesellschaften dazu. Was nun wiederum nicht bedeutet, dass sie immer angemessen, sachlich richtig oder nicht selbst autoritär sind. Für unsere Frage bedeutet dies wiederum, dass die aktuelle Situation Teil historischer Dynamiken ist, die ihrerseits soziologisch beforsch- und diskutierbar sind.
Drittens bedarf es weiterer Vergleichsgruppen sowohl innerhalb als auch außerhalb der Universität. Zum einen wäre es interessant zu erfahren, wie es um die Toleranz und mögliche Selbstzensur von Dozenten und Hochschullehrern (womöglich auch und gerade von Dozentinnen und Hochschullehrerinnen) sowie von Verwaltungsangestellten bestellt ist.
Viertens, und gerade in Anbetracht der Tatsache, dass der Antrieb für Sprachregelungen auf dem Campus aus dem Wunsch resultiert, empirisch redlicher, normativ reflexiver und diskriminierungssensibel zu sprechen sowie eine integrative Lernumgebung zu fördern, wäre es aufschlussreich, eine geschlechtsspezifische Perspektive sowie eine Perspektive derjenigen einzunehmen, die als ethnische, sexuelle oder in anderer Hinsicht als Minderheiten gelten. Die vorläufigen Befunde von Revers und Traunmüller legen einerseits signifikante Geschlechtsunterschiede in den Präferenzen für freie Meinungsäußerung und subjektiv empfundenen Konformitätsdruck nahe. Es bleibt jedoch offen, wie sich dieser Geschlechtseffekt erklären lässt, etwa durch unterschiedliche psychologische Dispositionen, kulturelle Normen oder Habitusformen. Andererseits unterscheiden sich bei Revers und Traunmüller Studierende mit ethnischen Minderheitenstatus kaum in ihrer Sensibilität, Toleranz oder dem empfundenen Konformitätsdruck. Doch ist hier sicherlich noch nicht das letzte Wort gesprochen und weiterführende Analysen, die freilich weitaus höhere Fallzahlen benötigen würden, sind dringend notwendig. Soziologisch vielleicht sogar noch relevanter, aber bislang völlig außen vorgelassen, sind Unterschiede entlang sozialer Herkunft und sozioökonomischem Status.
Ursachen
Neben der rein deskriptiven Bedeutung einer solchen Ausweitung auf weitere Kontexte, Zeitpunkte und Gruppen würde die anzunehmende Variation weitere Forschungsfragen nach den Ursachen und Konsequenzen von Toleranz, Meinungsvielfalt und Selbstzensur ermöglichen. Zwar gibt es zu den Ursachen soziologische Hypothesen, die von Sozialisation und veränderten Erziehungsstilen
Grundsätzlich, so gibt insbesondere Paula-Irene Villa zu bedenken, wäre auch zu untersuchen – sowohl in empirischen Arbeiten zu Einstellungen und Deutungen wie zu begriffshistorischen oder gesellschaftsdiagnostischen Zugängen, etwa auch mittels wissenssoziologischer Diskursanalysen – ob "Selbstzensur" nicht ein normativer Begriff ist, der auch in der deskriptiven Methodologie für Verzerrungen sorgt. Anders gesagt: Steckt womöglich (auch) Reflexivierung, Impulskontrolle, ethische Kompetenz, akademische Bildung, Debattenfähigkeit drin, wo für manche "Selbstzensur" draufsteht?
Weitere methodische Zugänge
Neben den klassischen Instrumenten der umfragebasierten empirischen Sozialforschung sind daher ohne Zweifel auch andere methodische Zugriffe nötig, die weniger auf die Teilnahmebereitschaft an Umfragen angewiesen sind. So könnten etwa digitale Plattformen, auf denen sich Studierende austauschen, interessante "nicht-reaktive" Einsichten liefen: Debatten in öffentlichen und geschlossenen Facebook-Gruppen für Studierende, in Uni-spezifischen Twitter-Feeds oder auch Whatsapp-Gruppen könnten sowohl digital qualitativ, beispielsweise ethnografisch, als auch (je nach Zugangsmöglichkeit) durch computergestützte Verfahren inhaltlich untersucht werden. Paula-Irene Villa ist in dieser Hinsicht zwar nicht ganz so enthusiastisch wie die beiden Autoren, sieht aber viele Möglichkeiten der qualitativen Forschung zum Thema, die an der Lehre ansetzt, etwa Forschungspraktika der Studierenden, Gruppendiskussionen oder Diskursanalysen von Selbstverständigungsmaterial in studentischen Kontexten.
Seminardiskussionen und die Dynamiken von Meinungsäußerungen, Meinungskonflikt und deren Regulierung lassen sich bereits jetzt mit den herkömmlichen Methoden der Gruppendiskussionen untersuchen. Im Kontext der Studie von Revers und Traunmüller konnten nur acht Teilnehmer für zwei solcher Gruppeninterviews rekrutiert werden. Obwohl diese Daten nicht in die Publikation eingeflossen sind, wurden sie genutzt, um die quantitativen Umfragebefunde einzuordnen. So wurde zum Beispiel erst in der Gruppendiskussion das zentrale Motiv hinter dem Wunsch, Personen mit kontroversen Positionen nicht an Universitäten unterrichten zu lassen, deutlich: Die Fokusgruppengespräche mit Studierenden legten nahe, dass die Studierenden befürchteten, dass Hochschullehrer ihre Meinung nicht von ihrer professionellen Rolle als Betreuer trennen können. Mit anderen Worten: Es bestand die Sorge, dass weibliche, muslimische, zugewanderte oder homosexuelle Studierende ungerecht behandelt werden könnten.
Toleranzbegriff und -messung
Mit Abstand am meisten Kritik zog die Toleranzmessung in der Studie auf sich. Revers und Traunmüller stützen sich auf den klassischen Ansatz von Samuel Stouffer,
Erstens ist das Maß ideologisch unausgewogen und zielt ausschließlich auf Befindlichkeiten sich selbst für links haltende Studierende. Da man nur tolerieren kann, was man ablehnt,
Zweitens vermischen die gewählten Toleranzitems moralische Wertaussagen mit empirischen Tatsachenbehauptungen.
Drittens versäumt es der gewählte Ansatz, das wichtige Problem der Verzerrung durch soziale Erwünschtheit in den Umfrage-Items anzusprechen. Angesichts der sensiblen Natur des Themas der freien Meinungsäußerung und der Einbeziehung von ethnischen und sexuellen Minderheitengruppen sind die Studenten möglicherweise einfach nicht bereit, die Wahrheit darüber zu sagen, was sie als akzeptable Meinungsäußerung empfinden. Deshalb, und vielleicht ironischerweise, könnte sogar der wahrgenommene Konformitätsdruck die Studenten viel weniger tolerant aussehen lassen, als sie es in Wirklichkeit sind.
Viertens, und das scheint uns am wichtigsten, sind die Items nicht in der Lage, die inhärente Konditionalität und Kontextabhängigkeit von Normen der freien Meinungsäußerung abzubilden. Was in den Augen der Studierenden akzeptabel ist und was nicht und welche regulatorischen Konsequenzen gefordert werden, hängt beispielsweise nicht nur davon ab, wer was zu wem sagt, sondern auch von dem spezifischen Kontext, in dem eine Äußerung gemacht wird und welche Wirkung sie hat. Bislang ist die empirische Forschung nicht gut gerüstet, um mit dieser Komplexität umzugehen.
Weiterführende Forschung und Bewertungskriterien
In einem Arbeitspapier adressieren Revers und Traunmüller diese Fragen und präsentieren ein Surveyexperiment, um die Bedingtheit und Kontextabhängigkeit von Präferenzen für die Regulierung von Sprache zu untersuchen. Insbesondere verwenden sie ein Vignetten-Experiment,
Eine mit Fragen der adäquaten Operationalisierung zentraler Konstrukte wie Toleranz, Meinungsvielfalt oder Selbstzensur unmittelbar verbundenes Problem ist die Frage nach der normativen Bewertung der ermittelten Befunde. Ab wann ist ein gewisser Antwortanteil oder eine Situation an der Universität überhaupt problematisch? Was ist viel Toleranz, was ist wenig? Reicht eine kleine laute intolerante Gruppe von fünf Prozent bereits aus, um das Diskussionsklima an der Universität zu kippen? Wie legt man diese Kriterien fest? Was sind sinnvolle Vergleichsgrößen aus anderen Kontexten?
Für brückenbildende Zusammenarbeit
Eine interessante Wirkung der Studie hatte geradezu performativen Charakter. So entdeckten Kolleginnen und Kollegen, die normalerweise keine quantitativ-methodische Standards anwenden, ihr Interesse an Umfrage-Rücklaufquoten. Andere, die selbst nicht in Peer-reviewed-Journalen veröffentlichen, fragen, wie die Studie von Revers und Traunmüller durch das peer review kommen konnte. Wieder andere, die in ihrer Forschung darauf bestehen, dass Sprache Gewalt sei, betrachten die Intoleranz von Studenten als unwichtig, weil es sich schließlich nicht um manifestes Handeln handele. Diese Kolleginnen und Kollegen sind keineswegs Heuchler und haben ja Recht damit, auf fachliche Aspekte hinzuweisen. Allerdings sind auch wir als Forscher nur Menschen und damit (politisch) motivierte Informationsprozessoren.
Einen sehr vielversprechenden Ansatz sehen wir in einer "Pre-registered Adverserial Collaboration".
Tatsächlich haben wir inzwischen sowohl einen Moderator als auch vier Kritiker_innen der Originalstudie für eine solches Unternehmen gewinnen können.
Dieser Beitrag erschien zuerst auf dem SozBlog, dem Blog der Deutschen Gesellschaft für Soziologie, und wurde für diese Ausgabe leicht überarbeitet.