Laut der viel zitierten Studie des Rats für Kulturelle Bildung schätzen Jugendliche YouTube vor allem für das eigenverantwortliche, selbstorganisierte Lernen (engl.: Self-Directed Learning) außerhalb von formalisierten Bildungssettings (z.B. Schule; Rat für Kulturelle Bildung, 2019). Selbstorganisiertes Lernen zeichnet sich dadurch aus, dass der/-die Lernende in die Lage versetzt ist, ohne die Hilfe von anderen seine/-ihre Bedürfnisse und Ziele zu beschreiben, die dafür notwendigen Ressourcen (z.B. menschliche Unterstützung, Materialien) zu definieren, darauf basierende Lernstrategien zu erarbeiten und umzusetzen und diese schließlich hinsichtlich des Lernerfolgs zu evaluieren (für einen Überblick siehe Lee, Osop, Goh & Kelni, 2017). Bei dieser Variante des Lernens liegt die Kontrolle über Motivation, Bedarf, Zeitpunkt, Methoden und Erfolg des Lernens vollkommen bei den Lernenden selbst (Wolf, 2020). Gleichzeitig ermöglicht dieser Ansatz eine adressat/-innengerechte Auswahl von Inhalten: Passen Sprache, Aussehen, mediale Gestaltung zu meinem Vorwissen und meinen Erklärpräferenzen? Das sind hohe Anforderungen für die Lernenden, die sich wiederum positiv auf deren Selbstwirksamkeit, Gefühl der Selbstbestimmung und Autonomie auswirken können – wie eine Sentiment- und Inhaltsanalyse von Nutzer/-innenkommentaren unter YouTube-Lernvideos ergab (Lee et al., 2017).
Herausforderungen selbstbestimmter Videoauswahl
YouTube stellt eine unbegrenzt scheinende Vielfalt und Menge an Inhalten zu jeglichen Themen und für unterschiedlichste Zielgruppen zur Verfügung (zu Inhalten siehe auch
Die größte Herausforderung scheint jedoch die selbstbestimmte, kompetente Auswahl an relevanten Inhalten zu sein. Diese stellt hohe Anforderungen an Medienkompetenz, Orientierungswissen und Entscheidungsfähigkeit der Lernenden. So fordert nicht nur die Suche nach bestimmten Stichworten die Nutzenden heraus, sondern auch die Referentialität der Plattformen (Stalder, 2016). Diese Referentialität äußert sich in unterschiedlichen Aspekten: So werden Inhalte auf der Plattform über Algorithmen nach vordefinierten Prinzipien (siehe dazu auch
(Lern-)Videos gelten für die Nutzenden dann als hilfreich, wenn sie ihnen relevant, aktuell und auf die Bedürfnisse angepasst erscheinen (Lee & Lehto, 2013). Qualitative Studien zu verschiedenen Formaten von funk verdeutlichen, dass Videos v.a. auch optisch ansprechend und schnell erfassbar sein sollten, um die Aufmerksamkeit der Nutzenden zu erhalten (Feierabend, Philippi & Post-Petters, 2018). Sogenannte Erklärvideos sind gemäß einer systematischen Analyse von Studien zu Gestaltungselementen insbesondere dann bedeutsam für den Lernerfolg, wenn sie strukturiert sind und Pausen enthalten, die Art der Darstellung der erklärenden Person scheint nur geringe Effekte auf den Lernerfolg zu haben (Findeisen et al., 2019). Den Ergebnissen im Hinblick auf die Wahrnehmung und Bewertung von Influencer/-innen folgend, scheint es jedoch notwendig, dass die Personen von der Zielgruppe mindestens als authentisch und glaubwürdig wahrgenommen werden, eine höhere Sprechgeschwindigkeit der Protagonist/-innen wirkt sich zudem positiv auf das Engagement mit dem Inhalt des Videos aus (Findeisen et al., 2019).
Jedoch ist nach der Auswahl von Videoangeboten noch nicht alles gewonnen – schon gar nicht der sichere Lernerfolg. Zwar bieten Videos im Vergleich zu Büchern die Möglichkeit, am Modell zu lernen, Dinge sofort auszuprobieren und die Lerngeschwindigkeit selbst zu steuern (Findeisen et al., 2019; Sofatutor, o.D.). Außerdem können Videos die Nutzenden nicht nur kognitiv, sondern z.B. durch Musik oder Mimik der/-des Sprechenden auch emotional ansprechen (Fey, 2002) bzw. gar zum Aufbau parasozialer Beziehungen mit den Akteur/-innen der Videos führen. Eine Identifikation mit den Akteur/-innen von Medieninhalten sowie das Gefühl, in die Handlung hineintransportiert zu werden – kurz das narrative Involvement in eine irgendwie geartete Geschichte – kann dazu führen, dass die Rezipient/-innen die Ziele und Haltungen der Protagonist/-innen übernehmen, Empathie entwickeln bzw. gar Verhaltensweisen im Sinne des Medienangebots entwickeln (z.B. Cohen, 2001; Murphy et al., 2013). Zudem kann das narrative Involvement mit einem Medienangebot zu einer Reduzierung von Reaktanz und Counter-Arguing mit einer Meinung führen (z.B. Slater & Rouner, 2002; Moyer-Gusé, 2008). Die Plattform kann weiterhin der Vernetzung und Bildung von Lerngemeinschaften dienen (J. Burchert & M. Burchert, 2018). Allerdings ist die Angebotsvielfalt bei YouTube groß, aber nur wenige Videos sind inhaltlich hochwertig (siehe z.B. die Inhaltsanalysen von Videos von Azer, 2012; Azer et al., 2012; Fischer et al., 2013; Raikos & Waidyasekara, 2013). Viele Videos, welche Lerninhalte oder Anleitungen zur Verfügung stellen, beinhalten Laienwissen in Form einer "Everyday Expertise" bzw. Produktplatzierungen oder Werbung (Rahm-Skågeby & Rahm, 2015). Ein qualitativ hochwertiges und auf die Zielgruppe und ihre Bedürfnisse abgestimmtes Gegengewicht für gesellschaftliche und politische Themen soll das 2016 ins Leben gerufene Online-Angebot funk von ARD und ZDF im deutschsprachigen Raum bieten (Feierabend et al., 2018). Zur Auflösung der Fußnote.
Wenngleich soziale Medien das Potential haben, auch marginalisierten Stimmen und Subkulturen einen Raum zu geben (Horak, 2014; Nakagawa & Arzubiaga, 2014), bilden sich bei den auf YouTube besonders erfolgreichen und prominenten Angeboten gesellschaftliche Machtstrukturen (weiß, männlich, mittelalt) und traditionelle Rollenbilder ab (z.B. Kruse & Veblen, 2012; Frühbrodt & Floren, 2019; Prommer et al., 2019). Weiterhin besteht wie bei sämtlichen anderen Angeboten des Web 2.0 die Gefahr auch auf problematische Inhalte wie Angebote populistischer und extremistischer Akteur/-innen oder Falschinformationen zu treffen.
Vorwissen und Kritikfähigkeit von Seiten der Nutzenden ist demnach für die Auswahl von sachlichen und von Diversität geprägten Inhalten dringend erforderlich, kann jedoch bei den Nutzenden nicht vorausgesetzt werden. Genau aus diesem Grund ist Medienwissen
Almeida und Almeida (2018) gehen der Frage nach, wie audiovisuelle Lernangebote gestaltet sein sollten, damit sie interessant für Kinder und Jugendliche sind. Einem design-basierten Forschungsansatz folgend evaluierten sie in mehreren Runden (z.B. Fokusgruppen) Videoangebote und deren Charakteristika sowie Distributionsstrategien. Besonders wichtig waren den Jugendlichen bei Webvideos visuelle Aspekte wie Comic-Stil und Animationen, aber auch Aspekte der Präsentation wie entspannt wirkende Protagonist/-innen, eine klare Sprache, geringer Detailgrad in der Sprache, Beispiele, Soundeffekte und eine kurze Dauer des Videos.
Rezeption und Wirkung von Webvideos
Inwiefern durch die Rezeption von Webvideos Wissenserwerb angestoßen werden kann, dazu gibt es bisher kaum belastbare empirische Studien (z.B. Ketsman, Deher & Santana, 2018). Hier lassen sich jedoch Bezüge zu frühen medienpädagogischen Arbeiten, Studien aus der politischen Kommunikationsforschung sowie psychologische Forschungsarbeiten zur Rezeption- und Wirkung multimedialer Inhalte herstellen. Die Ergebnisse der drei genannten Bereiche beschreiben ein uneinheitliches Bild, mit dem unterschiedlichste Annahmen und Hoffnungen verbunden sind. Tulodziecki (2020) greift in seinem Beitrag zu Bildungsfernsehen und YouTube vier Themenfelder der Medienpädagogik beispielhaft heraus, die sich weitgehend problemlos auf (Bildungs-)Angebote bei YouTube, z.B. Erklärvideos, übertragen lassen:
Mit der Entwicklung des sogenannten Bildungsfernsehens war die Hoffnung verbunden, Bildungsprozesse bei den Zuschauer/-innen anzustoßen. Wasem (1965) betrachtet diese Annahme sehr kritisch. Er betont die Notwendigkeit einer aktiven Auseinandersetzung der Zuschauer/-innen mit den Inhalten, um Bildungsprozesse zu ermöglichen: "Fernsehbildung [setzt] ein gewisses Eigen- und Selbständigkeitsgefühl der Zuschauer voraus, sie lebt von der Stellungnahme der Schauenden, sie verwirklicht sich erst durch das Tätigwerden der ‚Sehenden‘ in der Auseinandersetzung mit dem Dargebotenen, sie erfordert, daß er das Angebotene in einen entsprechenden Zusammenhang stellt" (ebd., S. 119). Das Medienpädagogische Manifest (2009, 2019) "Keine Bildung ohne Medien" wiederum betont die Unabdingbarkeit von Medien für Bildungsprozesse jeglicher Art – jedoch unter der Bedingung eines kompetenten Umgangs.
Eine weitere Annahme verbunden mit frühen audiovisuellen Lerninhalten ist, dass das "Lehren durch oder mit Fernsehen dem herkömmlichen Lehrerunterricht überlegen ist" (Tulodziecki, 2020, S. 15). Tulodziecki kommentiert diese Annahme mit Ausführungen zur Wirksamkeit von Schulfernsehen. Studien zeigten keine Überlegenheit von TV-Lerninhalten gegenüber dem herkömmlichen Unterricht. Zwar können u.U. auch Lernprozesse angestoßen werden. Lernende können aber auch durch eine eingängigere Darstellung der Inhalte das Gefühl haben, besser zu lernen. Diese Selbstsicherheit kann in einer geringeren kognitiven Anstrengung und damit in einer schlechteren Verarbeitung der Inhalte münden (siehe auch Kammerer et al., 2013 bzw. AIME-Modell nach Salomon, 1983). Die besten Ergebnisse brächten eine pädagogische Rahmung – also Vor- und Nachbereitung – von Fernsehinhalten durch Lehrer/-innen (Tulodziecki, 2020, vgl. auch
Interner Link: Schulische und universitäre Lernsettings zur Einbindung von Webvideos in formalisierte Settings).Mit der Erwartung, dass das Fernsehen Lehrer/-innenmangel bzw. fehlende Qualifikationen der Lehrenden ausgleichen kann, wurden laut Tulodziecki (2020) vor einigen Jahren mehrere Schulfernsehsendungen produziert, z.B. zu Themen wie Mengenlehre oder Fremdsprachen. Aber auch hier zeigen sich Herausforderungen des selbstgesteuerten Lernens für den Lernerfolg. Einerseits waren damals umfangreiche Begleitmaterialien notwendig, welche auch heterogene Lerngruppen adressierten. Andererseits kamen soziale Bedürfnisse der Lernenden zu kurz. Ein Befund, der sich auch in der Studies des Rats für kulturelle Bildung wiederfindet (2019).
Die vierte von Tulodziecki (2020) beschriebene Annahme war, dass das Fernsehen zu einer Demokratisierung von Bildung führe. Damit verbunden waren Überlegungen, dass sozial und regional benachteiligte Schichten erreicht, Wissensklüfte geschlossen werden und sich Bildungsreserven erschließen würden. Aber die grundsätzliche Verfügbarkeit von potentiell bildungsförderlichen Inhalten garantiert nicht deren kompetente Nutzung. Es sind motivationale und kognitive Bedingungen für die Auswahl und Rezeption von bildungsrelevanten Inhalten notwendig, die bei bildungsbenachteiligten Personen nicht zwingend gegeben sind. Zusätzlich besteht hinsichtlich der Nutzung digitaler Medien ohnehin die Befürchtung, Wissensklüfte und (digitale) Spaltungen eher zu vergrößern als zu schließen (siehe z.B. Kümpel, 2020; Scheerder, van Deursen & van Dijk, 2017). Zudem sind insbesondere in informellen Kontexten höhere motivationale, kognitive und zeitliche Ressourcen notwendig als unter formalisierten Bedingungen.
Im Hinblick auf politische Informationen im TV zeigen Studien aus der politischen Kommunikationsforschung, dass sich mit audiovisuellen Inhalten Sprachbarrieren überwinden lassen, gleichzeitig steigt die Motivation insbesondere bildungsferner Menschen, sich mit den Inhalten auseinanderzusetzen. Letzteres wiederum kann zu einer Steigerung von politischer Selbstwirksamkeit und der Bereitschaft zur politischen Partizipation führen. Allerdings sprechen Befunde z.B. im Hinblick auf den Erwerb politischen Wissens infolge der Fernsehnutzung eher gegen audiovisuelle Angebote, da sie eher auf Emotionalisierung und Unterhaltung als auf Information setzen würden (für weitere Details verweise ich auf Fußnote 21). Auch Schmidt-Borcherding (2020) verweist darauf, dass zwar Personen mit niedrigerer Lesekompetenz von gesprochenen Worten profitieren können, eine Übertragung von Informationen ins Langzeitgedächtnis wird jedoch eher durch die Verarbeitung geschriebenen Textes gewährleistet. Dies spricht seiner Ansicht nach für einen Einstieg in ein Thema mit Videos, aber einer Vertiefung durch andere Methoden (z.B. Textverarbeitung).
Ein weiterer Forschungszweig sind Arbeiten zur Rezeption und Wirkung multimedialer (Online-)Inhalte. Sowohl das Limited Capacity Model of Mediated Message Processing von Annie Lang (z.B. 2006) als auch die Arbeiten zur Cognitive Load Theory (z.B. Sweller, 1994) sowie das Capacity Model of Comprehension of Educational Content on Television (Fish, 2000) gehen von erhöhten Anforderungen an die kognitiven Aufnahme- und Verarbeitungskapazitäten der Nutzenden durch multimediale Medieninhalte aus. Im Gegensatz zum Lesen von Texten würden bei der Nutzung multimedialer Inhalte mehr kognitive Ressourcen im Arbeitsgedächtnis für die Verarbeitung von Informationen benötigt. Je mehr mentale Anstrengung investiert werde, umso tiefer ist das Verständnis der Inhalte (z.B. Salomon, 1983). So müssen etwa bei der Rezeption audiovisueller Inhalte sowohl visuelle als auch auditive Informationen verarbeitet werden. Bei Bildungsinhalten besteht außerdem der Anspruch, dass die Nutzenden die narrativen und edukativen Inhalte und ihre Beziehung zu einander gezielt verarbeiten (Fisch, 2000); dies ist bei linearem (Bildungs-)Fernsehen umso herausfordernder, da sich die Rezipient/-innen an die Geschwindigkeit des Programms halten müssen (ebd.). Der Erfolg der Verarbeitung der Inhalte ist laut Fish von Charakteristiken auf Seiten der Nutzenden (z.B. Vorwissen, Interesse) sowie Eigenschaften des Angebotes selbst (z.B. Komplexität & Kohärenz der Darstellung, Advanced Organizer, zeitliche Organisation der Inhalte) abhängig. Zwar ist bei Webvideos die Linearität nicht mehr das Problem, d.h. die Nutzenden können die Inhalte jederzeit anhalten, abbrechen, wechseln, sofern sie sich durch diese zu sehr herausgefordert fühlen. Allerdings bergen Webvideos aufgrund ihrer Einbettung in den größeren Zusammenhang einer Plattform zusätzliche Herausforderungen für die Auswahl und kognitive Verarbeitung von Informationen (z.B. weiterführende Links, Empfehlungen, Kommentare).
Mayer (z.B. 2005) geht in seiner Cognitive Theory of Multimedia Learning zwar auch von einer Limitierung kognitiver Verarbeitungsmöglichkeiten aus, unterstreicht aber auch die sich bietenden Möglichkeiten für multimediales Lernen. In der Regel sei davon auszugehen, dass der (gesunde) Mensch über mehr als einen Kanal für die Aufnahme und Verarbeitung von Informationen verfügt: Auge und Ohr. Es können sowohl auditive als auch visuelle Informationen separat aufgenommen und im Arbeitsgedächtnis verarbeitet werden. In Ergänzung können die Informationen beider Kanäle einander unterstützen. Diese Informationen dürfen einander aber nicht widersprechen oder im Hinblick auf die Art und den Umfang unterscheiden, da die Aufmerksamkeit der Nutzenden dazwischen aufgeteilt werden muss (Schmidt-Borcherding, 2020). Das bedeutet auch, dass die sensorischen Anforderungen an die Selektion multimedialer Information niedrig sein sollten. Etwa sollte die visuelle Dynamik (z.B. überflüssige Animationen) eines Videos nicht zu groß – und damit ablenkend – sein. Die Informationen beider Kanäle sollten kohärent, (zeitlich) kongruent und einander "nah" sein. Hinweisreize für Lenkung der Aufmerksamkeit der Rezipient/-innen helfen bei der Verknüpfung visueller und auditiver Informationen. Sie sollten die Lernenden dabei unterstützen, ein mentales Modell der eingehenden Informationen zu erstellen, um dieses im nächsten Schritt ins Langzeitgedächtnis zu überführen (ebd.). Kulgemeyer (2020) gibt einen guten Überblick über didaktische Kriterien für gute Erklärvideos. Eine umfassende Überprüfung dieser Kriterien im Hinblick auf intendierte Wirkungen von Erklärvideos steht jedoch noch aus.
Wichtige Bedingung in allen Modellen der Informationsverarbeitung sind Motivation, Aufmerksamkeit und individuelle kognitiven Fähigkeiten der Nutzenden. Schmidt-Borcherding (2020) nennt zudem die Unterstützung von Lernvideos durch weitere Lernstrategien, z.B. Anschlusskommunikation, Zusammenfassungen erstellen, als notwendige Rahmenbedingungen. Sowohl die Steuerung von Motivation und Aufmerksamkeit als auch die Bereitstellung weiterer Lernstrategien und eines entsprechenden Raums für deren Anwendung sprechen für die Einbettung von (Lern-)Videos in pädagogische Settings.
Zuweilen geht es bei Webvideos, nicht nur um die Vermittlung von (Fakten-)Wissen. So können die Vermittlung von Haltungen und Perspektiven oder gar die Förderung (z.B. demokratiebefürwortender) Einstellungen
Videos, die dem Feld der primären bzw. universellen Radikalisierungsprävention zuzuordnen sind, lassen sich in der Regel diesem Spektrum an Webvideos zuordnen. Die primäre bzw. universelle Radikalisierungsprävention richtet sich an alle nicht-radikalisierten Menschen bzw. an Menschen, die sich ausdrücklich nicht in Radikalisierungsprozessen befinden. Diese Videos werden je nach pädagogischer und wissenschaftlicher Auseinandersetzung als sogenannten Gegenbotschaften (i.e. Counternarrative) bzw. Alternative Narrative oder auch "positive Botschaften" bezeichnet.
Die wissenschaftliche Begleitforschung zur Webvideoreihe "Jamal Al-Khatib", welche sich auf der Schnittstelle von Primärprävention und Sekundärprävention bewegt, kommt zu dem Ergebnis, dass mit den bei YouTube veröffentlichten Videos und die begleitende Social-Media-Kampagnen immerhin relevante, u.U. sogar gefährdete Zielgruppen erreicht werden konnten (Reicher & Lippe, 2019). Hier haben sich zentrale Aspekte der Digitalität (Stalder, 2016) wie Referentialität, Vergemeinschaftung und Algorithmizität vermutlich positiv auf die Verbreitung und Rezeption der Videos in der Zielgruppe ausgewirkt. Inwiefern mit den Videos Wissen und Einstellungen bei der Zielgruppe beeinflusst werden können, das bleibt vor dem Hintergrund der Begleitforschung zum Projekt unklar.
Die Bereitstellung von Webvideos v.a. auch zu politisch kontrovers diskutierten Themen für das selbstorganisierte Lernen kann aber auch unerwünschte Folgen haben. So können die algorithmische Verschränkung von Inhalten sowie die Äußerungen von Nutzer/-innen unter Videos erst den Kontakt zu problematischen (z.B. extremistischen Botschaften) ermöglichen (vgl. z.B. Ernst et al., 2017; Ernst & Schmitt, 2020; Schmitt et al., 2018).