Im Rahmen empirischer Sozialforschung (Empirie von griechisch empireia = Erfahrung, Erfahrungswissen) werden häufig Ergebnisse von empirischen Erhebungen (Umfragen) für Untersuchungen ausgewertet und anschließend in Form von Tabellen oder Diagrammen veröffentlicht. Auf ähnliche Weise könnt ihr die Daten eurer eigenen Umfrage mithilfe der Software GrafStat auswerten.
Einfache Häufigkeitsauszählung
Zunächst einmal solltet ihr mit einfachen Auswertungen anfangen. Eine einfache Häufigkeitsauszählung, also die Auswertung eines einzelnen Merkmals/Items (= Frage des Fragebogens) bietet sich hierzu an. Dabei wird zuerst das gewünschte Merkmal in GrafStat ausgewählt und dann in Form eines Tabellendiagramms oder eines grafischen Diagramms dargestellt.Das Tabellendiagramm
Das Tabellendiagramm stellt die Daten – wie der Name schon sagt – in Form einer Tabelle dar. Meistens enthalten Tabellendiagramme eine Fülle von Zahlen. Sollen hier gezielt Informationen entnommen werden, ist es wichtig, sich zunächst einen Überblick über den Aufbau der Tabelle zu verschaffen, um sich zu orientieren.
Die Tabellenüberschrift gibt Auskunft darüber, welches Merkmal/Item ausgewertet wird. Die Daten der dazugehörigen Antwortmöglichkeiten werden in den Zeilen, der Tabelle angezeigt.
Einstellen kann man auch die Art der Zahlen: Absolute Zahlen geben Mengen, Größen, Häufigkeiten an, während relative Zahlen (Prozentwerte) einen Zusammenhang zwischen einem Zahlenwert zu einer anderen Größe, meist der Grundgesamtheit, herstellen. Prozentwerte können nicht nur Informationen/Aussagen über ein Verhältnis des Einzelnen zum Ganzen geben, sondern auch Informationen schlucken. Gerade bei kleinen Häufigkeiten sollte man daher überlegen, ob die Darstellung in % Sinn macht.
Grafische Diagramme
Häufiger als Tabellendiagramme findet man grafische Diagramme wie Kreis-, Säulen-, Balken- oder Flächendiagramme zu den Daten, da mit ihnen oft eine bessere Übersichtlichkeit erreicht wird. Auch hier muss man sich zunächst orientieren: Was befindet sich auf der x-Achse, was ist auf der y-Achse dargestellt? Ebenfalls können die Werte hier absolute oder prozentuale Zahlen sein, was bei der Auswertung und Beschreibung der Daten zu beachten ist.
Egal für welchen Diagrammtyp man sich entscheidet, geht es zunächst einmal darum, genau zu beschreiben, was man dem Diagramm entnehmen kann. Hierzu gehören neben einer Beschreibung der Daten mit Hinweis auf evtl. Auffälligkeiten auch statistische Kennwerte, wie arithmetisches Mittel, Median, Quartile und Standardabweichung, die die Software GrafStat bei einigen Fragetypen (Skalenfragen und Maßzahlfragen) ebenfalls liefert. Nach einer genauen Beschreibung der Daten, gilt es diese zu interpretieren und analysieren. Wo gibt es Auffälligkeiten, große Unterschiede, eine untypische Verteilung etc. und wie können diese Phänomene erklärt und ggf. Zusammenhänge/Abhängigkeiten überprüft werden. Die Software GrafStat beschränkt sich zwar auf beschreibende Statistik, so dass statistische Prüfverfahren hier nicht möglich sind, aber man kann evtl. zumindest Tendenzen ausmachen.
Einordnung der Daten
Für die Interpretation der Daten ist auch eine Einordnung sinnvoll. Hierzu können die eigenen Daten und Ergebnisse der Datenanalyse mit den Ergebnissen von offiziellen Studien verglichen werden – vorausgesetzt, man hat im Fragebogen die gleiche Fragestellung (inkl. Antwortitems) verwendet, denn nur so sind die Daten wirklich vergleichbar. Bei der Analyse der Vergleichsdaten ist zunächst ein Blick auf die Quellenangabe hilfreich, denn sie gibt Auskunft über die Herkunft – und somit meist auch über die Glaubwürdigkeit – sowie das Alter der Daten. Häufig werden zusammen mit den Statistiken/Diagrammen auch begleitende Texte veröffentlicht, diese enthalten z.B. Angaben zur Grundgesamtheit [N], bei Umfragen also die Anzahl der insgesamt befragten Personen, sowie weitere Hintergrundinformationen, die für die Einordnung und Interpretation der Ergebnisse von Bedeutung sein könnten.
„Traue keiner Statistik …“ - Fehler vermeiden!
Leider können beim Erstellen und Auswerten von Diagrammen und Statistiken auch Fehler unterlaufen. Mögliche Fehlerquellen – ob unabsichtlich oder provoziert - beim Erstellen und Lesen von Statistiken sind zum Beispiel:
Fehlerhafter Sprachgebrauch bei der Beschreibung der Zahlen im begleitenden Text: Wenn im Text beispielsweise "41% aller Befragten" steht, sich die Prozentzahlen aber nur auf eine Teilgruppe, z.B. die Gruppe der weiblichen Befragten bezieht, so ist die Formulierung im Text falsch und führt zu Missverständnissen. (Insbesondere bei der Beschreibung der Zahlen in Kreuztabellen sollte man beachten, auf welche Grundgröße sich die Prozentwerte beziehen!).
Fehlerhafter Sprachgebrauch kann aus Unklarheit der statistischen Begriffe resultieren: z.B. Mittelwerte: Median <-> arithmetisches Mittel->
Fehler bei der Interpretation der Daten: Ein Fehler bei der Interpretation der Daten kann z.B. die fehlende Unterscheidung von Kausalität <-> Korrelation sein: Eine Korrelation stellt nicht unbedingt einen Kausalzusammenhang her. "Bierverbrauch pro Kopf in Deutschland ist signifikant höher als in Finnland." und "Die Pisa Ergebnisse in Finnland liegen deutlich höher als in Deutschland": Daraus folgt natürlich nicht, dass der Bierverbrauch Schuld am schlechten Abschneiden Deutschlands in der Pisa Studie ist.->
Unzulässige Verallgemeinerung oder Herausstellungen von Ergebnissen: Ergebnisse der Klassenbefragung können z.B. nicht auf die gesamte Schule oder Jahrgangsstufe oder gar die Jugendlichen in Deutschland generell übertragen werden.
Fehlerhafte Bilddarstellung: Die Darstellungsform ist eine der häufigsten Fehlerquelle, so findet man recht häufig Darstellungsformen, die eine Tendenz unterstützen (z.B. durch Skalierungen, die nicht bei 0 anfangen --> Zuwächse/Steigerungen sehen viel größer aus, als sie in Wirklichkeit sind.)
Fehlende wichtige Zusatzinformationen: Durch versehentliche oder aber auch absichtliche Unterschlagung von wichtigen Zusatzinformationen zur Befragtengruppe, dem genauen Wortlaut der Frage(n), Zeitpunkt der Befragung etc. wird die Aussagekraft von Statistiken gemindert, was u.U. zu Fehldeutungen führen kann.
Mit diesem Wissen im Hinterkopf, sollte der Auswertung und Interpretation eurer Daten (inkl. Einordnung mittels Vergleichsdaten) nichts mehr im Wege stehen.
Das Arbeitsmaterial ist hier als