Effekte der Mittelkategorie. Unterschiede zwischen einer 5-stufigen und einer 4-stufigen Likert-Skala


Hausarbeit, 2022

39 Seiten, Note: 1,3


Leseprobe


Inhaltsverzeichnis

Abbildungsverzeichnis

Tabellenverzeichnis

1 Einleitung

2 Theoretischer Überblick
2.1 Likert-Skalen und die Bedeutung der Mittelkategorie
2.2 Fehlerquellen durch Vorhandensein oder Fehlen der Mittelkategorie
2.2.1 Tendenz zur Mitte
2.2.2 Soziale Erwünschtheit
2.2.3 Mittlere Positionen und fehlende Mittelkategorie
2.3 Hypothese

3 Forschungsstand

4 Daten
4.1 Daten
4.2 Stichprobe
4.3 Variablen

5 Methode

6 Ergebnisse
6.1 Univariate Deskription
6.2 Deskriptive Ergebnisse zum zentralen Zusammenhang
6.3 Regressionsergebnisse
6.3.1 Modell
6.3.2 Modell
6.3.3 Modell
6.3.4 Modell
6.4 Robustheitsanalyse

7 Schlussfolgerungen
7.1 Diskussion
7.2 Limitationen und Ausblick

Literaturverzeichnis

Abkürzungsverzeichnis

Anhang
A Abbildungen
B Tabellen

Abbildungsverzeichnis

Abbildung 1: Bivariater Zusammenhang: Säulendiagramm

Abbildung 2: Bivariater Zusammenhang: Boxplot

Abbildung 3: Bivariater Zusammenhang: Histogramm

Abbildung 4: Einfache lineare Regression

Abbildung 5: Koeffizientenplot

Abbildung 6: Schematisches Modell

Abbildung 7: Containern

Abbildung 8: Alter

Abbildung 9: Umweltinteresse

Abbildung 10: Umweltwissen

Abbildung 11: Soziale Erwünschtheit

Abbildung 12: Marginsplot

Tabellenverzeichnis

Tabelle 1: Split-Übersicht

Tabelle 2: Stichprobenkonstruktion

Tabelle 3: Operationalisierung

Tabelle 4: Übersicht Maßzahlen

Tabelle 5: Häufigkeitstabelle

Tabelle 6: Multiple Lineare Regression

1 Einleitung

„Der Zweifel ist der Beginn der Wissenschaft. Wer nichts anzweifelt, prüft nichts. Wer nichts prüft, entdeckt nichts. Wer nichts entdeckt, ist blind und bleibt blind.“1

In den Sozialwissenschaften werden oft Fragebögen eingesetzt, um die Zusammenhänge des menschlichen Zusammenlebens durch Antworten zu begreifen. Soziale Phänomene sollen möglichst reliabel und valide erfasst, und Messfehler minimiert werden. Die Likert-Skala ist eine der am häufigsten genutzten Skalentypen in den Sozialwissenschaften (Diekmann 2008: 240; Schnell et al. 2013: 178–182). Ein besonders intensiv diskutiertes Thema im Zusammenhang mit Likert-Skalen ist die Mittelkategorie. Obwohl diese mehrstufige Skala bereits im Jahr 1932 entwickelt wurde und schon Teil unzähliger Erhebungen war, ist bis heute nicht eindeutig geklärt, ob sie eine Mittelkategorie aufweisen soll oder nicht. In dieser Diskussion gibt es drei große Standpunkte: Eine Mittelkategorie sollte verwendet werden, es sollte keine Mittelkategorie geben, oder die Verwendung einer Mittelkategorie hat keinen signifikanten Effekt auf das Antwortverhalten und kann somit nach Belieben verwendet oder nicht verwendet werden.

Um einer Antwort auf diese seit Jahrzehnten diskutierte Frage näher zu kommen, können empirische Daten hilfreich sein. Mit diesen könnte herausgefunden werden, ob das Vorhandensein bzw. das Fehlen der Mittelkategorie einer Likert-Skala einen Effekt auf das Antwortverhalten von befragten Personen hat. Die Entscheidung für oder gegen eine Mittelkategorie ist von daher eine der zentralen Gestaltungsfragen beim Fragebogendesign.

In dieser Arbeit wird untersucht, welche Effekte das Hinzufügen einer Mittelkategorie bei einer Likert-Skala auf das Antwortverhalten von befragten Personen hat. Dazu werden konkret Einflüsse auf die Datenstruktur und auf fehlende Werte analysiert. Im ersten Schritt wird der theoretische Rahmen geschafften, aus dem die zu überprüfenden Hypothesen hervorgehen. Außerdem wird der relevante Forschungsstand thematisiert. Im zweiten Schritt findet die empirische Untersuchung statt. Anhand des Umweltsurvey 2022 wird mithilfe einer linearen Regression und weiterer statistischer Verfahren der Effekt der hinzugefügten Mittelkategorie auf die Datenstruktur untersucht. Auf Basis der statistischen Kennzahlen und der geschätzten Modelle werden dann die Ergebnisse präsentiert. Abschließend werden diese diskutiert, in den empirischen und theoretischen Kontext eingeordnet und ein Ausblick gegeben.

2 Theoretischer Überblick

Um die Unterschiede im Antwortverhalten eine 4-er Likert-Skala zu einer 5-er Likert-Skala einschätzen zu können ist es als erstes wichtig, einige Begriffe und Konzepte zu klären. Im folgenden Abschnitt werden als Erstes Likert-Skalen und die Bedeutung der Mittelkategorie erläutert. Als Zweites werden dann mögliche Fehlerquellen erklärt, die unter Hinzunahme oder Weglassen der mittleren Option auftreten können. In diesem Abschnitt wird der theoretische Rahmen dargelegt, aus dem sich die Hypothese der Arbeit ableiten lässt.

2.1 Likert-Skalen und die Bedeutung der Mittelkategorie

Die nach ihrem Entwickler R. Likert benannte Likert-Skala ist seit ihrem Erscheinen im Jahr 1932 eine der am häufigsten verwendeten Skalentypen in den Sozialwissenschaften (Diekmann 2008: 240; Schnell et al. 2013: 178–182). Sie misst anhand einer bipolaren Skala sowohl die Richtung als auch die Intensität der Zustimmung bzw. der Ablehnung eines bestimmten Items (Alwin 1992: 84; Schnell et al. 2013: 178–182). Bei den für diese Arbeit relevanten Skalen handelt es sich um eine 5-Punkt Likert-Skala mit Mittelkategorie sowie eine 4-Punkt Likert-Skala ohne Mittelkategorie.

Die Mittelkategorie der Skala vertritt mehrere Positionen, denn sie kann sowohl Indifferenz als auch Ambivalenz repräsentieren (Dubois & Burns 1975: 870–871; Kaplan 1972). Indifferenz bedeutet, dass keiner der Pole für die Befragten die richtige Option darstellt, da sie minimal mit dem Thema beschäftigt sind. Die Befragten nehmen keine eindeutige Position ein. Dies kann am besten durch ein „weder noch“ ausgedrückt werden (Kaplan 1972).

Ambivalenz hingegen liegt vor, wenn Befragte nicht eindeutig in eine Polrichtung antworten können, da sie sowohl zustimmende als auch ablehnende Ansichten zu einer Thematik haben. Sie sind in gewisser Weise zu tief im Thema, um sich für eine Seite entscheiden zu können (Kaplan 1972). Ambivalente Befragte haben durch ihre gemischten Gefühle eine „teils/teils“ Position bezüglich des Items (Dubois & Burns 1975: 871). Wenn die Mittelkategorie nicht ausschließlich aus tatsächlich indifferenten oder ambivalenten Befragten gewählt wird, entstehen Messfehler.

2.2 Fehlerquellen durch Vorhandensein oder Fehlen der Mittelkategorie

Bei einer ungeraden Anzahl an Skalenpunkten mit Mittelkategorie können Fehler auftreten. Menold und Bogner teilen diese Fehlerquellen folgendermaßen ein: Ist die Mittelkategorie vorhanden können (1) Satisficing und (2) soziale Erwünschtheit auftreten, die zum Wählen der Mittelkategorie führt. Fehlt hingegen die Mittelkategorie, (3) müssen Personen mit neutraler Position abweichende Antworten geben (Menold & Bogner 2015: 5–6).

2.2.1 Tendenz zur Mitte

Satisficing wird als Verringern der kognitiven Anstrengung der Beantwortung eines Fragebogens definiert. Dieses Verhalten findet in typischen Antwortmustern Ausdruck (Krosnick 1991: 214–220; Sturgis et al. 2014: 19). Die Tendenz zur Mitte ist eine spezielle Form des Satisficing. Hierbei geben Befragte unabhängig vom Inhalt der Frage die mittlere Kategorie an, um sich nicht weiter kognitiv der Belastung der Beantwortung einer Frage auszusetzen (Bogner & Landrock 2015: 4–5). Durch die Wahl der mittleren Kategorie kürzen die Teilnehmenden die aufgewendete Zeit und Anstrengung ab, ihre Meinung kundzutun. Die Tendenz zur Mitte wird durch das Anbieten einer Mittelkategorie verstärkt (Krosnick & Presser 2010: 271).

2.2.2 Soziale Erwünschtheit

Ein weiteres Phänomen, das Personen zur Mittelkategorie treibt, ist soziale Erwünschtheit. Hierbei versuchen die Befragten, ihre Meinung oder den Mangel derselben hinter einer Mittelkategorie zu verstecken. Laut Sturgis und Kolleg:innen tun sie dies, um ihr „Gesicht zu wahren“ (Sturgis et al. 2014: 30, 34).

2.2.3 Mittlere Positionen und fehlende Mittelkategorie

Neben der Tendenz zur Mitte und sozialer Erwünschtheit kann es außerdem zu einer Verzerrung kommen, wenn bei einem Item keine Mittelkategorie gegeben ist, befragte Personen aber dennoch eine neutrale Meinung aufweisen. Statt ihrer mittleren Position Ausdruck verleihen zu können werden sie zu einer Angabe gezwungen oder verweigern die Aussage. In beiden Fällen ist die Konsequenz eine fehlerhafte Messung (Krosnick & Presser 2010: 271; Sturgis et al. 2014: 35).

2.3 Hypothese

Wird eine Mittelkategorie eingesetzt, können Fehler durch Tendenz zur Mitte und durch soziale Erwünschtheit entstehen. Da die Tendenz zur Mitte und sozialen Erwünschtheit durch das Anbieten einer Mittelkategorie verstärkt werden, wählen Menschen eher die Mittelkategorie. Zusätzlich wählen auch neutral eingestellte Menschen die angebotene Mittelkategorie. Dadurch verändern sich psychometrische Eigenschaften der Frage und Lage- und Streuungsmaße zentrieren sich in der Mitte. Auf Basis dieser theoretischen Herleitung wird die folgende Haupthypothese formuliert:

H1: Die angebotene Mittelkategorie zentriert die Struktur der Daten um die Mitte der Skala.

3 Forschungsstand

Seitdem die Likert-Skala veröffentlicht wurde, ist in der wissenschaftlichen Literatur stark umstritten, ob bei einer bipolaren Skala eine Mittelkategorie angeboten werden soll oder nicht. Die Ergebnisse verschiedener Studien sind teilweise widersprüchlich.

Auf Datengrundlage einer US-amerikanischen Befragung an 606 Grundschulkindern gingen Adelson und McCoach der Frage nach, wie Schüler:innen auf ein mathematisches Einstellungsinstrument mit einer vierstufigen Skala im Vergleich zu einer fünfstufigen Likert-Skala reagieren (Adelson & McCoach 2010). Da sowohl die Zustimmung der Schulen als auch der Erziehungsberechtigten notwendig war handelt es sich bei der realisierten Stichprobe um keine vollkommene Zufallsstichprobe. Die Forschenden kamen zum Ergebnis, dass beide Skalen das interessierende Konstrukt gleichermaßen geeignet messen und die Struktur der Daten nahezu identisch ist. Zusätzlich fanden sie heraus, dass die fünfstufige Skala stärkere Koeffizienten, bessere psychometrische Eigenschaften und weniger Messfehler aufweisen. Das Ergebnis von Adelson und McCoach zeigt, dass auch Kinder zwischen fünf Antwortmöglichkeiten unterscheiden können und nicht stärker zum neutralen Punkt tendieren als bei einer vierstufigen Skala.

Sturgis und Kolleg:innen empfehlen das Anbieten einer Mittelkategorie (Sturgis et al. 2014). Mit nachfolgenden Fragen nach Wählen einer Mittelkategorie konnten die Forschenden so feststellen, aus welchen Gründen die Befragten diese gewählt hatten. So konnten Menschen, die die Mittelkategorie als „Weiß Nicht“-Option genutzt hatten, neu zugeordnet werden. Die deskriptiven und multivariaten Schlussfolgerungen wurden durch diese Bereinigung erheblich verändert.

O’Muirchaertaigh et al. empfehlen ebenfalls eine Mittelkategorie anzubieten, da diese die zufälligen Messfehler reduziert und die Reliabilität erhöht und deshalb die Datenqualität maximiert (O’Muircheartaigh et al. 2001).

Bishop fand heraus, dass sich die Verteilungen zwischen einer Skala mit Mittelkategorie und einer Skala ohne Mittelkategorie signifikant unterscheiden, da die mittlere Option möglicherweise ambivalente Menschen anzieht (Bishop 1987).

Alwin und Kolleg:innen verfolgten auf Grundlage von Daten aus drei Panelstudien der GSS von 2006-2014 die Frage, welchen Effekt die Anzahl der Antwortmöglichkeiten auf die Reliabilität hat. Sie analysierten diese mittels 496 Items zu subjektiven Inhalten. Die Forschenden kamen zu dem Schluss, dass die Reliabilität unter Hinzunahme einer Mittelkategorie sinkt, da die Mittelkategorie Messfehler erhöht. Sie konnten diesen Effekt allerdings nicht im Unterschied zwischen einer 4-er und 5-er Likert Skala feststellen (Alwin et al. 2018).

Es lassen sich in der Forschung sowohl Empfehlungen für das Weglassen als auch Anbieten einer Mittelkategorie finden. Der Forschungsstand unterscheidet sich hinsichtlich der verwendeten Stichprobe, Operationalisierung und Vorgehen. Aus diesem Grund ist es plausibel, dass einige Ergebnisse im Widerspruch zueinanderstehen.

Die Literatur deutet zudem darauf hin, dass einige Faktoren den Effekt der Mittelkategorie beeinflussen. O’Muirchaertaigh und Kolleg:innen fanden beispielsweise heraus, dass der Hang zum Wählen der mittlere Option eher von älteren, wenig am Thema interessierten und weniger gebildeten Befragten stärker ist (O’Muircheartaigh et al. 2001). O’Muirchaertaigh et al. konnten diesen Effekt aber nicht bei Menschen feststellen, die weniger Wissen zum Thema aufwiesen. Entgegen ihrer Vermutung fanden Sturgis et al. wiederum heraus, dass diese Tendenz stärker bei am Thema interessierten Personen ist (Sturgis et al. 2014). Bishop et al. fanden zudem heraus, dass die Anziehung zur Mitte größer bei Frauen und bei Personen mit wenig Interesse am Thema der Befragung war (Bishop 1990). Diese Erkenntnisse werden im Folgenden mitberücksichtigt.

4 Daten

In diesem Abschnitt werden der Datensatz der verwendeten Studie, die Stichprobenziehung für die Analyse und die Operationalisierung der verwendeten Variablen besprochen.

4.1 Daten

Datengrundlage für diese Arbeit ist der Umweltsurvey 2022. Diese Umfrage wurde vom 14. bis zum 21. Juli von der Universität Konstanz und der Ludwig-Maximilians-Universität München durchgeführt. Die Fragen bezogen sich dabei meistens auf die umweltbezogenen Einstellungen und die Bereitschaft zu klimafreundlichen Verhaltensanpassungen von 18-69-Jährigen, die in Deutschland leben. Zusätzlich wurde den Befragten zufällig einer von sechs Skalentypen für einen Teilbereich des Fragebogens, den Fragen zum Protestverhalten, zugewiesen. Sechs Versionen der Skalen wurden verwendet. In Tabelle 1 befindet sich eine Übersicht der verschiedenen Skalen. Für diese Arbeit werden Version 3 der fünf-stufigen Likert-Skala ohne Mittelkategorie und mit „Weiß Nicht“ sowie Version 4 der vier-stufiger Likert-Skala mit Mittelkategorie und mit „Weiß Nicht“ verglichen.

Durchgeführt wurde der Survey als Online-Befragung eines Access Panels, bei dem eine ungekreuzte Quotierung nach kategorisiertem Alter (18-29; 30-39; 40-49; 50-59; 60-69 Jahre), Geschlecht (weiblich, männlich, divers), Bundesland (16) und Bildungsgrad (niedrig, mittel, hoch) erfolgte. Folglich handelt es sich beim Survey um keine Zufallsstichprobe der Grundgesamtheit. Es muss davon ausgegangen werden, dass eine Verzerrung durch das Erhebungsdesign vorliegt und dadurch nicht uneingeschränkt auf die Grundgesamtheit der deutschen Bevölkerung/Bundesbürger geschlossen werden kann. Durch das deutschlandweite Erheben, das quotierte Verfahren mit 1.439 realisierten Fragebögen und die Verwendung eines Split-Ballot-Experiments ist der Umweltsurvey 2022 trotzdem weitestgehend übertragbar.

4.2 Stichprobe

Von den insgesamt 1794 Teilnahmen wurden 122 aufgrund eines Qualitätschecks vor dem Ende der Befragung abgewiesen. Bei den übrigen 1672 beendeten Fragebögen wurden weitere 233 ausgeschlossen, deren Befragungsdauer kürzer als die des unteren Quartils dauerte. Insgesamt befinden sich damit 1439 gültige Fälle in der realisierten Stichprobe.

Aus der realisierten Stichprobe des Umweltsurvey 2022 wurden 949 Personen ausgeschlossen, die sich nicht in der relevanten Kontroll- oder Experimentalgruppe befinden. Außerdem wurden 39 Fälle ausgeschlossen, in denen bei der Container-Frage „Weiß Nicht“ angegeben wurde, da diese Fälle für die Fragestellung nicht interessant sind. In weiteren sechs Fällen wurde die Angabe verweigert, weswegen auch diese nicht in die Analyse eingehen. Der Index zu Umweltwissen weist 24 fehlende Werte und der Index zur sozialen Erwünschtheit einen fehlenden Wert auf, weswegen diese 25 zusätzlich ausgeschlossen wurden.

Damit verbleiben im Analyse-Sample 420 Personen. Aus Tabelle 2 lässt sich die Stichprobenkonstruktion entnehmen.

4.3 Variablen

Im Folgenden wird die Konstruktion der verwendeten Variablen genauer erklärt. In Tabelle 3 wird dargestellt, wie die Variablen konstruiert wurden und auf welchen Items im Fragebogen diese basieren.

Mittelkategorie

Die Mittelkategorie -Variable ist ein binär kodierter Indikator für die Skala, die eine befragte Person randomisiert erhalten hat. Es handelt sich dabei um die unabhängige Variable, deren Einfluss auf Antwortverhalten und fehlenden Werte interessant für diese Arbeit ist. Hat eine befragte Person randomisiert die fünfstufige Skala mit Mittelkategorie erhalten, nimmt die Variable den Wert 1 an. Hat eine Person die Skala ohne Mittelkategorie zugewiesen bekommen, nimmt die Variable den Wert 0 an.

Containern

Bei dieser abhängigen, metrischen Variablen handelt es sich um eine Einstellungsfrage. Die beobachtete Person wird gefragt, ob Containern straffrei sein sollte. Das „Containern“ bezeichnet nach Noack und Kolleg:innen „eine Handlung, bei der Müllcontainer nach noch verzehrbaren Nahrungsmitteln durchsucht werden“ und diese entnommen werden (Noack et al. 2016: 1–2). Für dieses Item haben Personen entweder eine Likert-Skala mit Mittelkategorie oder eine Likert-Skala ohne Mittelkategorie erhalten (siehe Split).

Alter

Das Alter ist eine metrisch gemessene, unabhängige Variable. Sie misst das Alter in Jahren.

Bildung

Bildung ist eine unabhängige Dummy-Variable, die das Vorhandensein einer (Fach-) Hochschulreife misst. Besitzt eine Person die Fachhochschulreife oder die Hochschulreife, nimmt diese Variable den Wert 1 an. Hat eine Person hingegen die Schule ohne Abschluss beendet, einen Volks-, Haupt-, oder Mittelschulabschluss oder eine Mittlere Reife bzw. einen Realschulabschluss, so nimmt diese Variable den Wert 0 an.

Umweltinteresse

Das Interesse an Umwelt-Thematiken ist eine metrische, unabhängige Index-Variable. Gebildet wird sie anhand von acht Fragen, die das Interesse an Umweltthemen messen sollen.

Umweltwissen

Das Wissen zu Umweltthemen ist eine metrische, unabhängige Variable. Sie basiert auf fünf Fragen zu Umweltwissen, die mit „Ja“, „Nein“ oder „Weiß Nicht“ beantwortet werden können.

Soziale Erwünschtheit

Soziale Erwünschtheit ist eine unabhängige Index-Variable. Sie basiert auf einer Fragebatterie, die das latente Konstrukt der sozialen Erwünschtheit messen soll. Die Messung besteht aus einer Kurzskala, die sowohl die Übertreibung positiver Qualitäten als auch die Untertreibung negativer Qualitäten mit je drei Items auf einer fünfstufigen Skala von „stimme gar nicht zu“ bis „stimme voll und ganz zu“ misst (Kemper et al. 2012).

Tendenz zur Mitte

Die Tendenz zur Mitte ist eine unabhängige Dummy-Variable. Die Variable nimmt den Wert 1 an, wenn bei allen Fragen zu Protestverhalten kein einziger Endpunkt auf der Skala gewählt wurde. In allen anderen Fällen nimmt die Variable den Wert 0 an.

5 Methode

Nach Krosnick sind Fähigkeiten und Motivation einer befragten Person Faktoren, die Satisficing vermindern (Krosnick 1991: 222–225). Um die Fähigkeiten zu messen, wird Bildung verwendet, da diese die „kognitive Sophistikation“, die Satisficing womöglich vermindert (Krosnick 1991: 222). Außerdem wird auf das Alter kontrolliert, da jüngere Menschen sich nach Bourke und Frampton mit mehr Kategorien wohler fühlen und konsistenter antworten (Bourke & Frampton 1992). Umgekehrt wäre es denkbar, dass ältere Menschen kognitiv weniger leistungsfähig sind als Jüngere. Als weiteres Element zur Einschätzung der Fähigkeiten eines befragten Menschen wird das Wissen einer Person zur Umweltthematik eingesetzt, da Personen durch Vorwissen einer geringeren Belastung bezüglich der Informationsgewinnung zum Thema ausgesetzt sind. Um die Motivation einer befragten Person zu messen, wird das Interesse bezüglich Umweltthemen eingesetzt. Befragte, die den Vorteilen des Survey wohlwollend gegenüberstehen, sind eher motiviert, möglichst genau zu antworten. Aus diesem Grund ist es unwahrscheinlicher, dass bei diesen Personen Satisficing auftritt (Krosnick 1991: 224). Wie im theoretischen Überblick beschrieben, können sich Tendenz zur Mitte und soziale Erwünschtheit auf das Antwortverhalten auswirken, weswegen auch auf diese beiden Phänomene kontrolliert wird.

Abbildung 6 zeigt das zugrunde liegende schematische Modell. Es wird ein Zusammenhang zwischen dem Einsatz einer Mittelkategorie und der Antwortstruktur in den Items vermutet. Von Alter, Abitur, Umweltinteresse, Umweltwissen, sozialer Erwünschtheit und Tendenz zur Mitte wird eine konfundierende Wirkung erwartet. Diese Variablen überprüfen zusätzlich, ob das randomisierte Split-Verfahren erfolgreich war oder ob zufällig ein Ungleichgewicht in den zwei Split-Gruppen vorliegt. Außerdem wird untersucht, ob sich relevante Drittvariablen auf die abhängige Variable auswirken.

Beim verwendeten statistischen Modell zum Testen der Hypothese H1, es gäbe einen Einfluss der Mittelkategorie auf den Grad der Zentrierung um die Mitte der Skala, handelt es sich um eine lineare Regression. Es wird ein schrittweiser Modellaufbau verwendet. Hierbei wird stufenweise auf Drittvariablen kontrolliert, um deren genaue Mechanismen klar erkennen zu können.

6 Ergebnisse

In diesem Abschnitt werden deskriptive Ergebnisse sowie die zur Beantwortung der Fragestellung wichtigen statistische Berechnungen präsentiert. Regressionsergebnisse werden mit der beschriebenen Methode dargestellt.

6.1 Univariate Deskription

Mittelkategorie

50,2 % aus dem Analyse-Sample haben zufällig die Skala mit Mittelkategorie erhalten (vgl. Tabelle 5, Zeile 2). Der Modus dieser Dummy-Variable liegt damit bei 1.

Containern

Die Einstellungsfrage, ob Containern straffrei sein sollte, wurde mithilfe von zwei Skalen abgefragt (siehe Mittelkategorie). Um diese vergleichbar zu machen wurden sie wie bei Adelson und McCoach einer Transformation unterzogen (Adelson & McCoach 2010). Beide Skalen sind so transformiert worden, dass der Wertebereich der Skalen identisch ist und die Abstände gleich verteilt sind (ohne Mittelkategorie: -2 „Stimme überhaupt nicht zu, -[2]/3 „Stimme eher nicht zu“, [2]/3 „stimme eher zu“, 2 „Stimme voll und ganz zu“; mit Mittelkategorie: -2 „Stimme überhaupt nicht zu“, -1 „Stimme eher nicht zu“, 0 „Teils/teils“, 1 „Stimme eher zu“, 2 „Stimme voll und ganz zu“). Die gesamte Verteilung ist linksschief und leptokurtisch mit einer Standardabweichung von 1,04 und einem Mittel von 1,35. Der Median liegt bei 2 und der Interquartilsabstand bei 1,333 (Tabelle 5, Zeile 3 und Abbildung 7). Die Frage wird im Rahmen dieser Arbeit als quasi-metrisch betrachtet, obwohl es sich lediglich um ein Likert-Item und nicht um eine gesamte Skala handelt.

Alter

Diese metrische Drittvariable zeigt das Alter von 18 bis 69 in Jahren an. Die Spannweite beträgt 51 Jahre. Im Durchschnitt sind die befragten Personen 46,85 Jahre alt mit einer Standardabweichung von 14,22 Jahren. Der Median liegt bei 50 Jahren und der Interquartilsabstand bei 24 Jahren. Die Verteilung ist linksschief und platykurtisch (vgl. Tabelle 5, Zeile 6 und Abbildung 8).

Bildung

40,5% der Befragten haben keine (Fach-) Hochschulreife (vgl. Tabelle 5, Zeile 7). Damit liegt der Modus der Dummy-Variable bei 1.

Umweltinteresse

Diese Drittvariable ist ein standardisierter Index und hat damit einen Wertebereich von [0; 1]. Die Verteilung ist linksschief, leptokurtisch mit Standardabweichung bei 0,131 und arithmetischem Mittel bei 0,7. Der Median liegt bei 0,71 und der Interquartilsabstand bei 0,17 (vgl. Tabelle 5, Zeile 8 und Abbildung 9).

Umweltwissen

Die Drittvariable Umweltwissen liegt standardisiert mit Wertebereich [0; 1] vor. Die Indexvariable ist linksschief und platykurtisch. Die Standardabweichung liegt bei 0,28 und das arithmetische Mittel bei 0,63. Der Median hat einen Wert von 0,6 und der Interquartilsabstand von 0,6 (vgl. Tabelle 5, Zeile 9 und Abbildung 10).

Soziale Erwünschtheit

Die Drittvariable zur sozialen Erwünschtheit ist eine standardisierte Indexvariable ([0; 1]). Sie ist leicht linksschief und platykurtisch. Die Standardabweichung liegt bei 0,21 und das Mittel bei 0,55. Der Median liegt bei 0,56 und der Interquartilsabstand bei 0,31 (vgl. Tabelle 5, Zeile 10 und Abbildung 11).

Tendenz zur Mitte

27,9% der befragten Personen haben bei allen Fragen zu Protestverhalten keinen einzigen Pol gewählt (vgl. Tabelle 5, Zeile 11). Der Modus dieser Variable liegt bei 0.

6.2 Deskriptive Ergebnisse zum zentralen Zusammenhang5020

Das Kernthema dieser Arbeit ist der Einfluss der Mittelkategorie auf das Antwortverhalten bei der Frage, ob Containern straffrei sein sollte. Zuerst wurde ein Kolmogorov-Smirnov-Test, der auf Verteilungsgleichheit testet, durchgeführt. Nach diesem Test unterscheidet sich die Verteilung zwischen Kontroll- und Experimentalgruppe nicht signifikant (p = 0,123). Der Levene-Test, der Varianzgleichheit zwischen beiden Skalen testet, ergibt einen hoch signifikanten Unterschied (p = 0,002; f = 0,653). Der zweiseitige t-Test für ungleiche Varianzen, der einen Mittelwertvergleich durchführt, ist signifikant (p = 0,038; t = 2,081). Haben Personen die Skala ohne Mittelkategorie erhalten, erzielen sie im Schnitt einen Wert von 1,451 auf der Skala. Das liegt auf der vierstufigen Skala zwischen 0,667 „Stimme eher zu“ und 2 „Stimme voll und ganz zu“ liegt. Personen, die die Skala mit Mittelkategorie bekommen haben, weisen im Schnitt nur einen Skalenwert von 1,242 auf. Dieser Mittelwert liegt bei der fünfstufigen Skala zwischen 1 „Stimme eher zu“ und 2 „Stimme voll und ganz zu“. Damit ergibt sich ein Unterschied der arithmetischen Mittel von 0,21 Skalenpunkten. Zusätzlich liegt der Standardfehler bei der vierstufigen Skala bei 0,064 und bei der fünfstufigen Skala bei 0,078. Das ergibt einen Unterschied des Standardfehlers von 0,050. Die Schätzung der vierstufigen Skala ist damit geringfügig besser.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Bivariater Zusammenhang: Säulendiagramm

Beim Vergleich der Häufigkeiten zwischen den zwei Skalentypen fallen einige Unterschiede auf (vgl. Tabelle 5). Am Endpunkt der Ablehnung „Stimme überhaupt nicht zu“ liegt bei der Skala mit Mittelkategorie ein Anteil von 5,69% aller angegebenen Werte vor. Das sind 4,25 Prozentpunkte mehr verglichen mit der Skala ohne Mitte, die nur 1,44% erhalten hat.

Die Kategorie „Stimme eher nicht zu“ hat 3,32% der Angaben der Skala mit Mittelkategorie erhalten. Insgesamt sind das 3,86 Prozentpunkte weniger als bei der ohne Mittelkategorie, die 7,18% der Werte hat.

Zusammengefasst ist bei der Verteilung mit Mittelkategorie der Anteil an Ablehnung2 bei 9,01% und ohne Mittelkategorie bei 8,62%. Damit sind die Anteile fast deckungsgleich mit 0,39 Prozentpunkten Unterschied.

Die Mittelkategorie bei der fünfstufigen Skala macht 10,90% der Angaben aus.

Bei der Kategorie „Stimme eher zu“ liegt ein marginaler Unterschied von 1,16 Prozentpunkten zwischen den beiden Skalen vor. Die mit Mittelkategorie hat dabei einen Anteil von 21,33% und die ohne einen Anteil von 22,49%.

Am Extrempunkt „Stimme voll und ganz zu“ hat die Skala mit Mittelkategorie 68,90% aller Angaben erhalten. Das sind 10,13 Prozentpunkte weniger als bei der ohne Mittelkategorie, die 58,77% erhalten hat.

Insgesamt weist die Verteilung mit Mittelkategorie einen Anteil an Zustimmung3 von 90,23% und die ohne Mittelkategorie einen Anteil von 81,26% auf. Das ergibt einen Unterschied von 8,97 Prozentpunkten.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: Bivariater Zusammenhang: Boxplot

Liegt die Vierer-Skala vor, sind Schiefe und Standardabweichung etwas geringer, die Wölbung aber geringfügig größer (Schiefe = -1,649; Kurtosis = 5,157; SD = 0,918; vgl. Tabelle 4, Zeile 4). Liegt hingegen die fünfstufige Skala vor, sind Wölbung und Interquartilsabstand etwas niedriger, Schiefe und Standardabweichung wiederum etwas höher (Schiefe = -1,56; Kurtosis = 4,602; SD = 1,135; IQR = 1; vgl. Tabelle 4, Zeile 5).

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3: Bivariater Zusammenhang: Histogramm

Die Daten deuten insgesamt darauf hin, dass ein signifikanter Unterschied zwischen den beiden Split-Gruppen existiert. Bei der Gruppe mit Mittelkategorie streuen die Daten weniger. Dies ist anhand der geringeren Standardabweichung, dem niedrigeren Interquartilsabstand und der kleineren Varianz erkennbar. Die Verteilung mit Mittelkategorie ist weniger schief und gewölbter. Im Mittel hat die Gruppe mit Mittelkategorie einen etwas höheren Skalenwert. Innerhalb der Antwortmöglichkeiten unterscheiden sich die Anteile auf Seite der Zustimmung nur beim Pol. Dieser ist mit Mittelkategorie wesentlich weniger. Umgekehrt sind die Anteile auf Seite der Ablehnung entgegengesetzt zu denen ohne Mittelkategorie. Der Pol ist hier mit Mitte höher und die leichte Ablehnung niedriger. Um den Unterschied zwischen den beiden Skalen auf Drittvariablen zu prüfen, wird anschließend eine lineare Regression geschätzt.

6.3 Regressionsergebnisse

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 4: Einfache lineare Regression

6.3.1 Modell 1

Im Basismodell ist die Variable zur Mittelkategorie enthalten (vgl. Tabelle 6, Spalte m1). Bei der einfachen linearen Regression weist der negative Effekt der Mittelkategorie einen Wert von -0,210 auf. Dieser ist statistisch signifikant mit einem p-Wert von 0,038. Durchschnittlich haben demnach Personen, die die vierstufige Skala erhalten, einen Skalenwert von 1,451. Im Schnitt geben Personen mit Mittelkategorie einen um 0,210 niedrigeren Wert auf der Skala an als Personen, die die Mittelkategorie nicht erhalten (vgl. Abbildung 4). Das entspricht der aufgestellten H1. Die einfache lineare Regression, die den Einfluss der Mittelkategorie auf die Antworten der Container-Frage untersucht, ist statistisch signifikant (F = 0,038). 1,02% der Varianz des Items kann durch die Mittelkategorie erklärt werden (R[2] = 0,010). Der AIC liegt bei 1221,1.

6.3.2 Modell 2

In diesem Modell sind die Confounder Alter und Bildung mitaufgenommen, da diese die kognitive Leistungsfähigkeit messen (vgl. Tabelle 6, Spalte m2). Der Koeffizientenschätzer der Mittelkategorie ist stabil geblieben mit -0,211 und einem p-Wert von 0,036. Der Regressionskoeffizient des zentrierten Alters zeigt, dass das Alter einen positiven Effekt auf das Item ausübt. Steigt das Alter um 10 Jahre, steigt auch die prognostizierte Antwort leicht um 0,0370 Skalenpunkte unter Kontrolle der anderen im Modell enthaltenen unabhängigen Variablen. Mit einem p-Wert von 0,311 ist Variable nicht signifikant. Der positive Koeffizientenschätzer der Dummy-Variable Abitur liegt bei 0,150. Liegt eine (Fach-) Hochschulreife vor (0 à 1), ist der geschätzte Skalenwert um 0,150 höher als bei Personen, die keine (Fach-) Hochschulreife besitzen, wenn alle anderen im Modell enthaltenen Variablen konstant gehalten werden. Der p-Wert der Bildungsvariable ist 0,157, womit der Effekt nicht signifikant ist. Demnach war die Randomisierung im Hinblick auf Alter und Bildung erfolgreich und es liegen keine Drittvariableneffekte vor. Insgesamt haben Personen, die die Mittelkategorie nicht erhalten, keinen (Fach-) Hochschulabschluss haben und mittleren Alters sind einen vorhergesagten Skalenwert von 1,389. Das R[2] ist unwesentlich auf einen Wert von 0,016 und das adjustierte R[2] ist marginal von 0,010 auf einen Wert von 0,009 gefallen. Der AIC-Wert ist ebenso von 1221,1 auf 1222,6 gestiegen. Somit können weder das Alter noch die Bildung den Zusammenhang erklären, da sich die Modellgüte verschlechtert. Die Annahme, dass diese Variablen einen Einfluss auf den Hauptzusammenhang haben, kann somit verworfen werden.

6.3.3 Modell 3

Um weiter auf Fähigkeiten und Motivation zu testen, werden die Index-Variablen Umweltwissen und Umweltinteresse auf den Zusammenhang zwischen Mittelkategorie und Antworten geprüft. Der Haupteffekt der Mittelkategorie ist mit Aufnahme von Umweltwissen und Umweltinteresse von -0,211 auf -0,193 gesunken. Damit ist dieser Regressionskoeffizient mit p-Wert von 0,054 nicht mehr statistisch signifikant. Der Effekt des Alters ist unmerklich auf 0,0401 gestiegen und ist mit einem p-Wert von 0,267 wie in Modell 2 nicht signifikant. Die Variable zur (Fach-) Hochschulreife hat einen geringfügig gesunkenen Effekt von 0,0874. Sie ist gleichbleibend nicht signifikant mit einem p-Wert von 0,409. Unter Kontrolle auf die anderen im Modell enthaltenen unabhängigen Variablen erhöht sich der Skalenwert um 0,940, wenn sich das Umweltinteresse von niedrig auf hoch ändert (0 à 1). Der zugehörige p-Wert von 0,015 zeigt, dass dieser Effekt statistisch signifikant ist. Steigt das Umweltwissen von niedrig auf hoch (0 à 1), erhöht sich der Regressionskoeffizient auf 0,443, wenn auf die übrigen unabhängigen Variablen kontrolliert wird. Der p-Wert von 0,016 zeigt auch hier, dass der Effekt statistisch signifikant ist. Nach dem Modell hat eine Person mittleren Alters, ohne (Fach-) Hochschulreife mit niedrigem Umweltinteresse und niedrigem Umweltwissen einen vorausgesagten Skalenwert von nur noch 0,463. Das R[2] ist von 0,016 von Modell 2 auf 0,046 gestiegen. Zusätzlich ist das adjustierte R[2] von 0,009 auf 0,032 gestiegen und AIC von 1222,6 auf 1213,9 gesunken. Demnach hat dieses Modell bislang die höchste Modellgüte erreicht. Bei den Variablen Umweltwissen und Umweltinteresse handelt es sich wie vermutet um Drittvariablen, die den Zusammenhang zwischen Mittelkategorie und dem Item teilweise erklären. Es handelt sich um statistisch signifikante Confounder, die den Haupteffekt signifikant senken und die Modellgüte erhöhen. Wie angenommen führt das konfundierende Umweltwissen durch Fähigkeiten der Informationsgewinnung zu weniger Satisficing. Die Annahme, dass das konfundierende Umweltinteresse durch Motivation gegenüber dem Fragebogen zu weniger Satisficing führt, hat sich bestätigt.

6.3.4 Modell 4

Wie im theoretischen Überblick beschrieben, wird vermutet, dass soziale Erwünschtheit und die Tendenz zur Mitte einen Einfluss bei veränderter Skala aufweisen. Unter Einbezug dieser beiden Variablen ist der Haupteffekt der Mittelkategorie vom vorigen Modell von -0,193 auf -0,197 leicht gestiegen. Der p-Wert hat sich von 0,054 auf 0,048 erhöht, wodurch der Haupteffekt wieder statistisch signifikant ist. Die Effekte von Alter und Bildung haben sich unwesentlich auf 0,0381 bzw. 0,0862 verringert. Die p-Werte haben sich ebenso unmerklich auf 0,303 bzw. 0,415 erhöht, wodurch sich das Signifikanzniveau nicht verändert hat. Interessant ist, dass sich der Effekt der Variable Umweltinteresse von 0,940 aus dem vorigen Modell auf 1,036 erhöht hat. Damit ist der zugehörige p-Wert von 0,015 auf 0,009 gesunken, wodurch dieser Effekt nun sogar hoch signifikant ist. Zusätzlich hat sich der Effekt des Umweltwissens von 0,443 auf 0,435 vermindert, was keinen großen Unterschied darstellt. Der p-Wert hat sich von 0,016 auf 0,018 erhöht, womit sich das Signifikanzniveau nicht verändert hat. Durch den Einbezug der Index-Variablen zur sozialen Erwünschtheit liegt der negative Koeffizientenschätzer dieser Variable bei -0,202. Ändert sich die soziale Erwünschtheit von niedrig auf hoch (0 à 1), unter Konstanthaltung aller anderen im Modell enthaltenen unabhängigen Variablen, sinkt der Skalenwert prognostiziert um 0,202. Dieser Effekt ist jedoch statistisch nicht signifikant, was am p-Wert von 0,467 erkennbar ist. Der nicht signifikante, positive Regressionskoeffizient der Dummy-Variable zur Tendenz zur Mitte liegt bei -0,208 mit einem p-Wert von 0,065. Steigt die Dummy Variable von keiner Tendenz zur Mitte auf Tendenz zur Mitte (0 à 1), unter Kontrolle der anderen im Modell enthaltenen unabhängigen Variablen, sinkt im Schnitt der prognostizierte Skalenwert um 0,208. Da es sich bei den Drittvariablen zur sozialen Erwünschtheit und zur Tendenz zur Mitte um statistisch nicht signifikante Effekte handelt, die den Haupteffekt nicht senken, liegen hier keine Drittvariablen vor. Nach dem Modell hat eine Person mittleren Alters ohne Mittelkategorie, ohne (Fach-) Hochschulabschluss, mit niedrigem Umweltinteresse, niedrigem Umweltwissen, niedriger sozialen Erwünschtheit und ohne Tendenz zur Mitte einen Skalenwert von 0,583. Unter Hinzunahme der Variablen zur sozialen Erwünschtheit und zur Tendenz zur Mitte ist das R[2] erneut von 0,046 auf 0,054 gestiegen. Das adjustierte R[2] ist ebenfalls von 0,032 auf 0,038 gestiegen. Das AIC ist fast unmerklich von 1213,9 auf 1214,1 gestiegen. Demnach hat Modell 4 verglichen mit den anderen die höchste Modellgüte und erklärt somit den Zusammenhang zwischen Mittelkategorie und Item am besten. Es war demnach sinnvoll auch die Variablen zur sozialen Erwünschtheit und Tendenz zur Mitte mit in das Modell aufzunehmen. Die Annahme, dass diese Variablen Effekte auf den Hauptzusammenhang ausüben, indem sie Satisficing verstärken, kann somit verworfen werden.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 5: Koeffizientenplot

Aus dem dargestellten Koeffizientenplot lassen sich alle verwendeten Modelle visualisiert entnehmen. Es ist erkennbar, dass der negative Haupteffekt der Mittelkategorie schließlich nur knapp signifikant ist, da das Konfidenzintervall die Null fast schneidet.

Keine Drittvariablen außer Umweltinteresse und Umweltwissen sind signifikant. Diese beiden signifikanten Variablen haben einen positiven Koeffizientenschätzer, weswegen durch Steigen dieser Variablen auch die durchschnittlichen vorausgesagten Skalenwerte des Items steigen. Der negative Regressionskoeffizient der Dummy-Variable zur Tendenz zur Mitte und der positive Koeffizient der Dummy-Variable Abitur lassen sich jeweils gruppiert Abbildung 12 entnehmen.

6.4 Robustheitsanalyse

Um die Robustheit des Modells zu prüfen, wird eine Robustheitsanalyse durchgeführt. Nach Bishop et al. unterscheiden sich die Ergebnisse nach Geschlecht, weswegen danach separiert wird (Bishop 1990).

Wird die lineare Regression für Frauen und Männer4 separat geschätzt, zeigen sich prägnante Unterschiede. Das einfache lineare Modell auf Datengrundlage des weiblichen Geschlechts basiert auf 200 Fällen und ist nicht signifikant (F = 0,099). 1,37% der Varianz des Items wird durch die Mittelkategorie erklärt (R[2] = 0,014). Keine der im multiplen Modell enthaltenen unabhängigen Variablen sind statistisch signifikant (vgl. Tabelle 7).

Das Modell für Männer basiert auf 217 Fällen und ist statistisch nicht signifikant (F = 0,164). Nur 0,9% der Varianz im Item wird durch die Mittelkategorie erklärt (R[2] = 0,009). Außer der Variable Umweltwissen ist keines der im multiplen Modell enthaltenen unabhängigen Variablen signifikant. Umweltwissen ist statistisch signifikant und senkt den Haupteffekt der Mittelkategorie (vgl. Tabelle 8).

Der Vergleich zwischen Männern und Frauen zeigt, dass es keine Überschneidungen bei signifikanten Variablen gibt. Übersichten der zwei Modelle lassen sich Abbildung 13 und Abbildung 14 entnehmen.

7 Schlussfolgerungen

Im vorigen Abschnitt wurden die Ergebnisse des Zusammenhangs zwischen Mittelkategorie und Item zu Containern mittels einer multiplen linearen Regression vorgestellt. Nun werden diese Ergebnisse im Kontext der Fragestellung der vorliegenden Arbeit und der zuvor gestellten Hypothese interpretiert. Anschließend folgen die Limitationen und ein Ausblick.

7.1 Diskussion

Ziel dieser Arbeit war es, anhand des Umweltsurvey 2022 der Ludwig-Maximilians-Universität München und der Universität Konstanz zu untersuchen, welchen Effekt eine angebotene Mittelkategorie bei einer Likert-Skala auf das Antwortverhalten hat. Theoretisch basiert die Hypothese auf der Annahme, dass Fehler auftreten, wenn die Mittelkategorie nicht ausschließlich aus indifferenten oder ambivalenten Meinungen besteht. Als zwei Faktoren für das fälschliche Wählen der Mitte wurde eine Form des Satisficing, nämlich die Tendenz zur Mitte, und soziale Erwünschtheit beschrieben. Umgekehrt wurde die Annahme beschrieben, dass Messfehler entstehen können, wenn ambivalent bzw. indifferent eingestellten Personen keine Mittelkategorie angeboten wird. Beide Annahmen führen dazu, dass die mittlere Kategorie eher gewählt wird, wenn sie angeboten wird. Daraus folgte die Hypothese, dass das Anbieten einer mittleren Kategorie die Daten um die Mittelkategorie zentriert.

Dazu wurden Kennwerte und Häufigkeiten zwischen Kontroll- und Experimentalgruppe verglichen und anschließend eine lineare Regression geschätzt. Es hat sich gezeigt, dass sich die Varianzen und Mittelwerte zwischen Kontroll- und Experimentalgruppe signifikant unterscheiden. Bei der Verteilung konnte dieser Umstand jedoch nicht bestätigt werden. Die fünfstufige Likert-Skala hat eine geringere Streuung und eine schiefere Verteilung. Außerdem ist das arithmetische Mittel mit Mittelkategorie niedriger. Zusätzlich sind die „Weiß Nicht“-Angaben bei der fünfstufigen Skala höher.

Von den Drittvariablen Alter und Bildung wurde eine konfundierende Wirkung vermutet, da diese durch veränderte kognitive Leistungsfähigkeit Satisficing begünstigen können. Da Motivation und Fähigkeiten als Verminderung von Satisficing zählen wurden zudem das Umweltinteresse und das Umweltwissen mit aufgenommen. Zusätzlich wurde, wie im theoretischen Teil erklärt, auch auf soziale Erwünschtheit und Tendenz zur Mitte getestet.

Die anschließende multiple lineare Regression hat den Zusammenhang auf Drittvariablenmechanismen geprüft. Dies hat sowohl die Randomisierung überprüft als auch den Effekt auf das Item. Weder Alter noch Bildung erzielten einen signifikanten Effekt. Der gefundene Effekt des Alters von O‘Muircheartaigh konnte anhand dieser Arbeit nicht bestätigt werden (O’Muircheartaigh et al. 2001). Die Drittvariablen Umweltinteresse und Umweltwissen übten einen signifikanten bis hoch signifikanten Effekt aus, erhöhten die Modellgüte und verringerten den Haupteffekt. Der positive Effekt des Umweltinteresses war ebenfalls Ergebnis von Bishop et al, steht damit allerdings im Widerspruch zum Ergebnis von Sturgis et. al. (Bishop 1990; Sturgis et al. 2014). Allerdings konnten Bishop und Kolleg:innen entgegen der Ergebnisse dieser Arbeit keinen Effekt zu Umweltwissen finden (Bishop 1990). Bei den letzten beiden Drittvariablen zur sozialen Erwünschtheit und der Tendenz zur Mitte konnte kein signifikanter Effekt beobachtet werden, obwohl diese zur Modellgüte beitrugen.

Die Ergebnisse wurden abschließend einer Robustheitsanalyse nach Geschlecht unterzogen. Die Signifikanzen blieben daraufhin nicht bestehen.

Nach den Ergebnissen dieser Arbeit unterscheiden sich die vier- und fünfstufige Skala nach ihren Antworten nicht signifikant, was den Ergebnissen von Alwin und Kolleg:innen (Alwin 1992). Beim Fragebogendesign kann nach den Ergebnissen dieser Arbeit frei entschieden werden, ob eine vier- oder fünfstufige Skala angeboten werden soll.

7.2 Limitationen und Ausblick

Die vordergründige Einschränkung dieser Arbeit ist die potenzielle Verallgemeinerbarkeit der Ergebnisse, da für die Erhebung ein Access Panel genutzt wurde. Dadurch, dass im Fragebogen eine gegabelte Befragung durchgeführt wurde, sind jedoch Kausalzusammenhänge erklärbar. Auch die folgende Forschung müsste es zum Ziel haben, die interessierende Grundgesamtheit möglichst ideal abzubilden. Zudem hat die vorliegende Arbeit nur den Effekt der Mittelkategorie anhand nur eines Items, das die Einstellung zu Straffreiheit des Containerns misst, untersucht. Für kommende Forschung wäre es sicherlich auch interessant mehrere Items zu untersuchen. Obwohl eine vorige Quotierung der 18-69-jährigen in Deutschland wohnhaften Befragten erfolgte und die verschiedenen Skalen randomisiert wurden, sind die hier gefundenen Ergebnisse nicht uneingeschränkt auf diese Population verallgemeinerbar. Hinzu kommt, dass sich diese Arbeit auf 4-Punkt und 5-Punkt-Skalen mit „Weiß Nicht“-Option beschränkt. Welchen Effekt die Mittelkategorie bei einer unterschiedlichen Anzahl an Skalenoptionen oder ohne „Weiß Nicht“ und/oder (numerischer) Formulierungen – auch in der Mittelkategorie – hätten, müsste in weiteren Untersuchungen überprüft werden. Auch ob die 5-stufige Skala sich psychometrisch von der 4-stufigen Skala unterscheidet, da eine zusätzliche Antwortkategorie angegeben oder weil eine Mittelkategorie angeboten wurde, müsste weiterhin untersucht werden.

Für folgende Forschung wäre es interessant zu untersuchen, wie sich die Mittelkategorie speziell auf fehlende Werte auswirkt. Im theoretischen Überblick wurde bereits angeschnitten, dass sich die Mittelkategorie auf fehlende Werte auswirken kann. Im Rahmen dieser Arbeit wurde festgestellt, dass die „Weiß Nicht“-Angaben bei der Skala mit mittlerer Kategorie wesentlich höher, die Anteile der verweigerten Angaben jedoch gleich sind. Es wäre daher zu untersuchen, wie sich die Mittelkategorie auf fehlende Werte auswirkt. Für kommende Forschung wäre es sinnvoll, diesen Zusammenhang unter Einbezug von Drittvariablen mittels einer logistischen Regression zu untersuchen.

Literaturverzeichnis

Adelson, J.L. & D.B. McCoach, 2010: Measuring the Mathematical Attitudes of Elementary Students: The Effects of a 4-Point or 5-Point Likert-Type Scale. Educational and Psychological Measurement 70: 796–807.

Alwin, D.F., 1992: Information Transmission in the Survey Interview: Number of Response Categories and the Reliability of Attitude Measurement. Sociological Methodology 22: 83–118.

Alwin, D.F., E.M. Baumgartner & B.A. Beattie, 2018: Number of Response Categories and Reliability in Attitude Measurement†. Journal of Survey Statistics and Methodology 6: 212–239.

Bishop, G.F., 1987: Experiments With the Middle Response Alternative in Survey Questions. The Public Opinion Quarterly 51: 220–232.

Bishop, G.F., 1990: Issue involvement and response effects in public opinion surveys. Public Opinion Quarterly 54: 209–218.

Bogner, K. & U. Landrock, 2015: GESIS Survey Guidelines: Antworttendenzen in standardisierten Umfragen. 1–15.

Bourke, S. & J. Frampton, 1992: Assessing the quality of school life: Some technical considerations. . Gehalten auf der annual conference of the Australian Association for Research in Education, Melbourne, Victoria, Australia.

Diekmann, A., 2008: Empirische Sozialforschung. Grundlagen, Methoden, Anwendungen. Bd. 18.

Dubois, B. & J.A. Burns, 1975: An Analysis of the Meaning of the Question Mark Response Category in Attitude Scales. Educational and Psychological Measurement 35: 869–884.

Kaplan, K.J., 1972: On the ambivalence-indifference problem in attitude theory and measurement: A suggested modification of the semantic differential technique. Psychological Bulletin 77: 361–372.

Kemper, C.J., C. Beierlein, D. Bensch, A. Kovaleva & B. Rammstedt, 2012: Eine Kurzskala zur Erfassung des Gamma-Faktors sozial erwünschten Antwortverhaltens: Die Kurzskala Soziale Erwünschtheit-Gamma (KSE-G). 1–27.

Krosnick, J.A., 1991: Response strategies for coping with the cognitive demands of attitude measures in surveys. Applied cognitive psychology 5: 213–236.

Krosnick, J.A. & S. Presser, 2010: Question and questionnaire design. Handbook of Survey Research. Education Emerald, London.

Menold, N. & K. Bogner, 2015: GESIS Survey Guidelines Gestaltung von Ratingskalen in Fragebögen.

Noack, E.M., A.-K. Rovers, L. Kühling & R. Marggraf, 2016: WAS MENSCHEN BEWEGT, LEBENSMITTEL AUS DEM MÜLL ZU HOLEN: EINE EXPLORATIVE STUDIE ZUM CONTAINERN. S. 1–12.

O’Muircheartaigh, C.A., J.A. Krosnick & A. Helic, 2001: Middle alternatives, acquiescence, and the quality of questionnaire data. Chicago: Irving B. Harris Graduate School of Public Policy Studies, University of Chicago.

Schnell, R., P.B. Hill & E. Esser, 2013: Konzeptspezifikation, Operationalisierung und Messung. S. 119–200 in: Methoden der empirischen Sozialforschung.

Sturgis, P., C. Roberts & P. Smith, 2014: Middle alternatives revisited: How the neither/nor response acts as a way of saying “I don’t know”? Sociological Methods & Research 43: 15–38.

Abkürzungsverzeichnis

AIC Akaike-Informationskriterium

IQR... Interquartilsabstand

Max... Maximum

Mean arithmetisches Mittel

Med... Median

Min Minimum

N.. Anzahl Beobachtungen

SD... Standardabweichung

Skew.. Schiefe

Anhang

A Abbildungen

Abbildung 6: Schematisches Modell

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 7: Containern

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 8: Alter

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 9: Umweltinteresse

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 10: Umweltwissen

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 11: Soziale Erwünschtheit

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 12: Marginsplot

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 13: Koeffizientenplot für Frauen

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 14: Koeffizientenplot bei Männern

Abbildung in dieser Leseprobe nicht enthalten

B Tabellen

Tabelle 1: Split-Übersicht5

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 2: Stichprobenkonstruktion6

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 3: Operationalisierung

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 4: Übersicht Maßzahlen7 8

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 5: Häufigkeitstabelle

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 6: Multiple Lineare Regression

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 7: Multiple lineare Regression für Frauen

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 8: Multiple lineare Regression für Männer

Abbildung in dieser Leseprobe nicht enthalten

[...]


1 Teilhard de Chardin (1881-1955).

2 „Stimme überhaupt nicht zu“ und „Stimme eher nicht zu“

3 „Stimme voll und ganz zu“ und „Stimme eher zu“

4 Divers-geschlechtliche aufgrund niedriger Fallzahl nicht berücksichtigt (N = 3)

5 Auf zwei Nachkommastellen gerundet

6 Auf zwei Nachkommastellen gerundet

7 Transformierte Skala ohne Mittelkategorie

8 Transformierte Skala mit Mittelkategorie

Ende der Leseprobe aus 39 Seiten

Details

Titel
Effekte der Mittelkategorie. Unterschiede zwischen einer 5-stufigen und einer 4-stufigen Likert-Skala
Hochschule
Ludwig-Maximilians-Universität München  (Soziologie)
Veranstaltung
Forschungsmodul Quantitative Methoden
Note
1,3
Autor
Jahr
2022
Seiten
39
Katalognummer
V1288358
ISBN (eBook)
9783346748218
ISBN (Buch)
9783346748225
Sprache
Deutsch
Schlagworte
Likert, Mittelkategorie, Skala, Item, Fragebogen, Survey, Fragebogendesign, Surveydesign
Arbeit zitieren
Laura Kiemes (Autor:in), 2022, Effekte der Mittelkategorie. Unterschiede zwischen einer 5-stufigen und einer 4-stufigen Likert-Skala, München, GRIN Verlag, https://www.grin.com/document/1288358

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Effekte der Mittelkategorie. Unterschiede zwischen einer 5-stufigen und einer 4-stufigen Likert-Skala



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden