Varianz- und Regressionsanalyse sind zwei wichtige und häufig angewandte statistische Verfahren in der quantitativen empirischen Sozialforschung. Diese werden als multivariate Analyseverfahren bezeichnet, weil die statistischen Zusammenhänge zwischen mindestens drei Merkmalen bzw. Variablen untersucht werden. Beide Verfahren sind strukturen-prüfend und dienen damit dazu, vorher aufgestellte Hypothesen zu testen.
Im Unterschied zu strukturen-entdeckenden bzw. datenreduzierenden Analyseverfahren wie der Faktoren- oder Clusteranalyse besitzt der Anwender bei der Varianz- oder Regressionsanalyse bereits eine auf sachlogischen oder theoretischen Überlegungen basierende Vorstellung über mögliche Zusammenhänge zwischen den Variablen und kann diese dann empirisch anhand eines Datensatzes überprüfen. In dieser Arbeit geht es in erster Linie darum, die Anwendung der statistischen Verfahren von Varianz- und Regressionsanalyse als solche zu demonstrieren und ihre zugrunde liegende Logik nachvollziehbar und verständlich herauszuarbeiten. Als Beispielsdatensatz wird ein reduzierter Datensatz der „Allgemeinen Bevölkerungsumfrage der Sozialwissenschaften“ (ALLBUS) 1996 verwendet. Auf der Internet-Seite der „Gesellschaft Sozialwissenschaftlicher Infrastruktureinrichtungen e.V. (GESIS) können Codebuch (pdf Format), SPSS file (sav Format) und Methodenbericht (pdf Format) der verwendeten Studie kostenlos unter der Bezeichnung „ALLBUScompact-1996 ZA Nr. 3718“ für wissenschaftliche Zwecke herunter geladen werden (http://www.gesis.org/Datenservice/ALLBUS/Bestellen/download.htm).
Als Software wurde das in der Soziologie sehr gebräuchliche Datenverarbeitungsprogramm SPSS (Statistical Package for Social Sciences) verwendet. Alle angewandten SPSS-Prozeduren sind im Anhang als SPSS-Output im Einzelnen dokumentiert.
Inhaltsverzeichnis
- Einleitung
- Varianzanalyse
- Die Logik der Varianzanalyse
- Gruppenmittelwerte in Stichprobe und Grundgesamtheit
- Die eigentliche Varianzanalyse
- Voraussetzungen
- Die Stärke des Zusammenhangs
- Multifaktorielle Varianzanalyse
- Varianzanalyse mit einem Faktor
- Varianzanalyse mit zwei Faktoren
- Varianzanalyse mit drei Faktoren
- Die Logik der Varianzanalyse
- Regressionsanalyse
- Einfache Regressionsanalyse
- Regressionskoeffizient und Konfidenzintervall
- Fit der Regressionsgleichung und PRE-Logik
- Überprüfung der Residuen
- Multiple Regressionsanalyse
- Die einbezogenen Variablen
- Prüfung auf Multikollinearität
- Die multiple Regressionsanalyse
- Überprüfung der Residuen
- Zusammenfassung
- Einfache Regressionsanalyse
- Literaturverzeichnis
- Anlagen
Zielsetzung und Themenschwerpunkte
Die Hausarbeit befasst sich mit multivariaten Analyseverfahren, insbesondere mit Varianz- und Regressionsanalysen, die in der empirischen Sozialforschung weit verbreitet sind. Der Schwerpunkt liegt dabei auf der Demonstration der Anwendung dieser Verfahren und der Erläuterung ihrer zugrundeliegenden Logik, ohne sich tiefgreifend mit der sachlogischen oder theoretischen Fundierung der zu testenden Hypothesen oder der Aktualität des Datensatzes auseinanderzusetzen.
- Vorstellung von Varianz- und Regressionsanalysen als wichtige multivariate Analyseverfahren
- Demonstration der Anwendung dieser Verfahren anhand von Beispielen aus dem ALLBUS-Datensatz von 1996
- Erläuterung der zugrundeliegenden Logik und der Anwendungsvoraussetzungen
- Diskussion der Interpretation von Ergebnissen
- Veranschaulichung der Bedeutung von Varianz- und Regressionsanalysen für die empirische Sozialforschung
Zusammenfassung der Kapitel
Die Einleitung erläutert die Bedeutung multivariater Analyseverfahren in der Sozialforschung, insbesondere im Vergleich zu univariaten Verfahren. Sie stellt die beiden in dieser Hausarbeit behandelten Verfahren, Varianz- und Regressionsanalyse, vor und erläutert die grundlegenden Unterschiede zwischen strukturen-entdeckenden und strukturen-prüfenden Verfahren.
Das Kapitel über die Varianzanalyse führt in die grundlegenden Prinzipien der Varianzanalyse ein. Es erklärt die Logik der Varianzanalyse, ihre Anwendungsvoraussetzungen und die Interpretation der Ergebnisse. Es werden sowohl die einfaktorielle als auch die mehrfaktorielle Varianzanalyse erläutert, wobei die verschiedenen Varianten der mehrfaktoriellen Varianzanalyse (mit zwei oder drei Faktoren) vorgestellt werden. Darüber hinaus wird die Bedeutung der Überprüfung von Interaktionseffekten in der mehrfaktoriellen Varianzanalyse hervorgehoben.
Das Kapitel über die Regressionsanalyse konzentriert sich auf die zwei wichtigsten Arten von Regressionsanalysen: die einfache und die multiple Regressionsanalyse. Es werden die grundlegenden Konzepte der Regression, wie der Regressionskoeffizient und das Konfidenzintervall, sowie die Bedeutung des Fits der Regressionsgleichung und der PRE-Logik für die Interpretation von Ergebnissen erläutert. Darüber hinaus wird die Bedeutung der Überprüfung der Residuen für die Beurteilung der Gültigkeit des Regressionsmodells betont.
Schlüsselwörter
Multivariate Datenanalyse, Varianzanalyse, Regressionsanalyse, einfaktorielle Varianzanalyse, mehrfaktorielle Varianzanalyse, einfache Regressionsanalyse, multiple Regressionsanalyse, ALLBUS-Datensatz, SPSS, Hypothese, Datenreduktion, Hypothesentest, empirische Sozialforschung.
- Quote paper
- Joachim Schmidt (Author), 2004, Varianz- und Regressionsanalysen als wichtige Datenanalyseverfahren anhand eines Datensatzes der ALLBUS 1996, Munich, GRIN Verlag, https://www.grin.com/document/78282