Gibt es einen Zusammenhang zwischen dem höheren Alter der Passagiere und der Überlebenschance auf der Titanic?
Mithilfe eines Datensatzes aus der Statistiksoftware R-Studio wird zu dem oben genannten Thema eine Datenanalyse vorgenommen.
Die Hausarbeit wird in einzelne Kapitel aufgeteilt. Das zweite Kapitel beschäftigt sich mit der Entwicklung der Forschungsfrage. Die Empirische Analyse wird in drei Teilbereiche aufgeteilt: Datensatz, Explorative Datenanalyse und Regressionsanalyse und ist somit das dritte Kapitel. Abschließend wird ein Fazit erstellt, welches auf den Ergebnissen der Datenanalyse basiert.
Inhaltsverzeichnis
1. Einleitung
2. Theorie- Ableiten der Forschungsfrage
3. Empirische Analysen
3.1 Datensatz
3.2 Explorative Datenanalyse
3.2.1 str(TitanicSurvival_neu)
3.2.2 inspect(TitanicSurvival_neu)
3.2.3 View(TitanicSurvival_neu)
3.2.4 hist(survived)
3.2.5 hist(age)
3.2.6 boxplot(survived)
3.2.7 boxplot(age)
3.2.8 favstats(age)
3.2.9 favstats(survived)
3.3 Regressionsanalyse
3.3.1 Regressionsmodell
3.3.2 Regressionsgerade
3.3.3 Lösung Schritt für Schritt
3.3.4 Berechnung Ordinatenabschnitt
3.3.5 Lineare Regression
4. Fazit
Zielsetzung & Themen
Die vorliegende Arbeit untersucht mithilfe einer statistischen Analyse, ob ein Zusammenhang zwischen dem höheren Alter von Passagieren und deren Überlebenschance bei dem Untergang der Titanic besteht.
- Analyse des Titanic-Datensatzes mittels der Statistiksoftware R-Studio.
- Durchführung einer explorativen Datenanalyse zur Visualisierung von Variablen.
- Anwendung einer linearen Regressionsanalyse zur Hypothesenprüfung.
- Gegenüberstellung von Alternativhypothese und Nullhypothese.
- Interpretation statistischer Kennzahlen wie p-Wert, t-Wert und R-squared.
Auszug aus dem Buch
3.2.1 str(TitanicSurvival_neu)
Hier werden die Gesamtinformation des Datensatzes von 50 Passagieren und zwei Variablen (age, survived) abgebildet. Grundsätzlich gibt es kategorische und numerische Variablen. Die numerische Variablen bestehen aus diskrete und stetige Variablen. Die kategorischen Variablen können auch als ordinale und nominale Variablen unterteilt werden. In dem vorliegenden Datensatz liegen numerische Variablen vor. Die diskrete und stetige Variable survived besitzt zwei Ausprägungen, (1) bedeutet survived und (0) not survived. Aufgrund der zwei Ausprägungen wird survived auch Dummy Variable genannt.
Zusammenfassung der Kapitel
1. Einleitung: Die Einleitung führt in die historische Thematik des Titanic-Unglücks ein und formuliert die zentrale Forschungsfrage bezüglich des Zusammenhangs von Alter und Überlebenschance.
2. Theorie- Ableiten der Forschungsfrage: In diesem Kapitel werden wissenschaftliche Hypothesen aufgestellt und die Nullhypothese sowie die Alternativhypothese für die Untersuchung definiert.
3. Empirische Analysen: Der empirische Teil umfasst die Beschreibung des Datensatzes, eine umfassende explorative Datenanalyse sowie die rechnerische Durchführung der Regressionsanalyse.
4. Fazit: Das Fazit fasst die Ergebnisse der statistischen Auswertung zusammen, verwirft die Alternativhypothese und diskutiert Limitationen sowie weitere Forschungsansätze.
Schlüsselwörter
Titanic, Überlebenschance, Alter, R-Studio, Datensatz, Explorative Datenanalyse, Regressionsanalyse, Nullhypothese, Statistik, Dummy-Variable, Regressionsgerade, p-Wert, t-Wert, R-squared, Signifikanz
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit untersucht statistisch, ob ältere Passagiere beim Untergang der Titanic eine höhere Überlebenswahrscheinlichkeit hatten als jüngere.
Was sind die zentralen Themenfelder?
Die Schwerpunkte liegen auf der explorativen Datenanalyse und der linearen Regressionsrechnung unter Verwendung von R-Studio.
Was ist das primäre Ziel der Forschungsfrage?
Das Ziel ist die statistische Überprüfung, ob das Alter als Prädiktor für das Überleben der Passagiere fungiert.
Welche wissenschaftliche Methode wird verwendet?
Es wird eine lineare Regressionsanalyse auf Basis eines speziell für diese Arbeit aufbereiteten Datensatzes angewandt.
Was wird im Hauptteil behandelt?
Der Hauptteil gliedert sich in die Aufbereitung des Datensatzes, grafische Auswertungen via Histogramme und Boxplots sowie die mathematische Herleitung der Regressionsgeraden.
Welche Schlüsselwörter charakterisieren die Arbeit?
Zu den wichtigsten Begriffen zählen Titanic, Regressionsanalyse, Überlebenschance, R-Studio und Hypothesenprüfung.
Warum wurde der Datensatz „TitanicSurvival_neu“ erstellt?
Dieser wurde für eine sorgfältigere Auswertung mit einer geringeren, überschaubareren Fallzahl (50 Passagiere der ersten Klasse) basierend auf dem Originaldatensatz erstellt.
Wie lautet das Hauptergebnis zur Hypothese?
Die Analyse ergab keinen signifikanten Zusammenhang zwischen dem Alter und der Überlebenschance, weshalb die Nullhypothese nicht verworfen werden konnte.
- Quote paper
- Anonym (Author), 2020, Statistik. Höhere Überlebenswahrscheinlichkeit für Ältere beim Titanic-Unglück?, Munich, GRIN Verlag, https://www.grin.com/document/1170599