Gibt es einen Zusammenhang zwischen dem höheren Alter der Passagiere und der Überlebenschance auf der Titanic?
Mithilfe eines Datensatzes aus der Statistiksoftware R-Studio wird zu dem oben genannten Thema eine Datenanalyse vorgenommen.
Die Hausarbeit wird in einzelne Kapitel aufgeteilt. Das zweite Kapitel beschäftigt sich mit der Entwicklung der Forschungsfrage. Die Empirische Analyse wird in drei Teilbereiche aufgeteilt: Datensatz, Explorative Datenanalyse und Regressionsanalyse und ist somit das dritte Kapitel. Abschließend wird ein Fazit erstellt, welches auf den Ergebnissen der Datenanalyse basiert.
Inhaltsverzeichnis
1. Einleitung
2. Theorie- Ableiten der Forschungsfrage
3. Empirische Analysen
3.1 Datensatz
3.2 Explorative Datenanalyse
3.2.1 str(TitanicSurvival_neu)
3.2.2 inspect(TitanicSurvival_neu)
3.2.3 View(TitanicSurvival_neu)
3.2.4 hist(survived)
3.2.5 hist(age)
3.2.6 boxplot(survived)
3.2.7 boxplot(age)
3.2.8 favstats(age)
3.2.9 favstats(survived)
3.3 Regressionsanalyse
3.3.1 Regressionsmodell
3.3.2 Regressionsgerade
3.3.3 Lösung Schritt für Schritt
3.3.4 Berechnung Ordinatenabschnitt
3.3.5 Lineare Regression
4. Fazit
Quellenverzeichnis
1. Einleitung
Schiffsunglücke basieren auf verschiedenen Faktoren. Es können Umweltfaktoren, aber auch technische Faktoren sein, die ein Unglück beeinflussen. Ein bekanntes Schiffsunglück ereignete sich im Jahre 1912. Die Titanic, ein Passagierschiff kollidierte auf dem Atlantik mit einem Eisberg.1 Dies hatte das Sinken auf dem Meeresgrund zufolge. Es befanden sich 2224 Menschen auf dem Schiff. Die Rettungsboote können allerdings nur 1778 Menschen aufnehmen. Dabei starben zahlreiche Männer, Frauen und Kinder. Die Gesamtzahl weißt 1.495 Passagiere auf.2
Gibt es einen Zusammenhang zwischen dem höheren Alter der Passagiere und der Überlebenschance auf der Titanic? Die nachfolgende Arbeit beschäftigt sich mit dieser Fragestellung. Mithilfe eines Datensatzes aus der Statistiksoftware R-Studio wird zu dem oben genannten Thema eine Datenanalyse vorgenommen.
Die Hausarbeit wird in einzelne Kapitel aufgeteilt. Das zweite Kapitel beschäftigt sich mit der Entwicklung der Forschungsfrage. Die Empirische Analyse wird in drei Teilbereiche aufgeteilt: Datensatz, Explorative Datenanalyse und Regressionsanalyse und ist somit das dritte Kapitel. Abschließend wird ein Fazit erstellt, welches auf den Ergebnissen der Datenanalyse basiert.
2. Theorie- Ableiten der Forschungsfrage
Der genutzte Datensatz führt zu der Entwicklung der Forschungsfrage. Eine Hypothese besteht aus verschiedenen Kriterien, dazu zählt die Allgemeingültigkeit, Falsifizierbar- keit und der Bezug auf untersuchbare und reale Sachverhalte. Die Forschungsfrage beschäftigt sich mit der höheren Überlebenschance für Ältere bei dem Titanic Unglück. Die Nullhypothese besagt, dass es keinen Zusammenhang zwischen der höheren Überlebenschance und dem höheren Alter gibt. Der Gegensatz dazu ist die Alternativhypothese. Sie besagt, dass es einen Zusammenhang zwischen der höheren Überlebenschance und dem höheren Alter gibt. Welche Hypothese gilt wird in den nächsten Schritten untersucht.
3. Empirische Analysen
3.1 Datensatz
Der vorliegende Datensatz mit dem Namen „TitanicSurvival“, beinhaltet Daten über das Unglück auf der Titanic. Mithilfe der folgenden URL ist der Datensatz zu finden: https://vincentarelbundock.github.io/Rdatasets/datasets.html. Der Datensatz beinhaltet die Informationen von insgesamt 1309 Passagieren. Die Variablen geben Auskunft über die Überlebenschance (survived), Geschlecht (sex), Alter (age) und Klassenaufteilung (passengerClass).
Um den Datensatz durchzuführen müssen folgende Packages geladen werden und Befehle in R-Studio eingegeben werden. Der Befehl View(TitanicSurvival) erstellt eine Tabelle und durch den Befehl help(TitanicSurvival) wird ein Informationstext regeneriert.
- library(mosaic)
- 11brary(carData)
- View(Titarn’ cSurvival)
- hel p ("Ti tam’ cSu rvi val ")
Aufbauend zu dem oben aufgeführten Datensatz wurde ein individueller Datensatz „Ti- tanicSurvival_neu“ erstellt, der das Alter der Passagiere und Überlebenschance gegenüberstellt. Dieser ist aufgrund der geringen Gesamtzahl sorgfältiger auszuwerten. Der
Datensatz wurde mit einer Excel-Tabelle erstellt und anschließend in R-Studio abgespeichert. Er basiert auf dem ursprünglichen Datensatz „TitanicSurvival“. Die ersten 50 Passagiere der ersten Klasse wurden aus dem ursprünglichen Package entnommen. Durch folgende Befehle wird der neue Datensatz, der für die restliche Arbeit genutzt wird angezeigt:
- "I ibrary(mosai c)
- 1ibrary(carData)
- view(TitanicSurvival_neu)
3.2 Explorative Datenanalyse
Zu Beginn und Vorbereitung der explorativen Datenanalyse wird die Mincer-Gleichung erstellt. Sie wird angezeigt, um anschließend weitere Werte zu visualisieren:
- 11brary(mosaic)
- 1ibrary(foreign)
- attach(Titam'cSurvival_neu)
Nun folgen die Teilschritte der explorativen Datenanalyse, die mit diversen Befehlen angezeigt werden (Angabe in den Überschriften).
3.2.1 str(TitanicSurvival_neu)
Hier werden die Gesamtinformation des Datensatzes von 50 Passagieren und zwei Variablen (age, survived) abgebildet. Grundsätzlich gibt es kategorische und numerische Variablen. Die numerische Variablen bestehen aus diskrete und stetige Variablen. Die kategorischen Variablen können auch als ordinale und nominale Variablen unterteilt werden. In dem vorliegenden Datensatz liegen numerische Variablen vor. Die diskrete und stetige Variable survived besitzt zwei Ausprägungen, (1) bedeutet survived und (0) not survived. Aufgrund der zwei Ausprägungen wird survived auch Dummy Variable genannt.
- str(Titanicsurvival_neu)
classes ‘tbl_df’, ‘tbl’ and ’ data . frame': 50 obs . of 2 variables:
$ survived: num 1110111101...
$ age : num 26 42 29 25 25 19 35 28 45 40 ...
[...]
1 Vgl. http://www.der-untergang-der-titanic.de/infos-titanic/titanic-unglueck.htm.
2 Vgl. https://de.statista.com/statistik/daten/studie/222490/umfrage/opfer-und-ueberlebende-des-un- tergangs-der-titanic/.
-
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X.