Statistik. Höhere Überlebenswahrscheinlichkeit für Ältere beim Titanic-Unglück?


Hausarbeit, 2020

13 Seiten, Note: 2,0

Anonym


Leseprobe


Inhaltsverzeichnis

1. Einleitung

2. Theorie- Ableiten der Forschungsfrage

3. Empirische Analysen
3.1 Datensatz
3.2 Explorative Datenanalyse
3.2.1 str(TitanicSurvival_neu)
3.2.2 inspect(TitanicSurvival_neu)
3.2.3 View(TitanicSurvival_neu)
3.2.4 hist(survived)
3.2.5 hist(age)
3.2.6 boxplot(survived)
3.2.7 boxplot(age)
3.2.8 favstats(age)
3.2.9 favstats(survived)
3.3 Regressionsanalyse
3.3.1 Regressionsmodell
3.3.2 Regressionsgerade
3.3.3 Lösung Schritt für Schritt
3.3.4 Berechnung Ordinatenabschnitt
3.3.5 Lineare Regression

4. Fazit

Quellenverzeichnis

1. Einleitung

Schiffsunglücke basieren auf verschiedenen Faktoren. Es können Umweltfaktoren, aber auch technische Faktoren sein, die ein Unglück beeinflussen. Ein bekanntes Schiffsun­glück ereignete sich im Jahre 1912. Die Titanic, ein Passagierschiff kollidierte auf dem Atlantik mit einem Eisberg.1 Dies hatte das Sinken auf dem Meeresgrund zufolge. Es befanden sich 2224 Menschen auf dem Schiff. Die Rettungsboote können allerdings nur 1778 Menschen aufnehmen. Dabei starben zahlreiche Männer, Frauen und Kinder. Die Gesamtzahl weißt 1.495 Passagiere auf.2

Gibt es einen Zusammenhang zwischen dem höheren Alter der Passagiere und der Überlebenschance auf der Titanic? Die nachfolgende Arbeit beschäftigt sich mit dieser Fragestellung. Mithilfe eines Datensatzes aus der Statistiksoftware R-Studio wird zu dem oben genannten Thema eine Datenanalyse vorgenommen.

Die Hausarbeit wird in einzelne Kapitel aufgeteilt. Das zweite Kapitel beschäftigt sich mit der Entwicklung der Forschungsfrage. Die Empirische Analyse wird in drei Teilbe­reiche aufgeteilt: Datensatz, Explorative Datenanalyse und Regressionsanalyse und ist somit das dritte Kapitel. Abschließend wird ein Fazit erstellt, welches auf den Ergebnis­sen der Datenanalyse basiert.

2. Theorie- Ableiten der Forschungsfrage

Der genutzte Datensatz führt zu der Entwicklung der Forschungsfrage. Eine Hypothese besteht aus verschiedenen Kriterien, dazu zählt die Allgemeingültigkeit, Falsifizierbar- keit und der Bezug auf untersuchbare und reale Sachverhalte. Die Forschungsfrage be­schäftigt sich mit der höheren Überlebenschance für Ältere bei dem Titanic Unglück. Die Nullhypothese besagt, dass es keinen Zusammenhang zwischen der höheren Über­lebenschance und dem höheren Alter gibt. Der Gegensatz dazu ist die Alternativhypo­these. Sie besagt, dass es einen Zusammenhang zwischen der höheren Überlebens­chance und dem höheren Alter gibt. Welche Hypothese gilt wird in den nächsten Schrit­ten untersucht.

3. Empirische Analysen

3.1 Datensatz

Der vorliegende Datensatz mit dem Namen „TitanicSurvival“, beinhaltet Daten über das Unglück auf der Titanic. Mithilfe der folgenden URL ist der Datensatz zu finden: https://vincentarelbundock.github.io/Rdatasets/datasets.html. Der Datensatz beinhaltet die Informationen von insgesamt 1309 Passagieren. Die Variablen geben Auskunft über die Überlebenschance (survived), Geschlecht (sex), Alter (age) und Klassenaufteilung (passengerClass).

Um den Datensatz durchzuführen müssen folgende Packages geladen werden und Be­fehle in R-Studio eingegeben werden. Der Befehl View(TitanicSurvival) erstellt eine Tabelle und durch den Befehl help(TitanicSurvival) wird ein Informationstext regene­riert.

- library(mosaic)
- 11brary(carData)
- View(Titarn’ cSurvival)
- hel p ("Ti tam’ cSu rvi val ")

Aufbauend zu dem oben aufgeführten Datensatz wurde ein individueller Datensatz „Ti- tanicSurvival_neu“ erstellt, der das Alter der Passagiere und Überlebenschance gegen­überstellt. Dieser ist aufgrund der geringen Gesamtzahl sorgfältiger auszuwerten. Der

Datensatz wurde mit einer Excel-Tabelle erstellt und anschließend in R-Studio abge­speichert. Er basiert auf dem ursprünglichen Datensatz „TitanicSurvival“. Die ersten 50 Passagiere der ersten Klasse wurden aus dem ursprünglichen Package entnommen. Durch folgende Befehle wird der neue Datensatz, der für die restliche Arbeit genutzt wird angezeigt:

- "I ibrary(mosai c)
- 1ibrary(carData)
- view(TitanicSurvival_neu)

3.2 Explorative Datenanalyse

Zu Beginn und Vorbereitung der explorativen Datenanalyse wird die Mincer-Gleichung erstellt. Sie wird angezeigt, um anschließend weitere Werte zu visualisieren:

- 11brary(mosaic)
- 1ibrary(foreign)
- attach(Titam'cSurvival_neu)

Nun folgen die Teilschritte der explorativen Datenanalyse, die mit diversen Befehlen angezeigt werden (Angabe in den Überschriften).

3.2.1 str(TitanicSurvival_neu)

Hier werden die Gesamtinformation des Datensatzes von 50 Passagieren und zwei Vari­ablen (age, survived) abgebildet. Grundsätzlich gibt es kategorische und numerische Variablen. Die numerische Variablen bestehen aus diskrete und stetige Variablen. Die kategorischen Variablen können auch als ordinale und nominale Variablen unterteilt werden. In dem vorliegenden Datensatz liegen numerische Variablen vor. Die diskrete und stetige Variable survived besitzt zwei Ausprägungen, (1) bedeutet survived und (0) not survived. Aufgrund der zwei Ausprägungen wird survived auch Dummy Variable genannt.

- str(Titanicsurvival_neu)

classes ‘tbl_df’, ‘tbl’ and ’ data . frame': 50 obs . of 2 variables:

$ survived: num 1110111101...

$ age : num 26 42 29 25 25 19 35 28 45 40 ...

[...]


1 Vgl. http://www.der-untergang-der-titanic.de/infos-titanic/titanic-unglueck.htm.

2 Vgl. https://de.statista.com/statistik/daten/studie/222490/umfrage/opfer-und-ueberlebende-des-un- tergangs-der-titanic/.

Ende der Leseprobe aus 13 Seiten

Details

Titel
Statistik. Höhere Überlebenswahrscheinlichkeit für Ältere beim Titanic-Unglück?
Hochschule
FOM Hochschule für Oekonomie & Management gemeinnützige GmbH, Köln
Veranstaltung
Wissenschaftliche Methoden – quantitative Datenanalyse
Note
2,0
Jahr
2020
Seiten
13
Katalognummer
V1170599
ISBN (eBook)
9783346591135
Sprache
Deutsch
Schlagworte
Statistik
Arbeit zitieren
Anonym, 2020, Statistik. Höhere Überlebenswahrscheinlichkeit für Ältere beim Titanic-Unglück?, München, GRIN Verlag, https://www.grin.com/document/1170599

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Statistik. Höhere Überlebenswahrscheinlichkeit für Ältere beim Titanic-Unglück?



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden