Die vorliegende Arbeit mit dem Titel “Deskriptive und explorative Datenanalyse” beantwortet folgende Fragen zur psychologische Methodenlehre:
- Tabellarische Darstellung von Häufigkeiten und Anteilen;
- Häufigkeitsverteilung;
- Lage- und Streuungsmaße;
- Modalwert (Modus);
- Median;
- Mittelwert;
- Spannweite;
- Interquartilsabstand;
- Varianz;
- Standardabweichung;
- Varianzaufklärung;
- Repräsentativität von Stichproben;
- Boxplot;
- Zusammenhänge;
- Streudiagramm;
- Korrelationskoeffizient;
- Zusammenhangsinterpretation;
- Prädiktor versus Kriterium;
- Standardisiertes Regressionsgewicht;
- Determinationskoeffizient
Inhaltsverzeichnis
1 Tabellarische Darstellung von Häufigkeiten und Anteilen
2 Häufigkeitsverteilung
3 Lage- und Streuungsmaße
3.1 Modalwert (Modus)
3.2 Median
3.3 Mittelwert
3.4 Spannweite
3.5 Interquartilsabstand
3.6 Varianz
3.7 Standardabweichung
4 Varianzaufklärung
5 Repräsentativität von Stichproben
6 Boxplot
7 Zusammenhänge
7.1 Streudiagramm
7.2 Korrelationskoeffizient
7.3 Zusammenhangsinterpretation
7.4 Prädiktor versus Kriterium
7.5 Standardisiertes Regressionsgewicht
7.6 Determinationskoeffizient
Literaturverzeichnis
Tabellenverzeichnis
Abbildungsverzeichnis
1 Tabellarische Darstellung von Häufigkeiten und Anteilen
Die erfassten Daten der Studie Leistungstest werden in unten angeführter Häufigkeitstabelle, mit den jeweiligen Anteilen tabellarisch dargestellt. Bei der Variable Geschlecht, handelt es sich um das Nominalskalenniveau, und kann somit als Häufigkeit und Anteil dargestellt werden. Die Leistung, welche mit Punkten bewertet wurde von 0-10 liegt auf einer Verhältnisskala, es besteht ein Nullpunkt und es ist anzunehmen, dass die Punkteabstände gleiche Werte haben.
Abbildung in dieser Leseprobe nicht enthalten
Tab 1.1 : Mathematik- und Programmiertestergebnisse je Geschlecht
2 Häufigkeitsverteilung
Unten dargestellte Häufigkeitsverteilungen zeigen die unterschiedlichen Leistungen, definiert in der erreichten Punkteanzahl, der einzelnen Personen, die den jeweiligen Test, bei einer Stichprobengröße von 10 Personen.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 2.1: Häufigkeitsverteilung der Leistungen in unterschiedlichen Tests (N=10)
3 Lage- und Streuungsmaße
Die Lagemaße, die nachfolgende ermittelt werden (siehe Punkt 3.1 – 3.3), entstammen einer Verhältnisskala, sie lassen somit Berechnung für Modus, Median und Mittelwert zu. Um die Verteilung korrekt zu beschreiben, bedarf es auch der Angabe der Streuungsmaße (Punkt 3.4 – 3.6).
3.1 Modalwert (Modus)
Der Modalwert ist jener Wert, der in der Verteilung am häufigsten vorkommt. Er zeigt an um welchen Wert sich die Verteilung konzentriert und ist somit ein Lagemaß (vgl. Schäfer, 2014, S.8). Für die Variable „Leistung im Mathematiktest“ gibt es keinen eindeutigen Modalwert, die Werte 2,3 und 5 kommen jeweils gleich oft mal vor. Bei der Variable „Leistung im Test für Programmierkenntnisse“ ist der Wert 5 der Modalwert, da er am häufigsten, also 4 mal, ermittelt wurde. Die Verteilung konzentriert sich um den Wert 5.
3.2 Median
Der Median, ein Lagemaß, ist jener Wert, welcher genau in der Mitte der Verteilung zu finden ist. Er ist vor allem gegenüber Ausreißern, die am Rande der Verteilung liegen, stabil. Um den Median zu ermitteln, schreibt man alle Werte der Größe nach auf (a), teilt die Reihe in 2 Hälften (b) und der Wert der Mitte wird als Median bestimmt. Sollte es sich um eine gerade Anzahl der Reihenwerte handelt, und es keinen Mittenwert geben, werden die beiden mittleren aufsummiert und der Durchschnitt ermittelt(c) (vgl. Schäfer,2014,S. 9).
Median „Leistung im Mathematiktest“:
Abbildung in dieser Leseprobe nicht enthalten
Median „Leistung im Test für Programmierkenntnisse“:
Abbildung in dieser Leseprobe nicht enthalten
3.3 Mittelwert
Der Mittelwert, ein Lagemaß, ist das arithmetische Mittel der durch den Test erhaltenen Wertereihe. Das heißt, es findet eine rechnerische Operation mit den Rohdaten statt. Er ist wenig robust gegenüber Ausreißern und spiegelt weniger gut die Lage der Verteilung wider, jedoch beschreibt der die Daten am exaktesten (vgl. Schäfer, 2014, S. 10ff.).
Abbildung in dieser Leseprobe nicht enthalten
3.4 Spannweite
Die Spannweite, auch als Range bezeichnet, ist ein Streuungsmaß. Sie gibt die Breite der Verteilung an, also die Streuung von ihrem kleinsten zu ihrem größten Wert. Sie ist die Differenz des größten und kleinsten Wertes der Verteilung. Die Spannweite kann nur eingeschränkt zwischen Verteilungen differenzieren, und wird vorwiegend bei der Variable Geschlecht verwendet (vgl. Schäfer, 2014, S. 17).
Abbildung in dieser Leseprobe nicht enthalten
3.5 Interquartilsabstand
Der Interquartilsabstand ist ein Streuungsmaß und ermöglicht die Ausgrenzung von etwaigen Ausreißern am Rande, die die Verteilung verzerren könnten. Er schließt die unteren und oberen 25% der Verteilung aus. Zur Ermittlung werden die Stichprobenwerte der Größe nach aufgereiht (a). Die Reihe halbiert (b), und aus den unteren bzw. oberen 25% der Reihe (c), den jeweiligen Quartilen, die Werte der Mitte abgelesen. Sollte die Mitte zwei Werte bestimmen, dann wird der Durchschnitt der Werte ermittelt. Aus den beiden Werten wird die Differenz gezogen (d), welcher den Interquartalsabstand zeigt (vgl. Schäfer, 2014, S. 17f.).
Abbildung in dieser Leseprobe nicht enthalten
3.6 Varianz
Die Varianz, ein Streuungsmaß, und ist die durchschnittliche quadrierte Abweichung der Werte vom Mittelwert. Zur Berechnung summiert man die quadrierten Differenzen der Werte vom Mittelwert und teilt sie durch die Stichprobengröße, um ein Wertmaß zu erhalten. Sie liefert somit den Durschnitt quadrierter Werte, und ist selbst schwer interpretierbar (vgl. Schäfer, 2014, S. 18f.)
Abbildung in dieser Leseprobe nicht enthalten
3.7 Standardabweichung
Die Standardabweichung, ebenfalls ein Streuungsmaß. Sie gibt die durchschnittliche Abweichung aller Werte von ihrem Mittelwert an. Die wird als standard deviation bezeichnet (s, SD). Sie ist die Wurzel aus der Varianz (siehe Punkt 3.6), welches den Quadrateffekt eliminiert und daher zu Interpretationen herangezogen werden kann. In Bezug zur Skala, auf der sie gemessen wurde und der Fragestellung, kann die Stärke der Abweichung dann beschrieben werden (vgl. Schäfer, 2014, S.19).
Abbildung in dieser Leseprobe nicht enthalten
4 Varianzaufklärung
„die Leistung aller Schüler der Stichprobe im Mathematiktest“ bezieht sich auf die Gesamtvarianz, welche sowohl die natürliche (auf den Geschlechtereinfluss zurückgehende) Varianz und die Varianz der UV umfasst. Es werden alle Leistungen, jene der weiblichen und männlichen Schüler berücksichtigt.
„Verteilung aller Punktwerte eines Geschlechts um den jeweiligen Mittelwert“ umfasst entweder das weibliche oder männliche Geschlecht, und enthält somit die natürliche Varianz, da nur ein Geschlecht betrachtet wird, es handelt sich hierbei um die Fehlervarianz, einem natürlichen Rauschen. „die durch das Geschlecht hervorgerufene unterschiedliche Lage der Verteilungen“ zeigt 2 Verteilungen, die unterschiedlich sind, die verbleibende Varianz, die auf die UV zurückführbar ist, ist sichtbar. Es handelt sich um die systemische Varianz, welche durch die UV hervorgerufen wird.
5 Repräsentativität von Stichproben
Grund 1: Die vorliegende Stichprobe von 10 Personen ist aufgrund ihrer Größe nicht sehr repräsentativ. Stichproben ab einer Größe von >30 Personen zeigen, dass sich ihre Verteilungen einer Normalverteilung annähern, das heißt ihre Werte gruppieren sich um den Mittelwert. Bei kleinen Stichproben besteht somit die Gefahr, dass die Verteilung wenig repräsentativ ist, da sie untypische Werte enthalten kann. Grund2: Beim Ziehen von Stichproben aus vordefinierten Gruppen (wie beispielsweise Schüler aus einer ganz bestimmten Schule) leidet die Repräsentativität, da die Stichprobe nicht randomisiert, also zufällig aus der Population, wurde. Werden Stichproben aus der gesamten Population, zufällig gezogen, ist die Tendenz zur Mitte durch das Gesetz der großen Zahl gegeben, und die sind repräsentativ denn dann würde die Stichprobe die Häufigkeitsverteilung der Population annehmen.
6 Boxplot[MP1]
Abbildung in dieser Leseprobe nicht enthalten
Abb.: 6.1 Boxplots für die Leistung im Mathematiktest nach Geschlecht
Zur Darstellung der Variable „Leistung im Mathematiktest nach Geschlecht“ wurden 2 Boxplots, jeweils für die Ergebnisse der männlichen und weiblichen Schüler dargestellt. Die Y-Achse listet die Punkteanzahl von 1-10, die X-Achse die Leistungsergebnisse des Mathematiktestes. Die Box stellt den Interquartilsabstand dar, für männliche Schüler 2, für weibliche Schüler 2,5. Der Querstrich innerhalb der Box zeigt den Median, männlich 2,5 und weiblich 5,5. Er gibt Aufschluss über die Lage der Verteilung. Bei den männlichen Schülern, ist die Verteilung links steil bzw. rechts schief, bei den weiblichen Schülern eher symmetrisch, aber auch mit schiefer Tendenz, rechts steil bzw. links schief. Es gibt keine Ausreißer, welches die aufgetragenen Striche mit den jeweiligen Endstrichen, die sogenannten Zäune oder Barthaare darstellen. Keiner der Stichprobenwerte liegt außerhalb der Zäune. Die Verteilung zeigt keine Ausreißer. Boxplot ermöglichen es die Rohdaten unverzerrt darzustellen und die Identifikation von Ausreißern wird möglich (vgl. Schäfer, 2014, S. 35ff.).
[...]
- Citation du texte
- Anonyme,, 2017, Deskriptive und explorative Datenanalyse, Munich, GRIN Verlag, https://www.grin.com/document/907710
-
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X.