Diese Vorlesungsmitschrift mit dem Titel "Statistik I" enthält u.a. folgende Inhalte:
- deskriptive Statistik - Skalendignität;
- Mittelwert;
- Histogramm;
- Varianz;
- Kovarianz;
- Streudiagramm;
- Funktionale Zusammenhänge;
- Korrelationen;
- Lineare Modelle;
- Bestimmtheitsmaß/ Determinationskoeffizient;
- Partielle Korrelation;
- Multiple Korrelation
Statistik I
deskriptive Statistik = Beschreiben der Stichprobe Empirische Evidenz wird benötigt, um eine wissenschaftliche Aussage zu treffen. Mit Hilfe statistischer Methoden wird eine Gelegenheitsbeobachtung zu einer wissenschaftlich fundierten Aussage. Statistik eignet sich als Werkzeug am besten, um systematische und zufällige Informationen zu trennen, in anderen Worten, ein allgemein wirksames Prinzip soll vom Zufall getrennt werden.
Zufallsfehler: individuelle Abweichung vom allgemeingültigen Prinzip
Nomothetisches Prinzip: allgemeingültige Prinzip zu erkennen, Gesetzmäßigkeiten zu finden, die über die konkret beobachteten bzw. befragten Individuen hinaus Gültigkeit haben
Idiographisches Prinzip: das Individuelle herausarbeiten und erkennen zB. Psychotherapie, Personen in ihrer individuellen Einzigartigkeit bestmöglich zu begreifen
Zufallsvariable ist das Merkmal, über das eine Aussage gemacht werden soll zB. Größe, Intelligenz. In allgemeiner Darstellung wird der Großbuchstabe X für die Zufallsvariable verwendet. X = Variable
Die individuelle Ausprägung ist der konkrete Wert, den eine Person in der Testung aufweist und sie wird mit dem entsprechenden Kleinbuchstaben und tiefgestellten Personenindex dargestellt wie x1. x = Ausprägung
Die Anzahl der Beobachtung wird häufig mit n gekennzeichnet.
Skalendignität ist das Niveau, auf dem erhoben wurde.
absolut - rational - Intervall - Rang/Ordinal - nominal Die Erhebung ist Unsinn, wenn das Verfahren, viel fordert, aber die Daten wenig Information enthalten, man also mit zu hohem Niveau auswertet.
Die Erhebung ist ungenau, wenn die Daten viel Information enthalten, aber das Verfahren wenig Information fordert bzw. auswerten kann.
Absolut Skala:
Zahlen, die keine Maßeinheit brauchen, die nicht veränderbar sind, werden mit Absolut Skalen dargestellt zB. Prozent %.
Rational Skala:
Eine Variable, die eine genaue Abbildung ermöglicht ist eine rationale Variable. Ein Nullpunkt ist vorhanden, die Beschreibungen doppelt und halb sind möglich.
Die numerische Funktion, die eine Variable innehat, ist nicht auf das beschriebene Phänomen übertragbar.
Kelvin Skala ist der absolute Nullpunkt in der Natur vorgegeben, 0 Kelvin ist somit rational.
Intervall Skala:
Es wurde eine Maßeinheit mit realer Entsprechung festgelegt, die Intervalle, als die Breite der Skala ist empirisch begründet. Es gibt keinen natürlichen Nullpunkt, er wurde willkürlich (=arbiträr) festgelegt.
zB. IQ in Intelligenztests - der Durchschnitt der Bevölkerung wurde mit 100 willkürlich gewählt, in Pisa Tests mit 500 (Testungen im Randbereich stellen sich selbst in Frage.), Temperaturen in C°, Aussagen in Einstellungsfragebögen mit kategorisiertem Antwortformat oft als Likert Format bezeichnet
Rang- oder Ordinal Skala:
Eine Rangskala kann keine interpretierbaren Präferenzen ausgeben. Die Abstände sind numerisch nicht mehr interpretierbar, es ist keine Summer oder Mittelwert bildbar. Die Abstände sind veränderbar, aber die Rangplätze nicht austauschbar. Die Rangskala, eine sortierte Reihenfolge mit Rangplätzen oder Rangreihe, ist eine der am häufigsten verwendeten Skalen zB. Noten. Ordinal Skalen geben eine direkte, subjektive Einschätzung an.
Aus den rangskalierten Variablen kann man Aussagen auf Intervallskalen bzw. Rational Skalen machen.
Nominal e Skala:
Variablen, die keine Sortierung zulassen, wie Geschlecht, Studienrichtung, Haarfarbe sind nominale Daten. Es wird eine Codierung verwendet und Kategorien = # gebildet.
Abbildung in dieser Leseprobe nicht enthalten
Σ (griech. Zeichen Sigma) - Summe
um eine Summe über eine unbekannte Anzahl von Summanden zu bilden
Abbildung in dieser Leseprobe nicht enthalten
Arithmetisches Mittel (Mittelwert) - die Summe aller Terme durch ihre Anzahl
Mittelwert ist die zentrale Tendenz der Werte, bedarf aber einer weiteren Spezifikation bzgl. der Variabilität der Werte.
Abbildung in dieser Leseprobe nicht enthalten
md= modolo; Alle i für die gilt (:), dass die Division durch 2 null ist.
Abbildung in dieser Leseprobe nicht enthalten
Das Histogramm
Das Histogramm kann ein Bild davon geben, wie sich die Werte um den Mittelwert scharren.
Das Histogramm ist die graphische Darstellung der Häufigkeiten.
-Abbildung der Häufigkeit (y-Achse) der Werte (x-Achse)
-Vollständige Beschriftung eines Histogramms ist essentiell
-Wahl der Intervallbreite und -grenzen kann Erscheinungsbild stark verändern •Orientierung über die Gesamtdaten, aber keine präzise Abbildung dieser
-Ausreißer werden im Histogramm gut sichtbar
-Bimodale oder unimodale Daten
Werteklassen bzw. -bereiche können gebildet werden. zB. 150 - 160, 160 - 170, ... Man entscheidet selbst ob der genaue Wert von 160 in die obere oder untere Gruppe fällt, muss dies aber ausreichend kennzeichnen.
Die Wahl der Intervallgrenzen und der Intervallbreite kann das Erscheinungsbild des Histogramms massiv beeinflussen.
Die Darstellung ist ein Hinweis, eine Orientierung, aber keine exakte Wiedergabe der Daten. Keine reliable Darstellung! Es sind Suggestionen möglich, um die Ergebnisse anders erscheinen zu lassen.
Es muss immer die gleiche Klassenbreite verwendet werden, um potentielle Missverständnisse zu vermeiden. Verwendet man Sammelkategorien wie zB. 200+ muss dies explizit im Begleittext betont werden.
Werte, die atypisch sind, darf man nicht einfach weglassen ► Inhalt ansehen, Warum so atypisch? Pauschales Ausschließen ist immer falsch!
Ausreißer ist hier zB. ein Kind mit der Größe 120
Wie schließt man eine Ausprägung aus?
Abbildung in dieser Leseprobe nicht enthalten
Ist der Mittelwert ein repräsentativer Wert oder nur zufällig in der Mitte? Verteilung der Datenmenge
Unimodale Bimodale
Maß für zentrale Tendenz = Mittelwert
Maß, ob der Mittelwert ein guter oder schlechter Repräsentant ist.
Die Variabilität von Werten wird mit der Varianz ausgedrückt. Sie ist die wichtigste Kennzahl und charakterisiert das enge Zusammenliegen oder wie weit die Messwerte vom Mittelwert entfernt liegen.
Abbildung in dieser Leseprobe nicht enthalten
Xi - X Subtrahiere den Mittelwert vom Messwert!
Die Summe aller Abweichungen ist die Gesamtabweichung. Die Summe der Abweichungswerte ist immer 0! (0,0082 zB. wird als Rundungsfehler betrachtet - ist egal - trotzdem Null!)
Das Maß MAD (= mean absolut divation) ist die Summe der Abweichungen („Wege“) dividiert durch die Anzahl der Messwerte hier: durch 7.
Varianz
-Maß für die Variabilität/Unterschiedlichkeit der Werte
-Streuung der Werte um den Mittelwert
-Mittlerer, quadrierter Abstand der Messwerte vom gemeinsamen Mittelwert
-Varianz hat keine Maßeinheit und Obergrenze
Quadrieren hat den Vorteil, dass alle Vorzeichen aufgelöst werden, das Quadrat aller Zahlen ist positiv!
Weiter entfernte Abweichungen werden durch das Quadrieren höher gewichtet, dass macht die Berechnung sensibler für abweichende Werte.
Abbildung in dieser Leseprobe nicht enthalten
Die Varianz ist der mittlere quadrierte Abstand aller Messwerte zum gemeinsamen Mittelwert.
Die Varianz hat keine Maßeinheit und keine Obergrenze.
s oder sd = Standardabweichung
s ist die Standardabweichung in der Maßeinheit der erhobenen Variable.
Die Maßzahl s ist definiert durch die positive Wurzel von s2. Die Standardabweichung hat die Maßeinheit der originalen Variable hier: cm und auch keine obere Grenze. s=12cm
Abbildung in dieser Leseprobe nicht enthalten
Sobald Ausreiser in der Stichprobe sind ist der Mittelwert verzerrt. Dann darf man den Mittelwert nicht mehr verwenden, auch nicht die Varianz ► Man muss eine Skala weiter nach unten gehen (zur Rangskala) und mit deren Mitteln auswerten!
Abbildung in dieser Leseprobe nicht enthalten
Wenn statt dem Wert 4, der Wert 30 wäre x = -0,4 und der Mittelwert somit nicht mehr repräsentativ.
Eine Eigenschaft vom Mittelwert ist, dass wenn man die Abweichungen von ihm addiert kommt immer 0 heraus!
Abbildung in dieser Leseprobe nicht enthalten
[...]
- Citation du texte
- Anonyme,, 2013, Statistik I. Zufallsfehler, nomothetisches Prinzip, idiographisches Prinzip, Zufallsvariable, Skalendignität, Munich, GRIN Verlag, https://www.grin.com/document/512459
-
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X.