Statistik III - Deskriptive Statistik
A-Zweidimensionale Verteilung
B-Regressionsanalyse
C-Korrelation
Inhaltsverzeichnis
A Deskriptive Statistik
A.1 Zweidimensionale Häufigkeitsverteilung
A.2 Regressionsanalyse
A.2.1 Die Mathematik einer Geraden
A.2.2 Gauß 1777 – 1855 „Methode der kleinsten Quadrate“
A.2.3 Kovarianz
A.2.4 Lineares einfaches Bestimmtheitsmaß
A.3 Korrelation
A.3.1 Rangkorrelation (Sparman)
A.3.2 Korrelation – Ursache
A Deskriptive Statistik
A.1 Zweidimensionale Häufigkeitsverteilung
absolute Häufigkeit:
Gegeben sind die Merkmale X mit den Ausprägungen xj (j=1,2,...,n) und Y mit den Ausprägungen yk (k=1,2,...,q), die an den selben statistischen Einheiten erhoben werden. Die Anzahl der Beobachtungswerte, bei denen die Ausprägungskombinationen (xj, yk) auftritt heißt absolute Häufigkeit = h(xj, yk)
relative Häufigkeit:
Der Anteil der absoluten Häufigkeit an der Gesamtzahl n der Beobachtungen heißt relative Häufigkeit = f(xj, yk)
Abbildung in dieser Leseprobe nicht enthalten
zweidimensionale Häufigkeitsverteilung
Die Gesamtheit aller aufgetretenen Kombinationen von Merkmalsausprägungen und der dazugehörigen absoluten und relativen >Häufigkeit heißt zweidimensionale Häufigkeitsverteilung
Tabellarische Darstellung:
in Häufigkeitstabelle
Bsp.:
Von 70 Studies wurden Mathe und Englischnoten erfasst! (Mathe; Englisch) ➔ (4; 3);(5;1)
Ordnen! ➔ lexikografische Ordnung
(1;2);(1;4)
(2;1);(2;2)... oder Häufigkeitstabelle
Abbildung in dieser Leseprobe nicht enthalten
Grafische Darstellung:
- 3 dimensionale Darstellung mit Säulen
- Streudiagramm
Randverteilung:
Gegeben sei die 2 – dimensionale Häufigkeitsverteilung der Merkmale X und Y. Die zugehörige 1 – dimensionale Verteilung des Merkmals X (bzw. Y), bei der das Auftreten des Merkmals Y(bzw. X) unberücksichtigt bleibt, heißt Randverteilung von X (bzw. Y).
Abbildung in dieser Leseprobe nicht enthalten
Bsp.:
Abbildung in dieser Leseprobe nicht enthalten
Bedingte Verteilung:
Definition:
Gegeben sei die 2 – dimensionale Häufigkeitsverteilung der Merkmale X und Y. Die Häufigkeitsverteilung des Merkmales X (bzw. Y) , die sich für eine gegebene Ausprägung yk (bzw. xj) ergibt, heißt bedingte Verteilung von X (bzw. Y) für gegebenes yk (bzw. xj). Die Häufigkeiten der bedingten Verteilungen bezeichnet man mit h(xj/Y=yk) oder kurz h(xj/yk) und entsprechend f(xj/yk).
am Bsp.:
Abbildung in dieser Leseprobe nicht enthalten
=h(x1/y2)* = 3
*d.h. y1 und y3 können nicht mehr eintreten ➔ y2 ist gegeben ➔ x1 kann also nur 3 sein!
h(y3/x1)=4
Die absoluten bedingten Häufigkeiten können sofort aus der Tabelle abgelesen werden!
relative bedingte Häufigkeit:
f(x1/y2)= 3/5 =0,6
Abbildung in dieser Leseprobe nicht enthalten
f(y3/x1)=4/9=
Abbildung in dieser Leseprobe nicht enthalten
bedingte relative Häufigkeiten:
Abbildung in dieser Leseprobe nicht enthalten
Abhängige Merkmale:
(Abhängigkeit und Unabhängigkeit muss geklärt werden!)
Abhängigkeit:
Abbildung in dieser Leseprobe nicht enthalten
Wenn es für die Verteilung des Merkmales y nicht darauf ankommt wie groß x ist, dann besteht Unabhängigkeit. Wenn x und y unabhängig wären, dann dürfte es für die Verteilung von y nicht darauf ankommen was x ist. Die Verteilung von y müsste gleich sein. Das ist nicht der Fall ➔ x und y sind abhängig von einander.
Abbildung in dieser Leseprobe nicht enthalten
y unabhängig: relative Häufigkeit x ist für jede Ausprägung von y gleich ➔ dies ist hier nicht der Fall ➔ x und sind abhängig von einander!
Bei einem Nachweis der Unabhängigkeiten ist es egal, ob man dies an Zeilen oder Spalten zeigt.
Unabhängigkeit:
Abbildung in dieser Leseprobe nicht enthalten
Frage: Ist x abhängig von y?
Abbildung in dieser Leseprobe nicht enthalten
Es kommt für y – Verteilung nicht darauf an, welche Ausprägungen x annimmt, da relative Zeilenhäufigkeit entspricht immer dem x. (für jedes x ist y immer gleich)
Abbildung in dieser Leseprobe nicht enthalten
➔ x und y sind von einander unabhängig!
Abbildung in dieser Leseprobe nicht enthalten
Eine relative bedingte Häufigkeit in einer Zelle = relative Randhäufigkeit
Abbildung in dieser Leseprobe nicht enthalten
Gilt nur wenn x und y unabhängig sind!
Beispiel: (Einzelne Häufigkeiten sind nicht gegeben!)
Abbildung in dieser Leseprobe nicht enthalten
(10*12)/60=2
(10*30)/60=5
A.2 Regressionsanalyse
Abbildung in dieser Leseprobe nicht enthalten
Das Finden der best passendsten Gerade heißt Regression!
Regression von y auf x, nur dann, wenn x unabhängige und y abhängige Variable ist.
Man versucht durch das Finden der Geraden eine Prognose für weiter rechts liegende x zu stellen:
Voraussetzungen:
1) Es handelt sich um eine 2 – dimensionale Verteilung (x, y)
2) X und Y haben ein bestimmtes Skalenniveau (metrisch skalierte Daten)
3) bereits entdeckter linearer Zusammenhang zwischen X und Y
A.2.1 Die Mathematik einer Geraden
Abbildung in dieser Leseprobe nicht enthalten
- 2 Punkte bestimmen eine Gerade vollständig oder
- ein Schnittpunkt mit der y – Achse (A) und die Steigung der Gerade b (b = tan Abbildung in dieser Leseprobe nicht enthalten)
y = a + bx
Frage: Wie kann ich aus der Menge der Punkte die Parameter a und b berechnen?
Abbildung in dieser Leseprobe nicht enthalten
Welche Gerade ist die bestpassendste?
Es muss ein Kriterium entwickelt werden, welches diese beste Anpassung beschreibt!
A.2.2 Gauß 1777 – 1855 „Methode der kleinsten Quadrate“
Abbildung in dieser Leseprobe nicht enthalten
- Bestimmung der Differenz der tatsächlichen Punkte zu der Geraden (auf diese Art- und Weise würden unendlich viele Graden entstehen)
- man bildet von der Differenz die Quadrate
- die Summe der Quadrate soll minimal sein
- es entsteht auf diese Art- und Weise genau eine Gerade
Die oben im Chart rot markierten Linien stellen die Fehler der Regressionsgeraden dar
= Residuum = e
Abbildung in dieser Leseprobe nicht enthalten
e bezeichnet den Fehler, den man macht, wenn man mit der Regressionsgeraden arbeitet!
Methode der kleinsten Quadrate
Die Summe der Residualquadrate soll minimal sein!
Abbildung in dieser Leseprobe nicht enthalten
[...]
-
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X.