Der Χ2- Test hat mehrere Ansätze und Verwendungsmöglichkeiten. Auf einige dieser Möglichkeiten und die ihm zugrundeliegenden Voraussetzungen möchte ich im folgenden näher eingehen.
Χ2- Techniken gehören von der Durchführung her zu den einfachsten Verfahren der Elementarstatistik, wenngleich der mathematische Hintergrund dieser Verfahren komplex ist. Mit Hilfe der Χ2- Verfahren werden die Wahrscheinlichkeiten multinominalverteilter Ereignisse geschätzt, wobei die Schätzungen erst bei unendlich großen Stichproben mit den exakten Wahrscheinlichkeiten der Multinominalverteilung übereinstimmen. Man sollte deshalb beachten, dass für die Durchführung eines Χ2- Tests die folgenden Voraussetzungen erfüllt sind.
- Die einzelnen Beobachtungen müssen voneinander unabhängig sein.
- Die Merkmalskategorien müssen so geartet sein, dass jede Beobachtungseinheit eindeutig einer Merkmalskategorie oder einer Kombination von Merkmalskategorien zugeordnet werden kann.
- Bezüglich der Größe der erwarteten Häufigkeiten erweisen sich die Χ2- Techniken als relativ robust.
Dessen ungeachtet ist- zumal bei asymmetrischen Randverteilungen- darauf zu achten, dass der Anteil der erwarteten Häufigkeiten, die kleiner als 5 sind, 20 % nicht überschreitet.
Alle Χ2- Methoden laufen also auf einen Vergleich von beobachteten und erwarteten Häufigkeiten hinaus, wobei die erwarteten Häufigkeiten die jeweils geprüfte Nullhypothese repräsentieren.
Dem Test zugrunde liegt die Χ2- Verteilung welche sich ergibt, wenn man Zufallswerte aus einer z- Verteilung quadriert. Addiert man nun diese m voneinander unabhängigen z- Werte, so erhält man eine Χ2- Verteilung mit m Freiheitsgraden(df:= degrees of freedom). Form und Lage der Verteilung hängen dabei ausschließlich von der Zahl der Freiheitsgrade ab.
Mit größer werdender Zahl der Freiheitsgrade nähert sich die Χ2- Verteilung immer mehr einer Normalverteilung.
Der Chi-Quadrat-Test
Tanja Muenzebrock
Der Χ2 - Test hat mehrere Ansätze und Verwendungsmögpchkeiten. Auf einige dieser Mögpchkeiten und die ihm zugrundepegenden Voraussetzungen möchte ich im folgenden näher eingehen.
Χ2 - Techniken gehören von der Durchführung her zu den einfachsten Verfahren der Elementarstatistik, wenngleich der mathematische Hintergrund dieser Verfahren komplex ist. Mit Hilfe der Χ2 - Verfahren werden die Wahrscheinpchkeiten multinominalverteilter Ereignisse geschätzt, wobei die Schätzungen erst bei unendpch großen Stichproben mit den exakten Wahrscheinpchkeiten der Multinominalverteilung übereinstimmen. Man sollte deshalb beachten, dass für die Durchführung eines Χ2 - Tests die folgenden Voraussetzungen erfüllt sind.
1. Die einzelnen Beobachtungen müssen voneinander unabhängig sein.
2. Die Merkmalskategorien müssen so geartet sein, dass jede Beobachtungseinheit eindeutig einer Merkmalskategorie oder einer Kombination von Merkmalskategorien zugeordnet werden kann.
3. Bezügpch der Größe der erwarteten Häufigkeiten erweisen sich die Χ2 - Techniken als relativ robust.
Dessen ungeachtet ist- zumal bei asymmetrischen Randverteilungen- darauf zu achten, dass der Anteil der erwarteten Häufigkeiten, die kleiner als 5 sind, 20 % nicht überschreitet.
Alle Χ2 - Methoden laufen also auf einen Vergleich von beobachteten und erwarteten Häufigkeiten hinaus, wobei die erwarteten Häufigkeiten die jeweils geprüfte Nullhypothese repräsentieren.
Dem Test zugrunde pegt die Χ2 - Verteilung welche sich ergibt, wenn man Zufallswerte aus einer z- Verteilung quadriert. Addiert man nun diese m voneinander unabhängigen z- Werte, so erhält man eine Χ2 - Verteilung mit m Freiheitsgraden(df:= degrees of freedom). Form und Lage der Verteilung hängen dabei ausschpeßpch von der Zahl der Freiheitsgrade ab.
Mit größer werdender Zahl der Freiheitsgrade nähert sich die Χ2 - Verteilung immer mehr einer Normalverteilung.
Die Werte für diese Verteilung lassen sich mit folgender Formel berechnen.
Abbildung in dieser Leseprobe nicht enthalten
wobei :
i := Anzahl der Zeilen
j := Anzahl der Spalten
und :
Bij := beobachtete absolute Häufigkeit in Zelle i, j
Eij := erwartete Anzahl der Häufigkeiten in Zelle i, j
Um nun die erforderpchen Freiheitsgrade zu bestimmen, müssen wir auch hier
überprüfen, wie viele Summanden in
Abbildung in dieser Leseprobe nicht enthalten
unabhängig voneinander variieren können. Dies ist offensichtpch nur ein Summand, denn der zweite ist eindeutig festgelegt.
Man kann also eine allgemeine Regel zur Bestimmung der Freiheitsgrade formuperen die besagt, dass die Freiheitsgrade eines Χ2 - Wertes der Anzahl der Summanden gemäß [Abbildung in dieser Leseprobe nicht enthalten] entsprechen, abzügpch der Bestimmungsstücke für
die Berechnung der erwarteten Häufigkeiten, die aus den beobachteten Häufigkeiten abgeleitet wurden.
Die Formel zur Berechnung der Freiheitsgrade ist folgende :
df = (i-1)*(j-1).
In einer empirischen Kreuztabelle, zum Beispiel, die aufgrund einer Stichprobe berechnet wird, kann also genau eine Zeile „frei“(=zufälpg) variieren. Die Besetzung der anderen Zellen pegt jedoch fest, da die Randsummen und die Gesamtsumme gleich bleiben.
Hat man diese Werte nun alle bestimmt, muss man nun auch das Signifikanzniveau festlegen. Dieser Wert ist zu verstehen als die Wahrscheinpchkeit, die man für die Fehlentscheidung zulassen will, dass die zuvor aufgestellte Nullhypothese zu Unrecht abgelehnt wird. Hierbei bezeichnet man das Signifikanzniveau mit dem griechischen Buchstaben α.
Je kleiner man α wählt, desto unwahrscheinpcher wird zwar diese Fehlentscheidung, desto geringer wird jedoch auch die Chance, bei falscher Nullhypothese zu einer Ablehnung derselben zu kommen. Gebräuchpch sind für α vor allem Werte wie 0,1; 0,05 oder 0,01, um ein hochsignifikantes Ergebnis zu erhalten.
Bevor ich nun auf die einzelnen Anwendungsgebiete des Χ2 - Tests eingehe, möchte ich den allgemeinen Ablauf eines solchen Tests einmal kurz darstellen.
Hierbei wird die Hypothese getestet, ob eine Zufallsvariable X eine bestimmte Verteilungsfunktion f(x) besitzt.
[...]
- Citation du texte
- Tanja Muenzebrock (Auteur), 2001, Der Chi-Quadrat-Test, Munich, GRIN Verlag, https://www.grin.com/document/3492