In der Klassischen Testtheorie beinhaltet der Itemschwierigkeitsindex die Schwierigkeit des Items und die Fähigkeit der zu testenden Person, wohingegen in den so genannten modernen Latet- Trait- Modellen davon ausgegangen wird, dass es latente Dimensionen gibt, die sich in den zu messenden Merkmalen manifestieren. Einen ersten Schritt in diese Richtung stellt die Gutmann- Skala dar, die jedoch streng deterministisch ist, da die Items so geordnet werden, dass ein Proband, der ein Item zu lösen vermag, auch alle leichteren Items lösen können müsste. Erst wenn er versagt, wird davon ausgegangen, dass die Schwierigkeit des Items an dieser Stelle seine Fähigkeit in Bezug auf die zu messende Dimension unterschreitet und der Schwellwert gefunden worden ist, ab dem er bei allen folgenden schweren Items versagen müsste. Natürlich kann sich diese Art der Skalierung auch auf Einstellungen oder andere latente Variablen beziehen, die sich in einer aufsteigenden Reihenfolge präsentieren lassen. Der Vorteil dieser Methode liegt in der Stichprobenunabhängigkeit, sein Nachteil in der schwierigen empirischen Realität, die das geforderte Antwortmuster selten bestätigt. Wenn es funktionieren würde, hätte man mit dem Rohwert einer Versuchsperson auch die genaue Kenntnis seines Lösungsmusters, wohingegen bei der Klassischen Testtheorie schon bei einem kurzen Test mit sieben Items, Sieben Fakultät, also 5040 verschiedene Permutationen denkbar wären. Wenn eine Person im gesamten Test einen höheren Rohwert hat als eine andere, kann sie auch bei einer Teilmenge der Items, keinen geringeren erreichen. Dem theoretisch zwar stärkeren, weil deterministischeren Gutman- Modell wurde mit der Rasch- Skalierung ein „weicheres“ aber praktisch brauchbareres gegenüber gestellt. Das Rasch- Modell ist weniger deterministisch, da Verletzungen des Gutman- Kriteriums durch stochastische Überlegungen in einem bestimmten Rahmen und unter gewissen Bedingungen vertretbar gemacht werden, wodurch es in der Praxis anwendbarer ist. Während in der Klassischen Testtheorie einfach davon ausgegangen wird, dass der Rohwert in einem Test die Ausprägung der zu erfassenden Eigenschaft hinreichend abbildet, wenn man den Messfehler weitgehend im Griff hat, wird im Rasch- Modell behauptet, dass sich die Fähigkeit der Person und der Aufgabenparameter stochastisch aus dem Testwert extrahieren lässt.
Inhaltsverzeichnis
0. Einleitung
1. Latent- Trait- Modelle
1.1 Die Item Charakteristik Kurve (ICC)
2. Die Raschskala
2.1 Die Modellannahmen des Raschmodells
2.1.1. Eindimensionalität
2.1.2 Lokale statistische Unabhängigkeit
2.2 In fünf Rechenschritten zur Raschskala
2.2.1 Die Schwierigkeitsmatrix
2.2.2 Umwandlung in eine Logit- Matrix
2.2.3 Annäherung an die Personen- und Itemparameter
2.2.4 Rechnerische Reproduktion der Schwierigkeitsindizes aus den Item- und Personenparametern
2.2.5 Standardisierungen der bestätigten Parameter
3. Kritische Zusammenfassung
Zielsetzung & Themen
Das Hauptziel dieser Arbeit ist es, die theoretischen Grundlagen der probabilistischen Testtheorie, insbesondere das Raschmodell, darzustellen und das methodische Vorgehen bei dessen Anwendung in der psychologischen Diagnostik zu erläutern. Die Forschungsfrage fokussiert dabei auf die Überwindung der Mängel der klassischen Testtheorie sowie die statistische Validierbarkeit von Item- und Personenparametern.
- Grundlagen der Latent-Trait-Modelle
- Konzept der Item-Charakteristik-Kurve (ICC)
- Mathematische Modellannahmen des Raschmodells
- Schritt-für-Schritt-Verfahren zur Raschskalierung
- Kritische Reflexion der Anwendungsmöglichkeiten in der Praxis
Auszug aus dem Buch
1.1 Die Item Charakteristik Kurve (ICC)
Die Technik der Itemanalyse in den probabilistischen Modellen basiert auf der Latent trait Theorie von Birnbaum aus den sechziger Jahren und ist besser bekannt als Item Response Theorie (IRT). Diese wählt die Items auf einem in Bezug auf die Klassische Testtheorie alternativen Weg aus. Sie ist weitaus präziser als das klassische Modell und hat das Potential, präzisere und empfindlichere Items zu kreieren bzw. zu seligieren.
Die IRT basiert auf dem Konzept der Item Charakteristik Kurve (ICC), welche für jedes Item eine Wahrscheinlichkeit für die richtige Beantwortung im Verhältnis zu der latenten Fähigkeit des Probanden angibt.
Eine Item- Charakteristk- Kurve hat im Idealfall die ungefähre Form einer normalen Ogive, welche eine kumulierte Normalverteilung ist. Da eine Ogive, wie gesagt, eine andere Form der Normalverteilung darstellt, ist davon auszugehen, dass die Effekte der zufälligen Fehlerverteilung in den gemachten Messungen darin enthalten sind, wie in allen anderen Modellen der subtraktiven Messung auch, die neben dem wahren Wert, den true score, die Existens eines randomisierten Messfehlers annehmen.
Zusammenfassung der Kapitel
0. Einleitung: Beschreibt die Mängel der klassischen Testtheorie und führt in die moderne, probabilistische Perspektive der psychologischen Diagnostik ein.
1. Latent- Trait- Modelle: Erläutert die theoretische Abkehr vom deterministischen Modell hin zu wahrscheinlichkeitstheoretischen Ansätzen.
1.1 Die Item Charakteristik Kurve (ICC): Führt das IRT-Konzept ein, das die Lösungswahrscheinlichkeit eines Items in Abhängigkeit von der latenten Fähigkeit des Probanden darstellt.
2. Die Raschskala: Definiert das von Georg Rasch entwickelte Modell, das auf der logistischen Funktion basiert und ursprünglich für Leistungstests konzipiert wurde.
2.1 Die Modellannahmen des Raschmodells: Detailliert die Voraussetzungen wie Eindimensionalität und lokale stochastische Unabhängigkeit.
2.2 In fünf Rechenschritten zur Raschskala: Bietet eine methodische Anleitung zur praktischen Durchführung einer Raschskalierung.
2.2.1 Die Schwierigkeitsmatrix: Beschreibt die Konstruktion der Datengrundlage aus Lösungshäufigkeiten von Probandengruppen.
2.2.2 Umwandlung in eine Logit- Matrix: Erläutert die mathematische Transformation zur Berechnung der Logits als Differenz von Item- und Personenparametern.
2.2.3 Annäherung an die Personen- und Itemparameter: Beschreibt den iterativen Prozess der Parameterschätzung.
2.2.4 Rechnerische Reproduktion der Schwierigkeitsindizes aus den Item- und Personenparametern: Zeigt, wie durch Rückrechnung die Validität des Modells mittels X²-Test geprüft wird.
2.2.5 Standardisierungen der bestätigten Parameter: Erklärt, wie Parameter transformiert werden, um ihre Vergleichbarkeit zu gewährleisten.
3. Kritische Zusammenfassung: Reflektiert den hohen Rechenaufwand sowie die theoretischen Herausforderungen bei der Anwendung des Raschmodells.
Schlüsselwörter
Raschmodell, Probabilistische Testtheorie, Item Response Theorie, IRT, Latente Trait Modelle, Item Charakteristik Kurve, ICC, Personenparameter, Itemparameter, Logit, Eindimensionalität, Stochastische Unabhängigkeit, Testkonstruktion, Diagnostik, Skalierung
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit befasst sich mit der probabilistischen Testtheorie, insbesondere dem Raschmodell, und stellt es als Alternative zur klassischen Testtheorie in der psychologischen Diagnostik vor.
Was sind die zentralen Themenfelder der Arbeit?
Die Schwerpunkte liegen auf den mathematischen Modellannahmen, der Herleitung der Item-Charakteristik-Kurve sowie dem fünfstufigen Prozess der praktischen Raschskalierung.
Was ist das primäre Ziel oder die Forschungsfrage?
Das Ziel ist die Erläuterung der theoretischen und methodischen Grundlage des Raschmodells, um zu verstehen, wie Personen- und Itemparameter objektiv und stichprobenunabhängig geschätzt werden können.
Welche wissenschaftliche Methode wird primär verwendet?
Es werden methodische Verfahren der Item-Response-Theorie (IRT) sowie statistische Verfahren wie die logistische Umkehrfunktion und X²-Tests zur Modellprüfung angewandt.
Was wird im Hauptteil der Arbeit behandelt?
Der Hauptteil gliedert sich in die theoretische Einführung in Latent-Trait-Modelle, die Definition des Raschmodells und eine detaillierte schrittweise Beschreibung des Berechnungsverfahrens inklusive der Modellvalidierung.
Welche Schlüsselwörter charakterisieren diese Arbeit am besten?
Die zentralen Begriffe sind Raschmodell, Item-Response-Theorie, ICC, Logit, Eindimensionalität und stochastische Unabhängigkeit.
Wie unterscheidet sich die probabilistische Testtheorie laut Autor von der klassischen Testtheorie?
Im Gegensatz zur klassischen Testtheorie, die auf deterministischen Annahmen beruht, erlaubt die probabilistische Testtheorie eine stichprobenunabhängige Schätzung von Personen- und Aufgabenparametern durch wahrscheinlichkeitstheoretische Funktionen.
Warum betont der Autor die Notwendigkeit von Standardisierungen der Parameter?
Standardisierungen sind notwendig, um eine mathematische Vergleichbarkeit der gewonnenen Parameter zu gewährleisten, was durch die Transformation der Itemparameter auf eine Summe von Null erreicht wird.
- Quote paper
- Heiko Böttcher (Author), 2005, Die Probabilistische Testtheorie und das Raschmodell, Munich, GRIN Verlag, https://www.grin.com/document/55973