Man hört es immer wieder: Die Schüler von heute lernen nichts mehr, was sie auch nach dem Schulabschluss, im „wahren Leben“, gebrauchen können. Dafür müssen der Unterricht und seine Ziele besonders in den Blickpunkt der Betrachtung rücken. In den letzten Jahren gab es eher die Tendenz sich ausschließlich dem Unterrichtsstoff an sich zu widmen ohne wirklich zu überprüfen, was die Schüler am Ende eine Unterrichtseinheit auch wirklich beherrschen. Um das zu überprüfen, werden im Unterricht Tests und Klausuren geschrieben. Auffallend ist allerdings, dass diese Tests oftmals nicht das überprüfen, was im Unterricht besonderen Raum eingenommen hatte. Sie sind nicht kontentvalide.
Die Lernziel- und Leistungskontrolle gehört zu den wichtigsten Bestandteilen des Unterrichts. Allerdings wird diesem Bereich seit Jahren viel zu wenig Beachtung geschenkt. Die Folge sind eben diese Tests, die weder kontentvalide noch reliabel oder objektiv sind. Umso wichtiger ist es sich intensiver mit dem Begriff der „Kontentvalidität“ zu beschäftigen.
Diese Arbeit beschäftigt sich mit dem Thema Kontentvalidität sowie dem richtigen Konzipieren von Tests und Prüfungen. Welche Gütekriterien sind von Bedeutung und wie kann man diese konkret in die Ausarbeitung von Leistungskontrollen einfließen lassen? Diese Fragen sollen im Folgenden beantwortet werden. Zunächst werden einige grundsätzliche Begriffe und Gütekriterien beschrieben werden, bevor direkt auf die Kontentvalidität eingegangen wird.
Inhaltsverzeichnis
1 EINLEITUNG
2 VORBEMERKUNGEN
2.1 WAS SIND TESTS?
2.2 KLASSISCHE GÜTEKRITERIEN EINES TESTS
3 KONTENTVALIDITÄT
3.1 BEGRIFFSBESTIMMUNG
3.2 PARALLELE KONTENTVALIDITÄT
4 TESTKONSTRUKTION
4.1 LATENTE VARIABLEN
4.2 AUFGABENMENGE UND DEREN DEFINITIONSMÖGLICHKEITEN
4.3 STIMULUSKOMPONENTE
4.4 RESPONSEKOMPONENTE
5 DAS KONZIPIEREN VON PRÜFUNGEN
5.1 AUSWAHL DER PRÜFUNGSINHALTE
5.2 AUSWAHL DER PRÜFUNGSFORM
5.2.1 MÜNDLICHE LEISTUNGEN
5.2.2 SCHRIFTLICHE LEISTUNGEN
5.2.3 PRAKTISCHE LEISTUNGSBEWERTUNG
5.3 AUSWAHL DER AUFGABENFORM
5.3.1 OFFENE FRAGEN
5.3.2 HALOFFENE FRAGEN
5.3.3 GESCHLOSSENE AUFGABEN
5.4 FESTSETZEN DES ANFORDERUNGSNIVEAUS
5.5 AUFGABEN- UND PRÜFUNGSUMFANG
5.6 FORMULIERUNG UND REIHENFOLGE DER AUFGABEN
5.7 PLANUNG DER PRÜFUNGSSITUATION
5.8 AUSARBEITUNG EINER MUSTERLÖSUNG
6 ANWENDUNG
6.1 LEISTUNGSKONTROLLE
6.2 VERBESSERTE LESITUNGSKONTROLLE
6.3 AUSWERTUNG
LITERATUR- UND QUELLENVERZEICHNIS
1 Einleitung
Man hört es immer wieder: Die Schüler von heute lernen nichts mehr, was sie auch nach dem Schulabschluss, im „wahren Leben“, gebrauchen können. Dafür müssen der Unterricht und seine Ziele besonders in den Blickpunkt der Betrachtung rücken. In den letzten Jahren gab es eher die Tendenz sich ausschließlich dem Unterrichtsstoff an sich zu widmen ohne wirklich zu überprüfen, was die Schüler am Ende eine Unterrichtseinheit auch wirklich beherrschen. Um das zu überprüfen, werden im Unterricht Tests und Klausuren geschrieben. Auffallend ist allerdings, dass diese Tests oftmals nicht das überprüfen, was im Unterricht besonderen Raum eingenommen hatte. Sie sind nicht kontentvalide.
Die Lernziel- und Leistungskontrolle gehört zu den wichtigsten Bestandteilen des Unterrichts. Allerdings wird diesem Bereich seit Jahren viel zu wenig Beachtung geschenkt. Die Folge sind eben diese Tests, die weder kontentvalide noch reliabel oder objektiv sind. Umso wichtiger ist es sich intensiver mit dem Begriff der „Kontentvalidität“ zu beschäftigen.
Diese Arbeit beschäftigt sich mit dem Thema Kontentvalidität sowie dem richtigen Konzipieren von Tests und Prüfungen. Welche Gütekriterien sind von Bedeutung und wie kann man diese konkret in die Ausarbeitung von Leistungskontrollen einfließen lassen? Diese Fragen sollen im Folgenden beantwortet werden. Zunächst werden einige grundsätzliche Begriffe und Gütekriterien beschrieben werden, bevor direkt auf die Kontentvalidität eingegangen wird.
2 Vorbemerkungen
2.1 Was sind Tests?
Lienert beschreibt einen Test als ein „ wissenschaftliches Routineverfahren zur Untersuchung eines oder mehrerer empirisch abgrenzbarer Pers ö nlichkeitsmerkmale mit dem Ziel einer m ö glichst quantitativen Aussage ü ber den relativen Grad der individiuellen Merkmalsausbildung. “ (Lienert, S. 7) Tests müssen dabei den bekannten Gütekriterien genügen. Genauso wichtig ist es, dass bestimmte Testauswirkungen und Maßnahmen wiederkehren müssen, wie beispielsweise eine festgelegte Aufgabenstellung. Tests sollen zudem die Aufgabe haben, die Position der Leistung des untersuchten Schüler innerhalb der beobachteten Gruppe zu positionieren. Denn ein Test soll und will nur solche Merkmale erfassen, die auch beobachtbar und vor allem objektiv beschreibbar sind. Aus diesem Grund sollen möglichst quantitative Aussagen und Untersuchungen eines oder mehrerer Persönlichkeitsmerkmale erfolgen. (Vgl. Lukesch, S. 132f.)
2.2 Klassische Gütekriterien eines Tests
In der klassischen Testtheorie wird untersucht, welche Kriterien für die Bewertung der Qualität einer Leistungsmessung herangezogen werden müssen und wie diese Charakteristika ermittelt werden können. Die Qualität eines Tests wird somit durch die drei zentralen Gütekriterien bestimmt: die Objektivität, die Reliabilität sowie die Validität.
Die Objektivität einer Leistungsmessung, also eines Tests, ist dann gegeben, wenn das zu messende Ergebnis nur vom zu messenden Merkmal und eben nicht von der Person, deren Leistung gemessen wird, abhängt. Die Messungen sollen also unabhängig sein von den individuellen Merkmalen der Person wie Geschlecht, Einstellung, Weltanschauung, Studienort usw. Der wichtigste Baustein der Objektivität ist also die Messungsunabhängigkeit von der Person. Bedeutend ist außerdem die intersubjektive Übereinstimmung, also das mehrere voneinander unabhängige Beobachter zum gleichen Ergebnis kommen. Bei allen Phasen eines Tests, also bei der Durchführung, der Auswertung und der Interpretation, sollte die Objektivität gegeben sein.
Die Reliabilität beschreibt die Genauigkeit bzw. die Zuverlässigkeit einer Leistungsmessung. Sie beschreibt wie genau die Leistung gemessen wird. Die Reliabilität und die Objektivität hängen sehr eng zusammen, denn je objektiver die Verhaltensmerkmale erfasst werden, desto höher ist auch die Genauigkeit der Messung. Bei der Reliabilität steht also die Unabhängigkeit von den Untersuchungsbedingungen im Mittelpunkt. Dabei kann man zwei unterschiedliche Arten der Reliabilität unterscheiden: Es gibt die Wiederholungsreliabilität (Retest-Reliabilität), also die Unabhängigkeit vom Zeitpunkt der Untersuchung. Des Weiteren existiert die Paralleltestreliabilität, also die Unabhängigkeit von der verwendeten Testform. Die Validität eines Tests bezeichnet die empirische Prüfung der Gültigkeit von theoretischen Überlegungen. Die Validität gilt als das bedeutendste Gütekriterium einer Messung. Sie zeigt, ob und wie ein Test genau das misst, was er messen soll. Ebenso muss geprüft werden, ob durch die Messung auch das richtige Merkmal und nicht ein anderes gemessen wird. Die Bestimmung der Validität ist oftmals problematisch, weil sich die Messung meist auf ein nicht direkt beobachtbares Konstrukt, wie beispielsweise Intelligenz oder Prüfungsangst, abzielt und somit die unmittelbare Prüfung der Validität nicht möglich ist. Um die Validität annähernd bestimmen zu können, wurde eine Reihe von Verfahrensweisen entwickelt, u.a. die Kontentvalidität, die im Folgenden beschrieben werden soll.
3 Kontentvalidität
3.1 Begriffserklärung
Die Kontentvalidität oder auch Inhaltsvalidität ist dann gegeben, wenn der Inhalt der TestItems das zu messende Konstrukt in seinen wichtigsten Aspekten erschöpfend erfasst. Diese Methode beruht auf einer inhaltlichen Analyse des Messverfahrens, um festzustellen, ob der Itempool eines Tests den zu messenden Merkmalsbereich, wie beispielsweise den Wissensstand in einem bestimmten Stoffgebiet, auch tatsächlich hinreichend genau repräsentiert.
Die Kontentvalidität ist umso höher, je besser die Test-Items die Grundgesamtheit der Items repräsentieren. Sie findet Anwendung bei Schulleistungstests und schriftlichen Klassenarbeiten. Dabei versucht der Lehrer für diese schriftlichen Tests solche Aufgaben zusammenzustellen, aus deren richtiger Beantwortung er auf den spezifischen Lernerfolg bei jedem Schüler schließen kann.
Allerdings ist die angemessene Beschreibung des inhaltlichen Gültigkeitsbereichs sehr viel schwieriger. Denn ob die Aufgaben eines Wissens- oder Fähigkeitstests repräsentativ für ein ganzes Stoffgebiet sind, kann nur dann sinnvoll überprüft werden, wenn die Gesamtheit aller prinzipiell möglichen Fragen aus diesem Lerngebiet definierbar ist. Ein Test zur Erfassung der Kenntnisse in den Grundrechenarten ist beispielsweise wenig inhaltsvalide, wenn er keine Aufgaben zur Multiplikation enthält. Für einfache Wissensgebiete, wie Rechtschreibung oder Multiplikation. Komplizierter wird das bei umfangreicheren, komplexeren Wissensgebieten, wie Integralrechnung oder Stochastik im Fach Mathematik oder die Entstehung der Weimarer Republik im Fach Geschichte. Denn hier sind nun Indikatoren zu finden, die nur in Annäherung an das gesamte Wissensgebiet repräsentativ sind. Am Beispiel der Entstehung der Weimarer Republik kann das sehr gut gezeigt werden. Zu den Inhalten dieser Stoffeinheit zählen beispielsweise die Unruhen nach Kriegsende, die Entscheidung zwischen Demokratie oder dem Rätemodell und die ersten Wahlen und deren Auswirkungen. Bei der Fülle an Aspekten können für eine Klausur zur Überprüfung der Kenntnisse nur Indikatoren gefunden werden, die dieses Themengebiet relativ gut repräsentieren. Dabei können auch nicht alle einzelnen Themenkomplexe abgefragt werden, weil dafür meist die Zeit gar nicht ausreicht. In der Schule muss sich der Lehrer also sicher sein, dass er in einer Leistungskontrolle im Fach Geschichte auch wirklich Geschichtskenntnisse und -fertigkeiten abfragt und misst. Es muss dabei immer wieder geprüft werden, ob das Gebiet, das im Test erfasst ist, das Gebiet, was unterrichtet wurde, repräsentiert. Repräsentiert werden können der gesamte Stoff oder auch nur ein Teilbereich.
Außerdem muss geprüft werden, ob der test eine Stichprobe geeigneter Items und auch genügend unterschiedliche Itemtypen enthält, so dass verschiedene Arten von Kenntnissen und Fertigkeiten in diesem Gebiet angemessen vertreten sind. Eine Geschichtsleistungskontrolle ist demnach wenig inhaltsvalide, wenn darin Fragen gestellt werden, die der Schüler auch aufgrund der täglichen Zeitungslektüre oder aus dem Allgemeinwissen beantworten kann.
Die Items eines schulfachbezogenen Tests sollten also immer sehr eng verbunden sein mit dem Unterrichtsbereich, den die Schüler im Unterricht behandelt haben. Wenn ein Test z.B. eine bestimmte Einheit des Curriculums in einer bestimmten Klassenstufe erfasst, dann hat dieser Test eine Kontentvalidität. Allerdings müssen die repräsentativen Inhaltsitems des Tests in dem Ausmaß ändern, in dem sich das Curriculum oder ein bestimmter Stoffbereich verändert, wenn der Test valide bleiben soll. Ein Test wird dann nämlich nicht valide sein, wenn sein Inhalt dem vordefinierten Inhaltsbereich nicht entspricht.
3.2 Parallele Kontentvalidität
Die parallele Kontentvalidität bezeichnet den für die ergebnisorientierte und überprüfbare Lehrstoffvermittlung bedeutenden Zusammenhang von Lehrstoff, Unterricht und Lernerfolg. Es wird dabei also gefragt, inwiefern der Unterricht und die Lernerfolgskontrolle den betreffenden Lehrstoff ausreichend repräsentieren. Deshalb sollte eine Übereinstimmung zwischen Aneignungs- und Überprüfungsphase angestrebt werden. Eben diese Herstellung oder Überprüfung der Übereinstimmung ist das zentrale Problem der Kontentvalidität. Wenn man den Lehrstoff also sowohl im Unterricht als auch bei de Lernerfolgskontrolle hinreichend berücksichtigt, so spricht man von „paralleler Kontentvalidität“.
[...]
- Quote paper
- Elisa Mätzig (Author), Kirstin Weber (Author), 2008, Kontentvalidität, Munich, GRIN Verlag, https://www.grin.com/document/139017
-
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X.