Heterogenität in IRT-Modellen


Ludwig-Maximilians-Universität München

Fakultät für Mathematik, Informatik und Statistik

Institut für Informatik

Ludwigstr. 33

80539 München

Projektleiterin: Dr. Carolin Strobl

Promovierende: Julia Kopf

Förderkennzeichen: 01JG1060

Förderbetrag: 101.070 EUR

Laufzeit: 01.02.2011 - 31.01.2014


In der empirischen Bildungsforschung spielt die Messung latenter, d.h. nicht beobachtbarer, Merkmale eine bedeutsame Rolle. Die Item Response Theorie (IRT) umfasst eine Vielzahl von parametrischen Modellen zur Skalierung dieser latenten Personen-Eigenschaften wie das bekannte Rasch-Modell, das objektive Messungen gewährleistet und dadurch auch faire Vergleiche zwischen Personen-Gruppen erlaubt. Eine zentrale Annahme des Rasch-Modells, die im Fokus des Forschungsvorhabens steht, ist die Invarianz-Annahme. Diese Annahme ist verletzt, wenn Aufgaben-Unterschiede bestehen, z.B. wenn eine Aufgabe bei gleicher Fähigkeit für eine Gruppe einfacher zu lösen ist. Betrachtet man einen Test zur mathematischen Kompetenz, könnte eine Textaufgabe für Schüler mit Deutsch als Fremdsprache schwieriger zu lösen sein als für Schüler mit Deutsch als Muttersprache, obwohl beide dieselbe mathematische Kompetenz haben. Eine solche Aufgabe zeigt Differential Item Functioning (DIF). Das Ziel dieses Forschungsprojektes ist es, ein neues methodisches Instrumentarium zu entwickeln, das die statistische Überprüfung von Gruppen-Unterschieden in komplexen Studien zur Kompetenzdiagnostik im Rahmen der IRT erlaubt. Dabei werden statistische Tests zur Signifikanzprüfung einzelner Aufgaben-Unterschiede weiterentwickelt und Erweiterungen aktueller Verfahren umgesetzt. Mithilfe einer umfangreichen Simulationsstudie werden verschiedene etablierte und selbst entwickelte, iterative Ankerverfahren in der Software R implementiert und in verschiedensten Situationen gegenübergestellt. Die bislang erzielten Ergebnisse zeigen, dass das neue iterative Ankerverfahren mit einer Forward-Ankerselektion die besten Ergebnisse liefert, da es weniger Aufgaben fälschlicherweise DIF unterstellt und gleichzeitig tatsächliche Aufgaben-Unterschiede auch häufiger erkennt. Die neuen Verfahren sollen in der frei zugänglichen statistischen Programmierumgebung R implementiert werden, um eine breite Nutzung der Methodik in der empirischen Bildungsforschung zu ermöglichen.

Weitere Informationen unter:
 http://www.mathematik-informatik-statistik.uni-muenchen.de/index.html