Die Realisierung testbasierter Schulreform in der Mehrebenenstruktur des Schulsystems (Verbundvorhaben)


Verbundpartner.

Freie Universität Berlin

Fachbereich Erziehungswissenschaft und Psychologie

Arbeitsbereich Weiterbildung und Bildungsmanagement

Arnimallee 12

14195 Berlin

Verbundkoordinator: Prof. Dr. Harm Kuper

Förderkennzeichen: 01 JG 1002 A

Förderbetrag: 232.077 EUR

Laufzeit: 01.05.2010 - 30.06.2013


Friedrich-Alexander-Universität Erlangen-Nürnberg

Philosophische Fakultät und Fachbereich Theologie

Lehrstuhl für Schulpädagogik

Regensburger Str. 160

90478 Nürnberg

Projektleiter: Prof. Dr. Uwe Maier

Förderkennzeichen: 01 JG 1002 B

Förderbetrag: 225.451 EUR

Laufzeit: 01.05.2010 - 30.06.2013


Internationale empirische Befunde und Rezeptionsstudien zeigten auf, dass die Verwendung und Auswirkung von Ergebnissen zentraler Tests in Abhängigkeit von Professionsmerkmalen der Lehrkräfte, von organisatorischen Eigenschaften einzelner Schulen und von schulsystemspezifischen Merkmalen standen. Der Forschungsstand enthielt eine Vielzahl von Ergebnissen, die die (institutionelle) Kontingenz der Rezeption und Verwendung von Ergebnissen aus zentralen Leistungsüberprüfungen in den Schulen belegten. Eine professions-, organisations- und/oder institutionentheoretische Rahmung empirischer Projekte, die sich mit den Folgen testbasierter Schulreform befassen, erschien daher geboten und aussichtsreich. Eine Fokussierung auf die Auswirkungen schulübergreifender institutioneller Regelstrukturen war insbesondere in der US-amerikanischen Forschung erfolgt. Diese Forschung war deutlich mit den Folgen von „high-stakes testing“ befasst; die Ergebnisse waren daher auf die Konzepte testbasierter Schulreform in den deutschen Ländern nicht übertragbar. Wohl aber waren ihnen theoretische und methodische Anregungen zu entnehmen. Die deutschsprachige Forschung fokussierte bisher stark die Nutzung externer Evaluationsdaten auf Lehrer-, Unterrichts- und Schulebene. Es fehlten allerdings Studien zu Wechselwirkungen zwischen den einzelnen Ebenen innerhalb von Schulen. Ebenso wurde die Bedeutung der Schuladministration bei der schulinternen Nutzung externer Testdaten bisher noch nicht systematisch in den Blick genommen.

Ziel dieser Studie ist eine mehrebenenanalytische Betrachtung zum Verhältnis der Wahrnehmung von Verantwortung im Rahmen der Schulautonomie in Beziehung zur zentralen Administration von Tests, Bildungsstandards, Rückmeldeverfahren und begleitenden Regel- bzw. Unterstützungsstrukturen der Schulaufsicht. In einem kontrastierenden, längsschnittlichen Fallstudiendesign wurden Einzelschulen und die dazugehörigen Schulaufsichtsbezirke als Erhebungs- und Untersuchungseinheiten definiert. Die Stichprobenziehung orientiert sich am theoretischen Sampling; die realisierte Stichprobe umfasst 16 Gymnasien, je vier aus Berlin, Brandenburg, Thüringen und Baden-Württemberg (229 befragte Personen). Mit der Einbeziehung der Schulaufsichtsbezirke wurden systematisch unterscheidbare Regelungskontexte der testbasierten Schulreform in den vier Bundesländern berücksichtigt. Zur Datenerhebung wurden problemzentrierte, leitfadengestützte Interviews zu 2 Messzeitpunkten (jew. 4. Quartal 2010 und 2011) und zusätzlich in der zweiten Erhebungsphase teilnehmende Beobachtungen in Workshops an zwei Berliner Schulen durchgeführt. Die Interviewpartner wurden aus den vier Untersuchungsebenen (Lehrkräfte, Fachbereichsleitungen, Schulleitungen und Schulaufsicht) gewählt, für die jeweils ein spezifischer Interviewleitfaden erarbeitet wurde.

Die transkribierten Daten wurden gemäß der strukturierenden Inhaltsanalyse kategorial ausgewertet. Diese ca. 300 Textseiten umfassende Grundauswertung diente als Referenz für die fallbezogene und die kontrastierende Auswertung, in der länderspezifische Regelungskontexte berücksichtigt wurden. Das Kategoriensystem wurde deduktiv entlang des Interviewleitfadens entwickelt. An ihm erfolgte die Zuordnung der Textstellen aus den Interviewtranskripten zu hierarchisch übergeordneten Oberkategorien; die nachgeordneten Subkategorien waren im Verfahren einer induktiven Kategorienbildung ergänzt worden. Die Güte des Kodierschemas (Interraterreliabilität) wurde über alle Bundesländer hinweg kontrolliert. Die Auswertung zeigte eine große Heterogenität von Reaktionen und Umgangsformen mit den Ergebnissen zentraler Vergleichsarbeiten. Die Relevanz der Lernstandserhebungen ergab sich aus dem ihnen beigemessenen Informationsgehalt und dem erlebten Arbeitsaufwand im Verhältnis zum Ertrag. Lernstandserhebungen werden nicht voraussetzungslos als Instrument der schulinternen Qualitätsentwicklung akzeptiert. Ebenso finden sich Praktiken, in denen die Lernstandserhebungen mehr oder weniger folgenlos in den bürokratischen Routinen von Schulen aufgehen oder zu einem Instrument der Beurteilung individueller Schülerleistungen umfunktioniert werden. Darüber hinaus steht die Nutzung der Lernstandsergebnisse zur systematischen Evaluation des Unterrichts oft in einem Zusammenhang mit einer Bezugnahme auf höhere Aggregationsebenen (Schulklasse, Schule).

Im weiteren Projektverlauf sollten kontrastierende Typenbildungen innerhalb der Länder und kontrastierende Ländervergleiche (Fallanalysen) erstellt werden. Leitend waren dabei die Annahmen, dass Schulen die autonome organisatorische Einheit darstellen, auf der eine koordinierte Nutzung der Vergleichsarbeiten erfolgen kann, und dass die Differenz der Regelungskontexte Differenzen in den schulischen Praktiken erklären kann. Die Befunde des Projektes boten praktische Anschlüsse für Interventionen, beispielsweise in der Lehrer- und Schulleiterfortbildung. Diese sind auch mit Interventionsstudien zu kombinieren. Zusätzlich ließen sich aus der explorativ angelegten Studie Anknüpfungspunkte für repräsentative, hypothesenprüfende Untersuchungen gewinnen.

Weitere Informationen unter:
http://www.ewi-psy.fu-berlin.de/einrichtungen/arbeitsbereiche/weiterbildung_bildungsmanagement/index.html
http://www.spaed.ewf.uni-erlangen.de/