Ermittlung von Indikatoren für die Kompetenzeinschätzung von Schülertexten mittels computerlinguistischer Methoden


Humboldt-Universität zu Berlin

Philosophische Fakultät II

Institut für deutsche Sprache und Linguistik

Unter den Linden 6

10117 Berlin

Projektleiterin: Prof. Dr. Anke Lüdeling

Promovierende: Jasmine Bennöhr

Förderkennzeichen: 01JG0904

Förderbetrag: 107.251 EUR

Laufzeit: 01.11.2009 - 31.10.2012


Als Ausgangsbasis des Projekts "Ermittlung von Indikatoren für die Kompetenzeinschätzung von Schülertexten mittels computerlinguistischer Methoden und dialogische Entwicklung eines Prototyps für die computergestützte Analyse von Aufsätzen" steht eine Vielzahl an Aufsätzen, Testergebnissen und Hintergrundinformationen von Schülern aus der Hamburger Längsschnittuntersuchung KESS zur Verfügung. Aufsatzbewertungen, die durch Lehrer vergeben werden und häufig eine globale Bewertung darstellen oder wenige ausgewählte Aspekte umfassen, wird ein geringer Aussagewert zugeschrieben, da die Testgütekriterien Validität, Reliabilität und Objektivität bei der Bewertung von Textqualität nur bedingt erfüllt sind. Hier soll der Einsatz computerlinguistischer Methoden Abhilfe schaffen und belastbare, differenzierte Indikatoren für die Qualität von Schülertexten für die deutsche Sprache ermitteln und untersuchen. Die in diesem Projekt ermittelten Indikatoren, die auf eine besonders gute oder schlechte sprachliche Kompetenz hinweisen, sollen Eingang in eine Analysesoftware finden, die helfen kann, förderbedürftige Schüler bereits sehr früh zu identifizieren und sie angemessen zu fördern. Daneben ist die Betrachtung der Entwicklung von Indikatoren im Längsschnitt äußerst förderlich, um Kompetenzmodelle abzuleiten oder weiterzuentwickeln. Für diese Zwecke wurden die zu erfassenden Merkmale operationalisiert, automatisch aus den Aufsätzen quantifiziert und schließlich unter Hinzuziehung von manuellen Bewertungen und Testergebnissen mittels statistischer Verfahren wie Korrelations-, Regressions- und Faktorenanalyse untersucht. Die in KESS erhobenen Aufsätze wurden in ein einheitliches Format gebracht und zu einem Textkorpus zusammengestellt, das derzeit 1133, 125, 1705 bzw. 1196 Aufsätze in den Klassen 4, 7, 8 bzw.10 umfasst. Zur späteren Auswertung wurden verschiedene Annotationskategorien erarbeitet und für einen Teil des Korpus wurden Zielhypothesen und Fehlerspezifikationen manuell annotiert sowie eine automatische Annotation von Wortarten mittels Treetagger vorgenommen. Die Analyse ausgewählter linguistischer Oberflächenmerkmale bzw. relativ leicht zu erfassender linguistischer Kategorien zeigt, dass es Indikatoren für geringe und hohe sprachliche Kompetenz gibt. Aussagekräftig sind z. B. die Verwendung von Affixen und Demonstrativa, der Anteil von 3-Buchstaben-Wörtern, die durchschnittliche Wortlänge, die Wortanzahl und Wortfrequenzverteilungen.

Weitere Informationen unter:
http://www.linguistik.hu-berlin.de/