Ja, ich weiß, der Titel klingt etwas reißerisch. Das Problem, das dahinter steckt: Noten in unseren Schulen tun so, als wären sie objektiv; vor allem dann, wenn sie mit Zehntel- oder Hunderstelstellen daherkommen. Dabei hat jede Note eine Art Biographie; das habe ich hier mal angerissen. Nun haben zwei Forscher:innen der Universität Zürich die Notengebung in deutschen Schulen unter einem besonderen Blickwinkel genauer unter die Lupe genommen. Der Originaltext ist in Englisch; ich zitiere in Englisch und in deutscher Übersetzung mit DeepL.
Nennstiel, R. & Gilgen, S. (2024). Does chubby Can get lower grades than skinny Sophie? Using an intersectional approach to uncover grading bias in German secondary schools. PloS one 19 (7), e0305703. doi:10.1371/journal.pone.0305703
Wenn in Deutschland vor allem konservative Lehrkräfte(verbände) auf die Verbindlichkeit und Strenge von Benotungen pochen, dann unterstellen sie damit regelmäßig, dass diese Noten leistungsgemäß und gerecht wären. Diese Annahme ist in ihren beiden Aspekten anzuzweifeln. Noten sind mit Leistungen höchstens locker korreliert; in manchen Fällen werden sie durch die Eigenheiten der Notengeber zu stark verzerrt. Hier ein paar einschlägige Ergebnisse.
Ziel der Untersuchung
„Unser Ziel ist es, Notenverzerrungen nach Geschlecht, sozioökonomischem Status, ethnischem / Migrationshintergrund sowie Körpergewicht im deutschen Sekundarschulsystem aufzudecken. Nach einem intersektionalen Ansatz testen wir, ob Schüler – unter Kontrolle der Fähigkeiten – unterschiedliche Noten erhalten, abhängig von (der spezifischen Kombination von) beschreibenden Merkmalen.“ (S. 1)
In einfacher Sprache: Nennstiel und Gilgen haben untersucht, ob ein stereotypischer dicker Junge mit Migrationshintergrund und einer sozial niedrigeren Schicht zugehörig anders benotet wird als ein schlankes deutsches Mädchen aus einer höheren sozialen Schicht – bei gleicher Leistung. Das Ergebnis, das anhand reichhaltiger NEPS-Daten gewonnen wurde: Ja, so ist es.
Hauptergebnis
„Insgesamt deuten unsere Ergebnisse auf weit verbreitete additive, intersektionale Auswirkungen von Geschlecht, sozialer und ethnischer Herkunft sowie Körpergewicht auf die Benotung hin.“ (S. 1)
Der dicke Migrant Can wird gegenüber der dünnen deutschen Sophie benachteiligt
„In dieser Arbeit war es unser primäres Ziel, ein Verständnis für die Benotung nach Geschlecht, Körpergewicht sowie sozialer Herkunft und ethnischem Hintergrund in deutschen Sekundarschulen aus einer intersektionalen Perspektive zu entwickeln. Genauer gesagt, wollten wir herausfinden, ob die dünne Sophie bessere Noten erhält als der dicke Can, selbst wenn sie die gleichen Fähigkeiten haben und gleich intelligent sind.“
Unsere Analysen zur Voreingenommenheit beim Benoten in fünf Fächern haben gezeigt, dass dies mit überwältigender Mehrheit der Fall ist. (S. 14)
„Wir interpretieren diese Ergebnisse als einen starken Indikator für eine bestehende Verzerrung der Benotung, die verschiedene Gruppen von Schülern in Abhängigkeit von ihrem Geschlecht, ihrem Körpergewicht, ihrem sozioökonomischen und ethnischen Hintergrund in deutschen Sekundarschulen in allen fünf untersuchten Fächern betrifft.“ (S. 15)
In einfacher Sprache: Die beiden Verfasser verstehen ihr Ergebnis kumulativ. Das heißt, ein dicker wird gegenüber einem schlanken Mitschüler benachteiligt, ein Migrant gegenüber einem Deutschen, ein Kind aus niedriger sozialer Schicht gegenüber dem aus der höheren Schicht und ein Junge gegenüber einem Mädchen – und das alles addiert sich auch noch!

Problemfach Deutsch
„Die größten Effektstärken finden wir für das Fach Deutsch. Eine mögliche Erklärung für dieses Ergebnis ist, dass Lehrkräfte bei der Bewertung von Sprachkenntnissen (z. B. einem Aufsatz oder einer Präsentation) vermutlich mehr Spielräume haben als bei mathematischen oder naturwissenschaftlichen Kenntnissen, bei denen es eine klarere Unterscheidung zwischen einer richtigen und einer falschen Antwort gibt. Diese Interpretation wird durch mehrere Studien gestützt, die gezeigt haben, dass die Verzerrung bei der Benotung aufgrund des ethnischen Hintergrunds größer ist, wenn die Bewertungskriterien eher vage waren […]. Alles in allem deuten unsere Ergebnisse stark darauf hin, dass Benotungsfehler weit verbreitet sind und dass die Schüler von intersektionellen Ungleichheiten betroffen sind.“ (S. 15)
Reichliche Belege für weit verbreitete Einseitigkeiten bei der Notengebung
„Mehr Wissen über die Ursache(n) von Benotungsfehlern wäre sicherlich hilfreich, um wirksame politische Maßnahmen zu ihrer Bekämpfung zu entwickeln und so ein etwas gerechteres schulisches Umfeld zu schaffen.“
Nichtsdestotrotz liefert unser Beitrag zahlreiche Belege für eine weit verbreitete Benotungsverzerrung im deutschen Schulsystem, von der Schüler mit einem niedrigeren sozioökonomischen Hintergrund, Minderheiten und übergewichtige oder adipöse Schüler betroffen sind.
„Wir stellen auch eine geschlechtsspezifische Benotung fest, wobei je nach Fach eher Mädchen oder Jungen negativ betroffen sind. Darüber hinaus scheint es eine kumulative Benachteiligung für Schüler zu geben, die gleichzeitig zu mehr als einer benachteiligten Gruppe gehören.“ (S. 16)
Kriterien schärfen!
„Unser Beitrag, der den höchsten Grad an Voreingenommenheit bei der Benotung von Arbeiten im Fach Deutsch aufdeckt, deutet auch darauf hin, dass je mehr Spielraum Lehrer bei der Benotung ihrer Schüler haben, desto wahrscheinlicher ist es, dass verschiedene Formen der Voreingenommenheit ihre Bewertungen beeinflussen. Die Einführung von strukturierteren Benotungsschemata könnte daher zu gerechteren Noten beitragen.“ (S. 16)
Kommentar
Man könnte auch weitgehend auf Noten verzichten. Es soll Schulen geben, in denen Kinder trotzdem was lernen.
Zitate im englischen Original
We aim to uncover grading bias by gender, socio-economic status, ethnic/migration background as well as body weight in the German secondary school system. Following an intersectional approach, we test whether—controlling for ability—students receive different grades depending on (the specific combination of) ascriptive characteristics. (Nennstiel und Gilgen 2024, S. 1)
Hauptergebnis
On the whole our findings are indicative of widespread additive intersectional effects of gender, social and ethnic origin as well as body weight on grading bias. (Nennstiel und Gilgen 2024, S. 1)
Ziel der Untersuchung
In this paper, our primary goal was to develop an understanding of grading bias by gender, body weight as well as social origin and ethnic background in German secondary schools from an intersectional point ofview. More to the point, we set out to see whether Skinny Sophie receives higher grades than chubby Can, even if they have the same skills and are equally intelligent. Our analyses on grading bias in five subjects has shown this to be overwhelmingly the case. (Nennstiel und Gilgen 2024, S. 14)
Strong indicator of a grading bias
We interpret these findings as a strong indicator ofan existing grading bias affecting different groups ofstudents depending on their gender, body weight, socio-economic as well as ethnic background in German secondary schools across all five subjects included in the analyses. (Nennstiel und Gilgen 2024, S. 15)
Trifft am meisten in Deutsch zu
We find the largest effect sizes for the subject German. A potential explanation for this finding is that teachers presumably have more freedom when evaluating language skills (e.g. an essay or presentation) than skills in mathematics or the natural sciences where there is a clearer distinction between a right and a wrong answer. In support ofthis interpretation, several studies showed that grading bias by ethnic background is larger when the evaluation criteria were more vague [37, 38]. All in all, our findings strongly suggest that grading bias is widespread and that students are affected by intersectional inequalities. (Nennstiel und Gilgen 2024, S. 15)
Ample evidence for widespread grading bias
Knowing more about the cause(s) ofgrading bias would definitely be helpful for designing effective policy measures aiming to combat it and thus create a slightly more just school environment. Nonetheless, our contribution offers ample evidence for wide-spread grading bias in the German school system, affecting pupils with a lower socio-economic background, minorities and those who are overweight or obese. We also find grading-bias by gender, however depending on the subject, girls or boys are negatively affected. Moreover, there seems to be a cumulative disadvantage for students who simultaneously belong to more than one group facing disadvantage. (Nennstiel und Gilgen 2024, S. 16)
Notenkriterien schärfen!
Our contribution, which uncovers the highest degree ofgrading bias for German, also suggests that the more freedom teachers have in grading their pupils, the more likely it is that different forms ofbias will affect their evaluations. Implementing more structured grading schemes could therefore contribute to fairer grades. (Nennstiel und Gilgen 2024, S. 16)






1 comments On Faktencheck #108: Dicke Jungs kriegen schlechtere Noten
Pingback: Sichtweisen #34: Heimlicher Lehrplan 2.0 - Pädagokick ()