Ach, wenn es nur so einfach wäre:

In der Schule tun wir so, als wäre das ein naturgegebener Zusammenhang: So, wie wir die Schülerinnen Laura und Mariam benoten, wird ihnen das gerecht, denn es entspricht ihrer Leistung in Probearbeiten und Schulaufgaben. Dass diese Leistung sich aus zahlreichen Komponenten zusammensetzt, deren Entstehung bis zur Geburt der Schülerinnen zurückreicht, machen sich möglicherweise nicht alle Lehrerinnen und Lehrer klar. Die folgenden Ausführungen sollen dazu beitragen, ein paar wichtige Zusammenhänge bei der Benotung nicht aus den Augen zu verlieren.
Mit den Namen „Laura“ möchte ich den einen Pol des gesellschaftlichen Spektrums beschreiben, nämlich das Kind bildungsbeflissener Eltern mit einem mindestens mittleren Einkommen. „Mariam“ repräsentiert dagegen ein Kind aus einer Familie mit Migrationshintergrund und in einer wirtschaftlichen Situation, die dazu führt, dass sie Unterstützung nach SGB-II erhält.
Natürlich handelt es sich dabei um pauschalisierte Schemata oder auch Stereotypen. Sie haben in einigen Teilen dieses Aufsatzes die Funktion, die Breite des gesellschaftlichen Spektrums zu verdeutlichen, die auch in der konkreten und messbaren Wirklichkeit Folgen hat für Leistungen und Noten in der Schule, also für den gesamten Bildungsweg eines Kindes und Jugendlichen – was zu beweisen sein wird.
Geburt
Jedes Kind kommt mit seiner eigenen genetischen Ausstattung auf die Welt, in der etwas angelegt ist, das wir „Begabungen“ oder „Potenzial“ nennen können, mit großer Vorsicht auch „Intelligenz“[1]. Spätestens nach der Geburt – und im Grunde auch schon vorher – wirkt eine Umwelt auf diese Anlagen ein. Das Kind hat bereits im Mutterleib teil am Leben und an dem, was die Mutter aufnimmt. Alkohol, Drogen oder Nikotin können sich, so die Intelligenzforscher Stern/Neubauer, schon früh schädlich auf die genetische Ausstattung eines Kindes auswirken[2]. Dass es auch gezielt steuerbare positive Einflüsse gibt – zum Beispiel durch Vorspielen von klassischer Musik oder Hören von Fremdsprachen –, ist wissenschaftlich umstritten, aber nichtsdestotrotz Grundlage eines Wirtschaftszweiges wie der Prenatal University[3], der sich mit „Frühförderung“ befasst.
Wir sehen also, dass Lauras und Mariams Leistung, die durch eine Schulnote zum Ausdruck gebracht werden soll, aus mindestens zwei Komponenten zusammengesetzt ist.

Begabung
Nein, man kann nicht so einfach von einer guten Schulnote auf eine Begabung schließen, und auch nicht von einer schlechten auf eine mangelnde. So einfach lässt sich hier ein Zusammenhang nicht herstellen.
Im Gegenteil ist es sogar gefährlich, schulische Noten primär mit Begabung in Verbindung zu bringen, denn es besteht die Gefahr, dass ein Lock-in-Effekt greift. Hier beziehe ich mich auf einen Hinweis aus der Hattie-Studie:
Lehrkräfte könnten den Aspekt der Begabung (ability) und die mutmaßlich angeborenen Unzulänglichkeiten ihrer Schützlinge so stark ins Auge fassen, dass sie ihre eigenen pädagogischen Möglichkeiten unterschätzen und in ihren unterrichtlichen Bemühungen zu früh resignieren. Und weiter fordert John Hattie, dass Lehrkräfte damit aufhören sollen, Schulen zu erschaffen, die frühere Leistungen der Heranwachsenden festschreiben (lock in) und stattdessen dafür offen sein, dass die Jugendlichen auch unerwartete Leistungen zeigen könnten[4]. Im Sinne dieser Feststellung muss man also fragen, ob eine frühe Aufteilung aller Kinder in Schularten schon im Alter von 10 Jahren wirklich klug ist.
Von einer allzu einfachen Identifikation von Leistung mit Begabung warnt auch der emeritierte Professor für Schulpädagogik Helmut Fend [5].

Wir dürfen nicht vergessen, dass die Leistung eines Menschen immer durch diese beiden Komponenten oder Einflussgrößen bestimmt ist: Begabung und Umwelt. Und wie es scheint, gerät mit der Betonung des einen Aspektes jeweils der andere leicht aus dem Blick.
Wenn wir also die Begabung in den Blick nehmen, dürfen wir nicht vergessen, dass damit nicht das letzte Wort über die Leistungsfähigkeit eines Menschen gesprochen ist. Die pädagogische Forschung ist sich darüber hinaus darin einig, dass Begabung nicht einfach erkennbar ist, sondern immer unterstellt wird. Ballauf spricht hier von einer „prognostischen Hypothese“. Und wenn sich Menschen gar zu sehr auf ihre Erkenntnis von Begabungen verlassen, dann sieht er das als extrem unwissenschaftlich an und nennt es „Potenzialitätsmetaphysik“[6].
Damit das in den Genen vorhandene Potenzial überhaupt genutzt werden kann, müssen die Grundlagen unter anderem für die Aufmerksamkeitssteuerung, die numerische Entwicklung und den Schriftspracherwerb gelegt werden. Geschieht dies nicht, so laufen Kinder mit sehr gutem genetischem Potenzial Gefahr, ihre Chancen zu vertun. Als positiv und fördernd wird bereits eine Umgebung erachtet, die nicht als bedrohlich erlebt wird, dazu handlungsbegleitendes Sprechen und die Quantifizierung von Alltagsereignissen – alles Dinge, die nicht besonders kostspielig sind, aber dazu beitragen, dass ein Kind sein Potenzial entfalten kann[7].
Damit kommt auch gleich der nächste Aspekt einer Leistungsentwicklung in den Blick: die Familie.
Familie
Nach seiner Geburt bewegt sich das Kind im Normalfall in seiner Familie. Damit ist die erste Umwelt festgelegt, die maßgeblich die Begabung und die Möglichkeiten eines Kindes beeinflusst. Die Sprache der Familie, ihr Umgang miteinander, insgesamt ihre „Kultur“, verbindet sich prägend mit den genetischen Potenzialen und wirkt sich auf die weiteren Leistungen des Kindes aus. Welche Wahrnehmung macht ein Kind in seinen frühen Jahren? Hat es Eltern, die sich um es kümmern (können) oder solche, die keine Zeit haben, weil sie arbeiten und Geld verdienen müssen? Wird das Kind mit seinen Lebensäußerungen ermutigt oder allein gelassen? Wird es vor den Fernseher oder ein Tablet gesetzt oder wird ihm vorgelesen? Gehen die Eltern mit ihm ins Kindertheater oder Naturkundemuseum?
Kulturelles Kapital
Was Laura in der Zeit zwischen Geburt und Schule sammelt – und Mariam weniger oder gar nicht – nannte der französische Soziologe Pierre Bourdieu „kulturelles Kapital“. Damit meinte er, kurzgefasst, dass es Schülerinnen und Schüler wie Laura gibt, die schon von Anfang an aufgrund der Geburt in die „richtige“ Familie den Gütern der bestimmenden Kultur begegnen und sich diese aneignen können, oder im Passiv formuliert: mit diesen ausgestattet werden. Da in der Schule auch genau diese Güter und diese Kultur vorausgesetzt und weiter ausgebildet werden, hat Laura einen entscheidenden Startvorteil, den sie während ihrer Schulzeit auch weiter ausbauen kann.[8] Mariam wächst mit den entsprechenden Nachteilen auf.
Migrationshintergrund
Welche Sprache wird in der Familie gesprochen? In deutschlandweiten Vergleichstests deutet sich ein Zusammenhang an zwischen den Leistungsergebnissen der Schülerinnen und Schüler und der Erstsprache zuhause: Kinder wie Mariam, für die Deutsch die Zweitsprache ist, haben es in der Schule nicht so leicht, wie die Lauras.
Im IQB-Bildungstrend 2021 beispielsweise wurde gezeigt, dass die Deutschleistungen von Viertklässler:innen in Bayern und Sachsen mit am wenigsten zurückgegangen sind, in Bremen am stärksten. Zugleich ist der Anteil der Kinder, die zuhause „immer Deutsch“ sprechen in Bayern und Sachsen mit 18,1% (resp. 16,0%) ebenfalls am wenigsten zurückgegangen, in Bremen mit 27,2% dafür besonders stark. Diese Zahlen gelten für den Zeitraum von 2011 bis 2021[9]. Um es im Bild auszudrücken: In jedem Bundesland hat die Anzahl an „Mariams“ zugenommen, nur in Sachsen und Bayern am wenigsten, in Bremen am meisten.
Wenn Mariam zuhause gar nicht oder wenig Deutsch spricht, hat das starke Auswirkungen auf ihre Leistungen in der Schule. Um neben Bourdieu auch den zeitgenössischen Soziologen Hartmut Esser zu zitieren[10]:
Die Nachteile der Migrantenkinder beim Erwerb von frühen schulbezogenen Fertigkeiten liegen so gut wie allein schon an den mangelnden Kompetenzen in der (Zweit-)Sprache (13). Es ist ein Beispiel dafür, dass es auch systematische globale Blockaden der Entwicklung von Talenten geben kann, auch wenn sonst alle Voraussetzungen erfüllt sind.
Anmerkung (13): Die Zweitsprachenkompetenzen der Migrantenkinder sind, so sei noch ergänzt, in erster Linie eine Frage der sprachlichen Assimilation der Eltern, speziell der Mutter, und der mit den Kindern dann auch in der Familie tatsächlich gesprochenen Sprache.
Wenn also aus Ergebnissen solcher bundesweiten Vergleiche der Schluss gezogen wird, dass die Schulsysteme in Bayern und Sachsen „gut“ sind und das in Bremen „schlecht“, dann ist das eine kurzschlüssige Ursachenzuschreibung. Vielleicht hängen die Gesamtleistungen ja viel stärker von der Zusammensetzung der Schülerschaft ab; die Korrelation ist deutlich, eine Verursachung liegt nahe.

Sozioökonomische Situation der Familie
Weiterhin lassen sich auch Zusammenhänge zwischen den Schulleistungen von Kindern und ihrem familiären sozioökonomischen Hintergrund erkennen.
Der emeritierte Professor für Sonderpädagogik Hans Wocken hat in seinem Beitrag „Falscher Lorbeer“ online[11] die Kompetenzwerte der Bundesländer mit der Sozialhilfequote verglichen und gezeigt, dass für Mariam gelten würde: Je höher die Sozialhilfequote (SGB-II-Quote) eines Bundeslandes, desto niedriger der Kompetenzwert in Mathematik. Und für Laura: Je niedriger die SBG-II-Quote, desto höher der Kompetenzwert in Mathematik. Auch hier ragen auf der einen („leistungsstarken“) Seite Bayern und Sachsen heraus, auf der anderen („kompetenzschwachen“) Seite Bremen[12].
Primäre Herkunftseffekte
Unter dem Stichwort „primäre Herkunftseffekte“ kann man die drei Aspekte zusammenfassen, die ich soeben beschrieben habe: (a) das kulturelle Kapital, das ein Kind durch seine Herkunftsfamilie mit auf den Lebensweg bekommt und die Einflüsse (b) des sozioökonomischen und (c) des Migrationshintergrundes auf die Leistungen und das weitere Lernen, bzw. die Entwicklung allgemein. Um noch einmal den oben zitierten emeritierten Professor für Soziologie Hartmut Esser zu Wort kommen zu lassen[13]:
Dafür aber sind in den Familien nach der sozialen Herkunft die strukturellen Bedingungen sehr ungleich verteilt, und es gibt daher schon früh auch strukturelle Unterschiede in der früh für den Schulerfolg wohl wichtigsten Bedingung, den kognitiven Fähigkeiten (…). Es sind die primären Effekte und alles, was da noch – sekundär und tertiär – dranhängt.
Damit werden Einsichten des Bildungssoziologen Pierre Bourdieu bestätigt, die zeigen, dass die Kinder „kulturelles Kapital“ fürs ganze Leben sammeln (Laura) – oder eben nicht (Mariam). Der „Chancenmonitor“ des ifo-Instituts hat diesen Dauerzustand wieder einmal bestätigt[14].
Matthäuseffekt
Im Sinne des „Matthäuseffektes“ werden dann auch noch von früher Kindheit an Begabungen und Leistungsmöglichkeiten verstärkt oder abgeschwächt.
Wer zu einem bestimmten Zeitpunkt im Vergleich zu anderen über bessere individuelle Lernvoraussetzungen verfügt, wird von gleichen Lernangeboten, Lerngelegenheiten und Lernanforderungen stärker profitieren. Das führt in der kognitiven Entwicklung notwendigerweise zu Schereneffekten, das heißt zu einer Spreizung der interindividuellen Leistungsunterschiede … Das ist zum Beispiel in den deutschen Grundschulen programmatisch der Fall, sollte aber auf den Erwerb aller basalen Leistungsdispositionen ausgeweitet werden, wobei den Hauptschulen eine besonders wichtige Funktion zukommt [15].
Sprache und Begriffe
Die Sprache, in die das Kind hineinwächst, hat eine immense Bedeutung für seine weitere Zukunft. Auf der einen Seite stellt sie Begriffe bereit, die nichts anderes sind als Kategorien des Weltbegreifens und vermutlich – reduktionistisch betrachtet – Verknüpfungen im Gehirn. Je feiner die Begriffe differenzieren, desto detaillierter die Wahrnehmung und die Erkenntnis. Auf der anderen Seite ist die Sprache ein Signalsystem für die Kommunikationspartner, die ein Kind klassifizieren, zum Beispiel nach dem regionalen, dem ethnischen oder dem sozial-ökonomischen, allgemein: dem kulturellen Hintergrund. Beide Aspekte der Sprache spielen eine große Rolle, wenn das Kind dann in die Schule kommt.
Halten wir kurz inne und fragen, welche Ausdifferenzierung die „Leistung“ bis hierhin schon erfahren hat und was wir eigentlich bewerten, wenn wir dem Kind eine Note geben:
Eine Drei in Deutsch bewertet neben dem genetisch mitgebrachten Potenzial von Laura und Mariam auch die vielfältigen familiären, kulturellen und sprachlichen Einflüsse, die ihre Talente gefördert oder haben brach liegen lassen. Schon zum Schuleintritt wissen wir Lehrer also nicht, ob sich die Leistungen eines Kindes in dem erschöpfen, was wir wahrnehmen, ob noch mehr „in ihm steckt“ oder ob wir bereits die Folgen einer optimal ausgereizten Förderung vor uns haben.
Unsere Schulnote beschreibt also eine Leistung, die sich aus vielen Facetten zusammensetzt. Und diese liegen, um das spätestens an dieser Stelle klar hervorzuheben, nicht in der Hand und in der Verantwortung von Laura oder Mariam. Das wird in der folgenden Grafik verdeutlicht:

Schule
Habitus
Nun ist die Schule kein Resonanzboden für alle möglichen von den Kindern mitgebrachten kulturellen Äußerungen und Eigenschaften, sondern wir müssen nach aller Erfahrung davon ausgehen, dass die Schule Ausdruck und Exponent ausschließlich einer Kultur der deutschen Mittelklasse ist. Auf diesem Boden gedeiht besonders das Ähnliche gut: Die Lehrer/innen schätzen es, wenn Laura sich in ihrer gemeinsamen Hochsprache ausdrückt, wenn sie ähnliche Werte vertritt und ähnliche Erfahrungen schon gemacht hat oder zu machen bereit ist[16]. Das ist auch nicht verwunderlich, wenn man sich vor Augen hält, in welcher Welt und Kultur die Mehrheit der Lehrkräfte aufgewachsen ist. Wie viele sind einen anderen Weg gegangen als den über die klassische und kulturell prägende Institution Gymnasium, das seinerseits geprägt ist von der Kultur, der Sprache und den Werten der deutschen gesellschaftlichen Mittelklasse? Der bereits mehrfach erwähnte Pierre Bourdieu hat diesen Zusammenhang unter dem Stichwort „Habitus“ als eine „Körper gewordene Geschichte“ beschrieben[17].
Die Kinder werden systembedingt zwangsläufig in der Schule früh qualifiziert, im unguten Fall stereotypisiert. Nur wirklich gute Lehrerinnen und Lehrer können offen sein für fremde kulturelle Herkünfte. Und nicht jede Grundschullehrerin kann – und wollte sie es noch so sehr – sich die Zeit für ein einzelnes Kind nehmen, um auch gegen den äußeren Anschein nach seinen Begabungen zu suchen und diese zu fördern. Damit sind wir bei schulstrukturellen Fragen angelangt.
Unterricht
Es gibt – besonders in Bayern – als Folge der Zuspitzung der Bildungswegentscheidung auf die vierte Klasse bestimmte Zwänge, denen die Lehrkraft gar nicht ausweichen kann: Sie muss den zeitlichen und Mengenvorgaben für zu schreibende Probearbeiten entsprechen, das heißt, dass ihre pädagogischen Freiräume im Hinblick auf Vertiefung von bestimmten Themen, bei denen entweder die Kinder „anspringen“ oder viele ihre Probleme haben, stark beschränkt werden. Außerdem muss sie sich präventiv schon mal an den Themen und Inhalten orientieren, die für den Probeunterricht an Realschulen und Gymnasien relevant sind, sonst kommen Lauras Eltern mit dem Rechtsanwalt zur Schulleitung[18]. Mehrere solche „Washback“-Effekte der Übertrittsschranke werden in der pädagogischen Forschung thematisiert[19].
Die strukturell bedingten Einschränkungen der pädagogischen Freiheit verbinden sich nun auch noch mit der individuellen pädagogischen Kompetenz der Lehrkräfte. Hier kann ein Kind Glück oder Pech haben, es gibt nun einmal gute und schlechte Lehrerinnen und Lehrer. Sie sind – wie alte[20] und neue[21] Forschungen zeigen – entscheidend für den Lernfortschritt der ihnen anvertrauten Kinder.
Und dazu kommt noch Folgendes: Nimmt man die gesellschaftlichen Funktionen der Schule, nämlich unter anderem die „Enkulturation“ wirklich ernst, dann ist auch genau das die Aufgabe von Lehrpersonen in den ersten Schuljahren: die Ein- und Engführung von Sprache, Wissen und Werten in die Kultur des Unterrichtsstaates. Anderes kommt dann im besten Fall als Unterrichtsinhalt zur Sprache, aber nicht zur Existenz.
Damit erfährt die „Leistung“ eine erhebliche Verengung: Als solche wird weitestgehend nur das erkannt und anerkannt, was Laura mitbringt, weil es dem kulturellen Hintergrund von Schule und Lehrern entspricht und in dessen Sprache geäußert wird. Mariams Potenziale, soweit sie außerhalb dieser Kategorien liegen, werden nicht wahrgenommen, ihre fremden Kompetenzen werden nicht gefördert, so dass man sich fragen muss, ob da nicht Artikel 3 des Grundgesetzes verletzt wird, der regelt, dass niemand „wegen seines Geschlechtes, seiner Abstammung, seiner Rasse, seiner Sprache, seiner Heimat und Herkunft, seines Glaubens, seiner religiösen oder politischen Anschauungen benachteiligt oder bevorzugt werden“ darf, wie das in den Schulen täglich geschieht!
Wo stehen wir? Die Ausführungen über die Effekte ab Schuleingangsphase werden in unser Diagramm übernommen, das sich damit weiter ausdifferenziert. Wer eine Schulnote vergibt, bewertet also Folgendes:

Bitte nicht übersehen: Mit einer schlechten Note, die ich einem Kind gebe, bewerte ich auch meinen eigenen Unterricht und meine Haltungen diesem Kind gegenüber! Spätestens an dieser Stelle sollte sich andeuten, dass Neutralität und Objektivität der Notengebung nur in einer pädagogischen Scheinwelt existieren.
Selbsterfüllende Erwartungen und Stereotypen
Was erwarten Lehrerinnen und Lehrer von den Kindern und Jugendlichen, die da vor ihnen sitzen? Dass Lehrkräfte zum großen Teil gerade die Leistungen erhalten, die sie erwarten, das zeigte das Rosenthal-Experiment, das als „Pygmalion in the classroom“ in die Geschichte der Pädagogik einging[22]. Die Hattiestudie kam zu dem Ergebnis, dass solche Leistungserwartungen einen viermal so hohen Effekt auf die Lernergebnisse haben (d = 0.41), als zum Beispiel das reine Fachwissen der Lehrer:innen (d = 0.11). Wenn Kinder in der Schule also wenig Leistung zeigen, kann dies auch damit zusammenhängen, dass sie eine Lehrkraft haben, die ihnen nicht viel zutraut – und umgekehrt.
Stereotypien sind bestimmte Formen von Etikettierung. Diese wirkt sich tatsächlich noch stärker auf den Lerneffekt aus als generelle Erwartungen: Wenn Lehrerinnen und Lehrer ihre Lernenden nicht mit Etiketten versehen – sie also nicht als „grundsätzlich mathematisch unbegabt“ etc. bezeichnen -, hat dies einen ungefähr sechsmal stärkeren Effekt für den Unterrichtserfolg (d = 0.61) als bloßes Fachwissen[23].
Wie Lehrer:innen Stereotypen besonders für Mariam entwickeln, zeigt dieses Zitat:
Besonders auffällig war, dass die beteiligten Lehrpersonen nur stereotype, kaum reflektierte, nur negative Vorstellungen über Migrantenkinder und Mehrsprachigkeit äußerten. Ergebnisse der einschlägigen Forschung über die Mehrsprachigkeit insbesondere von Migrantenkindern und neuerer Beurteilungsinstrumente scheinen kaum bekannt zu sein.[24]
Dieselben Wissenschaftler:innen sprechen davon, dass „dem Pygmalioneffekt Tür und Tor geöffnet“ ist[25]. In wissenschaftlichen Untersuchungen wurde nachgewiesen, dass sich Lehrerurteile über Kinder nicht ausschließlich an deren Leistungen orientieren, sondern auch an deren sozialer Klasse und dass Lehrer:innen sogar künstliche Leistungsklassen bilden, wenn sie sich bei den Kursempfehlungen (wohl unbewusst) am sozialen Hintergrund von Schülerinnen und Schülern orientieren[26]. Hier hat also Laura eine höhere Chance, einem A-Kurs zugewiesen zu werden als Mariam – auch dann, wenn beide in standardisierten Tests die gleichen Leistungen gezeigt haben!
Die Sozialpsycholog:innen der Universität Lausanne schließen nach weiteren Untersuchungen und aus der einschlägigen Literatur, dass man auch damit rechnen muss, dass im Lernen erfolgreiche Migrantenkinder wie Mariam am Weiterkommen gehindert werden, weil sie das an sozialen Klassen orientierte System in Frage stellen[27].
Wenn wir uns wieder kurz orientieren, wo wir inzwischen stehen: Es wird immer deutlicher, dass die einfache Gleichsetzung von Schulnote mit Leistung in hohem Maße naiv ist. Stattdessen wird erkennbar, aus wie vielen Mosaiksteinen sich die Leistung im Leben eines Kindes und in unserem Schulsystem zusammensetzt, ehe die Kinder die erste Probearbeit in Angriff nehmen.

In der Probearbeit kommen dann noch weitere Einflüsse zum Tragen, was als nächstes thematisiert wird.
Leistungsnachweise
Leistungserhebungen sind weit davon entfernt, uns ein neutrales, sachliches und objektives Bild vom Leistungsvermögen der Schülerinnen und Schüler zu geben. Ehe Laura oder Mariam auch nur ihren Namen auf den Testbogen geschrieben haben, gibt es schon zahlreiche neue Aspekte, die ihre Testleistung beeinflussen werden – sachliche und persönliche, und letztere nicht nur auf der Schüler-, sondern auch auf Lehrerseite.
Sachseite
Wenn wir schon allein die Teststellung betrachten, müssen wir Abstriche von der Aussagekraft unserer Leistungserhebungen in den Schulen machen, denn „die wenigsten Instrumente der schulischen Leistungserfassung erfüllen die Gütekriterien einer Messung (Objektivität, Reliabilität und Validität)“. Das sagt nicht irgendein spontaner Kritiker oder kleinkarierter Wissenschaftler, sondern das eher konservativ und auf jeden Fall solide arbeitende bayerische Staatsinstitut für Schulqualität und Bildungsforschung[28].
In die Probearbeiten und Schulaufgaben, die von uns Lehrer:innen verfasst und ausgeteilt werden, fließt Vieles ein, das die Leistung eines Kindes verzerrt – seien es schlechte Kopien, missverständliche Aufgabenstellungen oder Fragen, die im vorhergehenden Unterricht zu wenig vorbereitet wurden; und damit meine ich nicht die so genannten „Transfer“- oder „Problemlösungsaufträge“, die enthalten sein müssen, sondern einfach einen mangelhaften Zusammenhang von Unterricht und Verständniskontrolle. Über problematischen Unterricht habe ich weiter oben schon gesprochen.
Schülerseite
Leistungserhebungen messen nicht nur fachliche Kompetenzen, sondern immer auch eine Vielfalt von geistigen Vermögen, Zuständen oder Mängeln – Konzentrationsfähigkeit, Durchhaltevermögen, Merkfähigkeit, Rechtschreibkenntnisse, Teilleistungsschwächen, aktuelles seelisches Befinden, Ablenkung, Blockaden, Tagesform –, die auch in die spätere Note einfließen. Davon weiß jede Lehrkraft aus der Praxis zu berichten.
Kinder sind keine körperlosen oder dem sozialen Leben enthobene Gehirnträger, sondern werden in ihrer Leistungsfähigkeit (so man diesen pauschalisierenden Begriff überhaupt noch verwenden darf) durch Gegebenheiten beeinflusst, die mit in die spätere Bewertung eingehen, obwohl sie überhaupt nichts mit der fachlichen Leistung zu tun haben: Schülerinnen und Schüler sind „schlecht drauf“, weil sie unter den Spannungen einer kriselnden Ehe zuhause leiden, weil sie Zahnweh oder Ohrensausen haben, weil sie im Schulbus blöd angeredet wurden oder sich vor dem vernichtenden Urteil der Peergroup fürchten („Was der wieder für uncoole Schuhe trägt!“ „Schaut doch mal dieses billige Handy!“). Mädchen haben ihre Tage oder Liebeskummer - oder Liebeskummer verursacht und fühlen sich schuldig.
Und bei manchen ist es schon allein die Testsituation mit ihren strengen Regularien zur Benutzung von Dictionary, Formelsammlung und Taschenrechner oder die Zeitvorgabe, die zu einer Beeinträchtigung oder sogar Blockade führen kann.
Leistung wird also immer in einem körperlichen oder sozialen Kontext erbracht. Dieser Kontext wird in einer Note nicht berücksichtig, schließlich soll sie ja „objektiv“ sein. Aber genau das ist eine Illusion oder Chimäre von Objektivität: Wer den Kontext nicht mit in Betracht zieht, vernachlässigt das körperliche und soziale Leben eines Kindes. Mariam und Laura werden „Leistungen“ zurückgemeldet, die eine Gültigkeit beanspruchen, die sie nicht haben.
Betrachten wir unser Schulnotendiagramm, dann hat es sich weiter ausdifferenziert. Wir dachten, wir würden einfach nur „Leistung“ beurteilen. Aber wir qualifizieren Existenzen:

Und das war es noch nicht, denn jetzt kommt noch die weitere Hauptperson in den Blick: die Lehrerin oder der Lehrer, die eine Probearbeit oder Schulaufgabe auswerten und benoten.
Lehrerseite
Das oben bereits erwähnte bayerische Staatsinstitut mahnt uns Pädagog:innen bei der Bewertung von Schülerarbeiten vor einer Vielzahl von möglichen Verzerrungen, und ich möchte die Kollegin oder den Kollegen kennenlernen, die oder der sich all dieser Aspekte bewusst ist. Ich füge an dieser Stelle eine Auflistung der Stolpersteine ein, wie sie das Staatsinstitut in aller Ausführlichkeit beschreibt:
Obwohl Noten, Notenschlüssel und Punktbewertungen eine möglichst große Objektivität bei der Bewertung von Schülerleistungen anstreben, genügt die schulische Bewertung nur selten testtheoretischen Kriterien und bleibt subjektiv…
Beim Beobachten, Bewerten und Beurteilen von Schülerleistungen lassen sich störende Einflussfaktoren nie gänzlich ausschalten; man sollte sich ihrer jedoch bewusst sein. In der Literatur werden der „Halo-Effekt“, „Logische Fehler“ und ähnlich gelagerte Probleme unter dem Begriff „Implizite Persönlichkeitstheorie“ zusammengefasst. Darunter versteht man vereinfachte, naive Persönlichkeitstheorien zur Beurteilung anderer Menschen.
Der Halo-Effekt
Der Halo-Effekt beruht auf dem Übertragen des allgemeinen Gesamteindrucks auf die Beurteilung einzelner Eigenschaften. Dieser Effekt tritt besonders bei Persönlichkeitsmerkmalen auf, die moralisch hoch bewertet sind und nur schwer beobachtet werden können (z. B. Grundstimmung, Gefühlsleben). Der gesamte Eindruck entsteht dabei häufig auf Grund von Sympathie oder Antipathie.
Logische Fehlschlüsse
Kaum zu trennen vom Halo-Effekt sind die logischen Fehler. Hierbei werden bestimmte Merkmale, die dem Beurteiler logisch zusammengehörig erscheinen, ähnlich bewertet: Beispiel: Wer sich mündlich gut ausdrücken kann, von dem wird auch erwartet, dass er dies ebenfalls im schriftlichen Bereich tut.
Milde- oder Strengeeffekt
Milde- oder Strengeeffekt: Gute Leistungen werden bei als „gut“ eingeschätzten Schülern besser bewertet, schlechte Leistungen werden bei ihnen milder bewertet. Bei als „schlecht“ eingeschätzten Schülern finden gute Leistungen kaum Beachtung, die schlechten Leistungen werden besonders streng bewertet.
Tendenz zur Mitte
Tendenz zur Mitte: Besonders bei schriftlichen Leistungsnachweisen vermeiden einige Lehrer Extremurteile und verwenden nur die mittleren Notenstufen.
Pygmalioneffekt – Erwartungshaltung
Diesen Effekt hatte ich weiter oben bereits angesprochen, aber um ein farbenkräftigeres Bild zu malen, sei er hier noch mal vollständig zitiert.
Die Erwartungshaltung des Lehrers beeinflusst das Verhalten des Schülers. Verschiedene Untersuchungen bestätigen die Existenz des Pygmalion-Effekts. Er entwickelt sich – hier exemplarisch dargestellt – in mehreren Schritten:
- Der Lehrer liest im Schülerbogen, dass ein Schüler im Unterricht besonders eifrig mitarbeitet.
- Diese Erwartungshaltung wirkt sich auf sein Verhalten aus. Er zeigt sie in seiner Sprache, Mimik und Gestik. Meldungen dieses Schülers nimmt er sofort wahr, lässt ihm mehr Zeit, wiederholt die Frage oder gibt Hinweise.
- Der Schüler übernimmt die Lehrereinstellung in seinem Selbstbild. Er verändert und korrigiert sein Verhalten und produziert das erwartete, das heißt, er beteiligt sich noch reger am Unterrichtsgeschehen.
- Der Lehrer beobachtet die eifrige Mitarbeit und sieht seine Erwartung bestätigt.
- Der Kreis ist geschlossen und es wird deutlich, wie sich die schriftliche Fixierung des Lehrerurteils zur sich selbst erfüllenden Prophezeiung entwickeln kann. Gravierende Folgen hat dies bei einer negativen Festlegung, wenn der Schüler kaum die Chance besitzt, die Rolle eines „schwachen Schülers“ oder eines „Klassenkasperls“ abzulegen.
Ähnlichkeits- und Kontrastfehler
Der Ähnlichkeitsfehler besteht in der Annahme des Beurteilers, die zu beurteilende Person hätte ähnliche oder gleich ausgeprägte Verhaltensmerkmale wie er selbst. Der Kontrastfehler beruht auf der Tendenz des Beurteilers, der zu beurteilenden Person die seinem eigenen Wesen gegensätzlichen Merkmale zuzuschreiben.
Reihungs- oder Schwankungseffekt
Reihungs- oder Schwankungseffekt: Bei der Korrektur von schriftlichen Arbeiten werden die ersten häufig strenger beurteilt als die letzten. Bei der Auswertung mündlicher Prüfungen zeigt sich oft ein rhythmisches, periodisches Absinken und Ansteigen der Benotung.[29]
Ja, auch die Lehrerin ist ein Mensch mit einem Körper und einem sozialen Leben, der und das sich auf die Qualität des Handelns auswirken. Kann denn wirklich ein Korrigieren von Schülerarbeiten, das sich bis spät in die Nacht hinzieht, garantieren, dass die Lehrkraft jeder Schülerin gerecht wird? Gibt es da nicht auch Müdigkeit am Abend oder Lustlosigkeit am Wochenende oder Abneigung, wenn wieder ein langer Aufsatz mit schwer zu entziffernder Handschrift vor einem liegt? Gibt es so etwas wie Sympathie und Abneigung? Sind denn Lehrer immer frei von persönlichen Konflikten, von Hochs und Tiefs? Natürlich nicht. Können sie das immer aus den Bewertungen heraushalten? Würde mich wundern. Und ebenso verwunderlich wäre es, wenn eine Lehrkraft zu jeder Zeit all die Kompetenzen aufweisen würde, wie sie beispielhaft das Kompetenzmodell von Baumert/Kunter in ihrer Übersicht zum Fach Mathematik darstellt.[30]
Es ist durch die bisherigen Ausführungen deutlich geworden, welche große Rolle eine Lehrkraft für das spielt, was als Leistung eines Schülers oder einer Schülerin gefördert, erkannt, anerkannt, abgerufen und beurteilt wird. „Es kommt auf den Lehrer an“ – zumindest dieses Fazit der Hattiestudie hat es in den allgemeinen Sprachgebrauch der Pädagog:innen geschafft. Das heißt aber auch, dass gute und schlechte LehrerInnen Schicksal sind für ein Kind. Es kann offensichtlich nicht nur gute Lehrkräfte geben.
Schlechte Lehrkräfte machen keinen guten Unterricht, entdecken oder wecken also (zumindest nicht per Kompetenz) keine Leistungspotenziale, bringen die ihnen anvertrauten Kinder und Jugendlichen nicht voran. Sie sind sich nicht darüber im Klaren, dass sie kulturell vorgeformte Stereotype transportieren. Nichtsdestoweniger schreiben sie Leistungserhebungen, werten sie aus und geben Noten. Das sind Gründe dafür, dass John Hattie meint, wir müssen uns systematisch um schwache Lehrer:innen kümmern und brauchen eigentlich eine Politik des „No Teacher Left Behind“[31].
Fassen wir die Lehrerseite zusammen, so wird deutlich, dass eine Lehrperson mit den Noten, die sie gibt, auch ein Urteil über sich selbst spricht: über den eigenen Unterricht, die Qualität bei der Zusammenstellung einer Schulaufgabe und die Einseitigkeiten oder eigenen Stimmungen in der Auswertung. Die nur allzu bekannten Effekte solcher Stolpersteine und des Lehrerlebens fließen mit in die Note ein und ergeben zwei weitere Segmente in unserem Diagramm.

Noten
Das alles wird dann mit einer Note versehen. Angesichts der nun wirklich reichen Fachliteratur zu diesem Thema[32] muss es einen verwundern, dass es überhaupt noch diese eigenartigen sechs Notenstufen gibt und Menschen, die darin eine adäquate Beschreibung von Leistung sehen.
Dass eine Note im Zeugnis keinerlei Auskünfte zu Teilbereichen gibt – in Deutsch zum Beispiel zu sinngestaltendem oder sinnentnehmenden Lesen, mündlichem und schriftlichem Ausdruck, Rechtschreibung usw. – und dass sie keinerlei Förderansätze offenbaren, macht sie im Grunde wertlos[33].
Dass unterschiedliche Lehrkräfte Schülerarbeiten hochgradig unterschiedlich bewerten, ist vielfach nachgewiesen und sollte zum allgemeinen Wissensbestand gehören[34]. Ganz allgemein und ausführlich wird dieser auch für Richter, Personaler und andere für die Karriere von Menschen entscheidenden Berufsgruppen geltende Effekt der „Streuung“ in einem Buch von dem Nobelpreisträger Daniel Kahneman und Kollegen beschrieben[35].
Dass die Erteilung von Noten von der Leistungsfähigkeit und -abstufung in einer Klasse abhängt und somit der Zufall der Klassenzuordnung für ein Kind entscheidend ist, kann als gesicherte Erkenntnis gelten[36] und hat auch eine Bezeichnung im wissenschaftlichen Jargon, zum Beispiel der Big-fish-little-pond-Effekt[37], zu Deutsch etwa „Hecht im Karpfenteich“.
Dass Eltern aufgrund dieser zahlreichen Mängel einfach über Noten hinweggehen könnten, ist leider nicht möglich, denn sie haben große Auswirkungen auf die Motivation von Schülerinnen und Schülern[38].
Dass Noten auf der sehr schwammigen Grundlage all dieser Unzulänglichkeiten gebildet werden, wird hinter einer Scheinobjektivität versteckt, die sich in vorgeblich harten Ziffern mit Zehntel- oder Hundertstelstellen auszudrücken versucht.
Und was ist davon zu halten, dass zwischen 2,6 und 3,4 größere „Leistungs“-Unterschiede vorhanden sind, aber beide die gleiche Note 3 erhalten? Oder dass an der Übergangsstelle halbe Punkte zwischen zwei Noten entscheiden können und sich diese künstliche Stufung auf den weiteren Schulweg auswirkt?
Nahezu als tragisch und pädagogisch nicht zu rechtfertigen muss man es bezeichnen, dass solche zufallsbehafteten Noten in der 4. Klasse der bayerischen Grundschule dazu dienen, die weitere Schullaufbahn nicht nur zu empfehlen, sondern für längere Zeit festzulegen (trotz all der Durchlässigkeitsrhetorik der Kultusminister). Es soll an dieser Stelle ein scharfer Kritiker dieses Übergangswesens zu Wort kommen:
Wissenschaftliche Finsternis
Zwar ist hinlänglich bekannt, welche subjektiven Einflussfaktoren die Lehrerempfehlung beeinflussen, wie viele Schüler dadurch aber schon auf eine falsche Schullaufbahn geschickt wurden, ist wissenschaftlich nicht nur eine Grauzone, sondern eher völlige ‚Finsternis‘, aber für den Betroffenen keinesfalls Schicksal, sondern Unzulänglichkeit (um nicht zu sagen Fahrlässigkeit) unseres Schulsystems. (Frank 2012, S. 132)
Keinerlei Güte bei der Selektionsentscheidung
Auf dem Hintergrund der schultheoretischen Vorstellung, dass die gegliederte Industriegesellschaft eines selektiven Vorgriffs durch die Schule bedarf, sollte doch zumindest gesichert sein, dass die Messverfahren, auf denen die Selektionsprozesse beruhen, wenigstens annähernd wissenschaftlichen Messgütekriterien entsprechen. Davon sind wir aber weit entfernt. (Frank 2012, S. 183)
Unverantwortlich hohe Zahl an Fehlprognosen
Ingenkamp/Lissmann (2005) verweisen darauf, dass bei ca. 40% der Schüler das Eignungsurteil der Grundschullehrkräfte nicht mit dem erzielten Schulerfolg übereinstimmen. […] Diese Ergebnisse […] zeigen deutlich, dass die diagnostischen bzw. prognostischen Instrumentarien in der Grundschule unzureichend sind. Oder mit anderen Worten: Die Gefahr, einen Schüler in die falsche Schulform zu empfehlen, ist mit ca. 50% unverantwortlich hoch. (Frank 2012, S. 186)[39]
Wir fügen also unserem Diagramm einen weiteren Sektor hinzu, nämlich das „Notenunwesen“:

Fazit
Ich hoffe, es ist deutlich geworden, warum ich die weit verbreitete Meinung, dass Noten eine Leistung objektiv oder auch nur angemessen wiedergeben würden als „unaufgeklärt“ qualifiziere: Von frühester Kindheit an greifen Mechanismen, die auf ein Begabungspotenzial positiv, gar nicht oder negativ einwirken, so dass es zu Lebensäußerungen kommt, die wir Lehrerinnen und Lehrer als Leistung wahrnehmen, erkennen, anerkennen, wachrufen, fördern, abrufen, beurteilen und benoten – alles in dem schmalen Spektrum unserer heimatlichen schulischen Kultur und unserer eigenen Subjektivität.
„Leistung“ ist tatsächlich ein viel zu pauschaler Begriff für das, was unter der Oberfläche vor sich geht, bzw. aus welchen Wurzeln eine Antwort in einer Probearbeit erwächst. Und Noten sind nicht viel mehr als potemkinsche Kulissen, die Schülerinnen, Schülern und den Lehrkräften selbst den Schein von Objektivität vorgaukeln.
Wir sollten vorsichtig damit umgehen – mit dem Denken über Leistung wie mit dem Kind.
Fußnoten
[1] Der Intelligenzbegriff kann sehr eng gefasst werden, nämlich ausschließlich als das, was ein Intelligenztest misst. Er kann aber auch sehr weit gehen und viele Felder abdecken, wie zum Beispiel bei Howard Gardners Konzept der multiplen Intelligenzen.
Gardner, H. (1993). Frames of mind. The theory of multiple intelligences (2. ed. paper). New York: Basic Books.
[2] „Dass sich der Konsum von Alkohol, Drogen und Nikotin negativ auf die psychische Entwicklung von Kinder inklusive der Intelligenz auswirkt, ist unbestritten.“ S. 124–125. Stern, E. & Neubauer, A. (2013). Intelligenz. Große Unterschiede und ihre Folgen (2. Aufl.). München: Dt. Verl.-Anst., S. 109)
[3] „Woher aber nehmen die Anbieter solcher >>Leistungen<< die Chuzpe, solche >>Trainings<< als wirksam anzupreisen?“ Stern/Neubauer a.a.O. S. 110
[4] Hattie, J. (2009). Visible learning. A synthesis of over 800 meta-analyses relating to achievement. London: Routledge, S. 124.
Hattie, J. (2012). Visible learning for teachers. Maximizing impact on learning. London: Routledge, S. 79ff.
[5] „Da man “Begabung” nicht mehr, ohne sich in Widerspruch zur gesamten pädagogisch-psychologischen Forschungstradition zu setzen (Heinrich Roth 1968), als genetisch fixiertes Merkmal einer Person ansehen darf, das nur aufzuspüren und genügend genau zu bestimmen wäre, sondern das sich als innerhalb einer bestimmten Bandbreite von Möglichkeiten erst zu realisierendes “Produkt” erweist, müßte sich ein Lernangebot auch flexibel in der zeitlichen Dimension mit entsprechenden Anforderungen und Angeboten auf sich ändernde Leistungen einstellen.“ (Fend 1984, S. 1–2).
Fend, H. (1984, Februar). Zur Begabungsgerechtigkeit des Schulsystems. (Überarbeitete Fassung) Fachtagung „Bildungsverläufe in Arbeiterfamilien”.
[6] Hoyer, T. (2012). Begabungsbegriff und Leistung. Eine pädagogische Annäherung. Werte schulischer Begabtenförderung. Begabung und Leistung Karg-Hefte. Beiträge zur Begabtenförderung und Begabungsforschung. doi:10.25656/01:9028, S. 18.
[7] Stern und Neubauer a.a.O., S. 124–125.
[8] Bourdieu, P. (2015). Die verborgenen Mechanismen der Macht (Schriften zu Politik & Kultur, / Pierre Bourdieu. Hrsg. von Margareta Steinrücke ; 1, Durchgesehene Neuauflage der Erstauflage). Hamburg: VSA Verlag.
Bourdieu, P., Bolder, A. & Steinrücke, M. (2006). Wie die Kultur zum Bauern kommt (Schriften zu Politik & Kultur; 4, Unveränderter Nachdruck). Hamburg: VSA-Verlag.
[9] Die erste Tabelle gibt die Veränderung in der Haushaltssprache wieder. Die zweite Tabelle zeigt einen Zusammenhang von Zuwanderungshintergrund und erreichten Kompetenzen.
[10] Esser, H. (2021). Wie kaum in einem anderen Land…? Die Differenzierung der Bildungswege und ihre Wirkung auf Bildungserfolg, -ungleichheit und -gerechtigkeit : Band 1: Theoretische Grundlagen. Frankfurt: Campus Verlag. S. 119
[11] https://paedagokick.de/gast-59-falscher-lorbeer/ (2023)
[12] Diagramm von Hans Wocken: Die grauen Balken geben die Mathematikkompetenzen der Schüler:innen wider, die schwarze Linie die Quote für den Erhalt von Sozialleistungen nach SGB II.
[13] a.a.O. S. 117
[14] https://www.ifo.de/pressemitteilung/2023-04-18/chancenmonitor-2023-bildungschancen-haengen-stark-vom-elternhaus-ab; vgl. https://paedagokick.de/faktencheck-99-von-wegen-chancengleichheit/
[15] Weinert, F. E. (2012). Begabung und Lernen. Zur Entwicklung geistiger Leistungsunterschiede. In A. Hackl, C. Pauly, O. Steenbuck & G. Weigand (Hrsg.), Werte schulischer Begabtenförderung. Begabung und Leistung (Karg-Hefte. Beiträge zur Begabtenförderung und Begabungsforschung, Bd. 4, S. 23–34). Frankfurt, M., S. 29.
In gleichem Sinne auch Stern/Neubauer a.a.O. S. 90.
[16] „Kein Indiz der sozialen Zugehörigkeit, sei es die Haltung oder die Kleidung, die Ausdrucksweise oder der Akzent, das nicht Gegenstand der ‘petites perceptions’ der sozialen Klasse würde und einen, zumeist unbewussten Einfluss auf das Urteil der Lehrer hätte.“ (Bourdieu et al. 2006, S. 40–41).
[17] „[…] das, was ich einen Habitus nenne, ist eine inkorporierte Geschichte, eine Körper gewordene Geschichte, eingeschrieben in das Gehirn, aber auch in die Falten des Körpers, die Gesten, die Sprechweisen, den Akzent, in die Aussprache, die Ticks, in alles, was wir sind.“ (Bourdieu et al. 2006, S. 165)
„Als »Gewohnheit bildende Kraft« versieht die Schule diejenigen, die direkt oder indirekt unter ihren Einfluss gerieten, nicht mit lauter einzelnen und vereinzelten Denkschemata, sondern mit jener allgemeinen Disposition, auf verschiedenen Gebieten des Denkens und Handelns anwendbare Einzelschemata hervorzubringen, die man als gebildeten Habitus bezeichnen kann.“ (Bourdieu et al. 2006, S. 92)
[18] Nein, das ist keine Übertreibung. Als Rektor einer staatlichen Grund- und Mittelschule musste ich beispielsweise eine Kollegin während der Sommerferien aufschrecken, weil sich eine Arztfamilie gegen den nicht bestandenen Probeunterricht ihres Kindes vor Gericht mit dem Argument zur Wehr setzte, dass ein bestimmter Inhalt in der vierten Klasse von der Lehrerin nicht behandelt worden war.
[19] Zu den „Washback“-Effekten rechnet man das teaching to the test, das Tempo des Vorangehens, die Verengung des Curriculums und die Anpassung der Methoden auf das für Leistungstests und Probeunterricht Relevante. Nachzulesen beispielesweise bei
Maier & Uwe. (2010). Effekte testbasierter Rechenschaftslegung auf Schule und Unterricht. Ist die internationale Befundlage auf Vergleichsarbeiten im deutschsprachigen Raum übertragbar? Zeitschrift für Pädagogik 56 (1).
Rong, L. & Yi, P. (2021). A Review of Studies on the Washback Effect of National Matriculation English Test (NMET) in China (2011-2020). IRA International Journal of Education and Multidisciplinary Studies 17 (3), 186. doi:10.21013/jems.v17.n3.p10
[20] „Recognising, valuing and enhancing the teachers and school leaders with high levels of expertise makes the difference. It’s what works best.“
Hattie, J. (2016). What doesn’t work In education. The politics of distraction (Open ideas, Updated, January 2016). London [England]: Pearson; Canadian Electronic Library, S. 2
Damit wiederholt John Hattie eine alte Erkenntnis, die schon Helmut Fend hatte:
„Damals hat sich ein wichtiges Ergebnis herauskristallisiert, das den personalen Faktor wieder ins rechte pädagogische Licht rückte. Die Einstellungsstruktur der Lehrerschaft hat sich als bedeutsamer Faktor erwiesen. Je negativistischer und pädagogisch pessimistischer Lehrer Schülern gegenüberstanden, um so ungünstiger waren die pädagogischen Verhältnisse. Achtung vor dem Schüler, ohne Fixierung auf seine Launen und Bequemlichkeiten, partnerschaftlicher Umgang ohne anbiederndes Kumpanentum, Eingehen auf die Person der Schüler ohne pädagogische Wehleidigkeit – solche und ähnliche Konstellationen können wir teils mit Forschungsergebnissen als erzieherisch bedeutsam belegen, teils aber auch erst als wichtige pädagogische Grundhaltungen der Lehrerschaft intuitiv erahnen.“
Fend, H. (1982). Gesamtschule im Vergleich. Bilanz d. Ergebnisse des Gesamtschulversuchs. Weinheim & Basel: Beltz, S. 500f.
[21] „The message is that, if you take two students of the same ability, it matters not which school they attend, but it may matter greatly who their teacher is.“
Hattie, J. (2009). Visible learning. A synthesis of over 800 meta-analyses relating to achievement. London: Routledge., S. 72
[22] „Zusammenfassend kann man festhalten, dass sich selbst erfüllende Prophezeiungen ein gut dokumentiertes Phänomen darstellen, das in einer Vielzahl von Kontexten zu beobachten ist. Alleine die Erwartungen, die Personen über bestimmte Eigenschaften eines Wahrnehmungsobjekts aufweisen, können dazu führen, dass die Person sich dem Wahrnehmungsobjekt gegenüber so verhält, dass das Wahrnehmungsobjekt schließlich tatsächlich die vermuteten Eigenschaften entwickelt.“
Greitemeyer, T. (2008). Sich selbst erfüllende Prophezeiungen. In L.-E. Petersen & B. Six (Hrsg.), Stereotype, Vorurteile und soziale Diskriminierung. Theorien, Befunde und Interventionen (1. Aufl., S. 80–87), S. 83
Bestätigt auch durch die Hattiestudie a.a.O. S. 121f.
[23] Diagramm zu ausgewählten Lehrer-Effekten aus der Hattiestudie 2009
[24] Allemann-Ghionda, C., Auernheimer, G. & Grabbe, H. (2006). Beobachtung und Beurteilung in soziokulturell und sprachlich heterogenen Klassen. Die Kompetenzen der Lehrpersonen. In C. Allemann-Ghionda & E. Terhart (Hrsg.) Kompetenzen und Kompetenzentwicklung von Lehrerinnen und Lehrern. Ausbildung und Beruf. Zeitschrift für Pädagogik. (51. Beiheft), 250–266 [Themenheft], S. 262.
[25] a.a.O. S. 256
[26] Batruch, A., Autin, F., Bataillard, F. & Butera, F. (2018). School Selection and the Social Class Divide: How Tracking Contributes to the Reproduction of Inequalities. Personality & social psychology bulletin, 146167218791804. doi:10.1177/0146167218791804, o.S.
[27] „A growing body of literature interested in low-SES underachievement has shown that educational institutions create contexts that directly hinder low-SES students’ performance (…). Our research complements this research by providing evidence that reaching a high level of achievement, far from protecting low-SES pupils, actually induces additional academic obstacles. Indeed, their success seems to be threatening the social-class hierarchy in schools and provokes cognitive and behavioral reactions to undermine it.“
Batruch, A., Autin, F. & Butera, F. (2017). Re-Establishing the Social-Class Order: Restorative Reactions against High-Achieving, Low-SES Pupils. Journal of Social Issues 73 (1), 42–60. doi:10.1111/josi.12203, S. 55f.
[28] Staatsinstitut für Schulqualität und Bildungsforschung. (2014). Leistung neu denken. Empfehlungen, Ideen, Materialien mit CD (1. bis 4. Klasse) (ISB-Handreichungen), 1. Aufl.). Hamburg: Auer Verlag, S. 11.
[29] Alles a.a.O. S. 12f
Baumert, J. & Kunter, M. (2011). Das Kompetenzmodell von COACTIV. In M. Kunter, J. Baumert, W. Blum & M. Neubrand (Hrsg.), Professionelle Kompetenz von Lehrkräften. Ergebnisse des Forschungsprogramms COACTIV (S. 29–54). Münster: Waxmann, S. 32.
[31] „The variability between schools in most Western countries is far smaller than the variability within schools (Hattie 2015). For example, the 2009 PISA results for reading across all OECD countries shows that the variability between schools is 36 per cent, while the variance within schools is 64 per cent (OECD 2010).“ … So the aim is to bring the effect of all teachers on student learning up to a very high standard. The ‘No Child Left Behind’ policy should have been named ‘No Teacher Left Behind’.“
Hattie, J. (2016). What works best in education. The politics of collaborative expertise (Open ideas at Pearson). London [England]: Pearson; Canadian Electronic Library, S. 1f.
[32] Siehe dazu das Jahresgutachten 2007 des Aktionsrats Bildung: Blossfeld, H.-P. (2007). Bildungsgerechtigkeit (Aktionsrat Bildung: Jahresgutachten, Bd. 2007, 1. Aufl). Wiesbaden: VS, Verl. für Sozialwiss., S. 49f.
[33] „Die Leistungsbeurteilung, die im alltäglichen Unterricht notwendig ist, um die Lernvoraussetzungen der Kinder festzustellen und um didaktische Maßnahmen zu entwerfen, durchzuführen und auf ihren Erfolg hin zu überprüfen, lässt sich nicht mit einer Ziffer ausdrücken. Die Zensur erfüllt damit eine ihrer wesentlichen pädagogischen Funktionen nicht.“
Valtin, R. (2002). Grundschule und Leistungsbeurteilung – Anspruch und Wirklichkeit. Zusammenschau der Ergebnisse. In R. Valtin (Hrsg.), Was ist ein gutes Zeugnis? Noten und verbale Beurteilungen auf dem Prüfstand (S. 140–148). Weinheim, München: Juventa., S. 146
[34] „Wie schon Ingenkamp (1969/1995) in seiner Studie zum Vergleich von Testleistungen und Zensuren in Mathematik zeigte, waren auch in unserer Studie die Noten aus verschiedenen Klassen nicht vergleichbar. Für ein und dieselbe Testleistung erhielten Kinder in unterschiedlichen Klassen Zensuren zwischen Eins und Fünf.“ (Valtin a.a.O. S. 146)
[35] Kahneman, D., Sibony, O. & Sunstein, C. R. (2021). Noise. A flaw in human judgment. London: William Collins.
[36] „Wie schon Ingenkamp beklagte, ist von der Zensur nicht auf vergleichbare Merkmale eines Individuums zu folgern, sondern auf die Rangposition in einer bestimmten Schulklasse, in der sich der Schüler oder die Schülerin weitgehend zufällig befinden (…). Das bedeutet, dass nach wie vor der Zufall der Klassenzugehörigkeit darüber entscheidet, ob ein Kind in der Schule gut oder schlecht ist bzw. zu Erfolg oder Versagen gelangt – mit allen misslichen Auswirkungen auf die Persönlichkeitsentwicklung des Kindes und mit lebensentscheidender Bedeutung für schulische Ausleseprozesse.“ (Valtin a.a.O. S. 146)
[37] Zum Beispiel hier: Hoferichter, F., Lätsch, A., Lazarides, R. & Raufelder, D. (2018). The Big-Fish-Little-Pond Effect on the Four Facets of Academic Self-Concept. Frontiers in psychology 9, 1247. doi:10.3389/fpsyg.2018.01247
[38] „Was die Auswirkungen der Notengebung betrifft, zeigen die längsschnittlichen Analysen, dass die Befürchtungen der Gegner der Notengebung sich zumindest teilweise bestätigten: Kinder mit schlechten Noten entwickeln eine stärkere Leistungsangst, vor allem im Bereich der Besorgtheit. In Bezug auf die Lernmotivation konnten wir Anzeichen für das beobachten, was Sacher (…) als Notenangst und Notengeilheit bezeichnet: eine stärkere Misserfolgsorientierung in der Leistungsmotivation der Kinder mit schlechten Noten sowie eine stärkere externale Motivation bei Kindern mit guten Noten.“ (Valtin a.a.O. S. 147)
[39] Frank, N. (2012). Intelligenz, Sozialschicht und Schulerfolg (Berichte aus der Pädagogik). Aachen: Shaker (Zugl.: Augsburg, Univ., Habil.-Schr., 2012). Siehe Auszüge hier: https://paedagokick.de/faktencheck-15-intelligenz-und-schulerfolg/
1 comments On Sichtweisen #98: Ihr nennt es „Leistung“
Pingback: Neusprech #13: "Mansplaining!" - Pädagokick ()