Im Bildungsbereich stell sich immer wieder die Frage, welche Unterrichtsmethoden eigentlich effektiver sind als andere. Damit verbunden ist auch immer der Wunsch nach Vergleichsstudien. Eine schwierige Kiste.
Durch ein kurzes Twitter-Intermezzo mit jeanpol, otacke und herrlarbig über diesen Forenbeitrag fühle ich mich dazu angeregt, mal was darüber zu bloggen.
Methodenvergleiche sind schwierig: Man muss versuchen, einen Schulversuch so zu gestalten, dass die Methode als unabhängige Variable (bzw. als Faktor) eingeht und sich keine anderen „Schmutzvariablen“ einmischen. So kann man beispielsweise nicht Methode A von Lehrer X in Klasse i durchführen lassen und Methode B von Lehrer Y in Klasse j, weil hier viel mehr variiert wird als nur die Methode: Wenn Klasse j besser abschneidet, dann muss das nicht an Methode B liegen, sondern könnte auch an Lehrer Y liegen oder einfach daran, dass Klasse j besser ist. Okay, das wäre ziemlich offensichtlich nicht gut „designed“, aber – wenn man es besser machen will, wird’s schon ziemlich schnell ziemlich schwierig. Wie eliminert man denn z.B. den Einfluss der Klasse? Man benötigt vermutlich einige Klassen mehr, sodass mehrere Klassen mit derselben Methode unterrichtet werden. Dennoch sind die Versuchspersonen in Klassenverbänden organisiert, die Stichprobe ist „geklumpt“. Hier gibt es zwar zahlreiche statistische Methoden, mit denen dies berücksichtigt werden kann. So könnte man testen, ob Interaktionseffekte mit dem Faktor „Klasse“ auftreten, man macht Mehrebenenanalysen usw. Dennoch ist das mit einem erheblichen Aufwand verbunden: Zig mal muss derselbe (!) Unterricht in Klassen gehalten werden, die auf die verschiedenen Versuchsbedingungen zufällig verteilt wurden, und man muss alle anderen Einflussfaktoren möglichst konstant halten. Unterrichte also bitte nicht eine der Klassen in der 6. Stunde, während die anderen in der 1. Stunde unterrichtet wurden. Und sorge am besten dafür, dass Jonas den Micha in der Pause vorher nicht verkloppt hat, weil das Klassenthema sein wird. Ja, und stelle sicher, dass sich der Lehrer einer Klasse in der Stunde zuvor nicht abfällig über Unterrichtsforschung äußert. Oder am besten nicht mal nur eine abfällige Geste macht. Und sorge dafür, dass die Schüler alle gesund sind, damit dir kurz vor dem Versuch keine Schülerin vor die Tür kotzt und das für Aufregung sorgt (ist uns mal passiert). Am besten also, du schaffst möglichst künstliche Situationen, in denen all diese zusätzlichen Faktoren keine Rolle mehr spielen – und bewegst dich weit weg von realistischen Unterrichtssituationen. Mache dich darauf gefasst: Anschließend werden die Kritiker kommen und dir sagen, dass du zwar schöne Unterschiede in deinen künstlichen Stunden gemessen hast, aber wie ist denn die Relevanz deiner Studie für echten Unterricht? (Stichworte für die näher Interessierten: interne und externe Validität)
Nimmt man für solche Stunden jetzt eigentlich den „richtigen“ Lehrer der Klasse oder einen „Pseudolehrer“, der zum Forschungsteam gehört? Besser den richtigen Lehrer, oder? Damit es möglichst realistisch bleibt. Dumm nur, wenn der vorurteilsbehaftet deine Methode anwenden – dann kannst du die Stunde gleich in die Tonne kloppen, weil so etwas mit Sicherheit auf die Schüler wirkt. Also doch besser einen Pseudolehrer? Dumm nur, dass der weiß, welche Methode wünschenswerterweise besser sein soll und somit evtl. subtile Signale aussendet und sich dementsprechend verhält.
Es ist ein echtes Kreuz mit Vergleichsstudien. All diese Punkte könnte man aber hinbekommen. Mit erheblichem Aufwand. Und dem Ergebnis, dass die Klassen, die mit Methode A unterrichtet wurden, in einem Lernerfolgstest um 4,5% besser abschneiden als die Klassen, die mit Methode B unterrichtet worden sind. Ein voller Erfolg also!
Man bekommt es hin. Allerdings gibt es noch ein weiteres, tiefer liegendes Problem, das nicht methodischer, sondern prinzipieller Natur ist: Es gibt nicht nur fachliche Lernziele. Oft wird aber nur an diese bei Methodenvergleichen gedacht (Die Schüler sollen anschließend z.B. mehr über das Mittelalter wissen). Oft bedingen andere Methoden aber andere Lernziele.
Beispiel A: LdL. Wenn man LdL einsetzt, dann möchte man nicht, dass die Schüler anschließend mehr Fachwissen haben. Das ist zumindest nicht das erste Ziel, das man damit verfolgt. Ja, man ist sogar froh, wenn sie aus fachlicher Sicht gleich viel lernen wie ohne LdL. Man würde aber sogar vielleicht in Kauf nehmen, dass sie sich weniger Fachwissen aneignen, dafür aber anderes lernen: Sie sollen lernen, sich ohne Angst im Unterricht zu äußern. Sie sollen lernen, keine Angst vor Fehlern zu haben. Sie sollen lernen, dass es sich lohnt, wenn man sich für etwas mit ganzem Nachdruck einsetzt. Sie sollen lernen, sich selbst nicht zu wichtig zu nehmen. Sie sollen lernen, dass sie Teil von Gruppen sind, und dass der Erfolg der Gruppe mit von ihrem Einsatz abhängt (Netzsensibilität, Partizipationsfähigkeit, …). Und und und. Und das wichtigste: Eine solche Methode muss über einen längeren Zeitraum mit einer Klasse eingeübt werden, damit sie diese Früchte trägt. Etwas, das man gerne in Kauf nimmt, wenn man die damit verfolgten Lernziele für wichtiger hält als die „herkömmlichen“. Methoden über einen langen Zeitraum einsetzen ist allerdings auch etwas, das Forschern gar nicht gefällt: Was da alles für Störvariablen mit einfließen können… Außerdem muss der Lehrer von der Methode überzeugt sein. Manoman – ich würde sagen: Vergleichende Effektivitätsforschung? Vergiss es.
Beispiel B: Computer in der Schule. Eine so alte wie sinnlose Frage ist, ob man mit computerunterstützten Methoden besser lernt als ohne. Es hängt – wie bei allen Methoden – von Schülereigenschaften, Lehrereigenschaften und ganz vielen anderen Variablen ab. Aber natürlich setze ich auch (!) den Computer in der Schule ein, nämlich a) wenn es passt und b) weil ich auch andere Lernziele damit verfolge: Die Schüler sollen lernen, mit dem Computer umzugehen, Probleme unter Nutzung des Internets zu lösen, digitale Produkte zu erzeugen usw. Und, glaubt mir: Man lernt mit Methoden, in denen Informationstechnologie eingesetzt wird, einfach besser digitale Produkte zu erzeugen als ohne.
Fazit: Unterrichtssituationen sind komplex und machen es schwer, valide Vergleichsstudien zum Einsatz von Unterrichtsmethoden durchzuführen. Es ist schwer, es ist nicht unmöglich, aber man muss sich fragen, ob es sinnvoll ist.