Grundmodell der Leistungsbewertung
Abstract
Prüfe fachinhaltlich - werte kognitiv! Jeder Leistungsnachweis prüft durch fachinhaltlich konzentrierte Fragestellungen, wie weit die kognitive Leistungsfähigkeit im Umgang mit einem Thema entwickelt ist. Hierfür werden die beiden Dimensionen „Verständnistiefe“ und „Anspruchsniveau“ erfasst.
Keywords
- Punkteverteilung
- Prüfungskontrolle
- Lernerfolg
- Leistungsbewertung
- Feedback
Abkürzungen
- FKe
- Faktenkenntnis
- MKe
- Methodenkenntnis
- MKo
- Methodenkompetenz
- AKo
- Anwendungskompetenz
1. Einführung
In jedem Lehr-Lernprozess ist es notwendig, die erreichten Erfolge zu überprüfen. Das hat einerseits Bedeutung für den Lernenden, andererseits ist es aber auch wichtig für den Lehrenden und den Sponsor des Kurses, die erreichten Erfolge zu messen und zu dokumentieren, um den wirtschaftlichen und persönlichen Nutzen zu ermitteln und zu rechtfertigen.
2. Bewertungsprinzipien
Für die Bewertung von Lernerfolgen sind folgenden Ziele zu erreichen:
- Disziplinunabhängigkeit der Maßstäbe für Leistungsbewertungen
- Themenneutralität der Bewertungssystematik
- beliebige Skalierbarkeit des Bewertungsprinzips auf unterschiedlichste Entwicklungsstände der Lehrenden, Lernenden und des Lernprozesses selbst
- Bestimmung des Schwierigkeitsgrades eines Tests direkt aus der Punkteverteilung
- Kompatibilität zu allen Notenskalen, die irgendwie auftauchen können (international)
- unter Beibehaltung der hohen Flexibilität soll das System zudem äußerst simpel, transparent, schüler-, eltern- und lehrersicher sein (Simplizität)
- Technisch und manuell bequem umsetzbar
- Selektivität, d.h. die saubere Trennung von unterschiedlichen Qualitäten der Kenntnisstände
2.1 Disziplinunabhängigkeit
Ein Bewertungsprinzip muss zwingend fachunabhängig sein. Eine disziplinde-pendente Evaluierung der Leistungen würde beim Lernenden die Fähigkeit trüben, seine Leistungen einheitlich einzuschätzen.
Disziplinunabhängigkeit heißt in diesem Zusammenhang, dass mit ein und demselben System sowohl die gestalterische Leistung beim Malen eines Bildes wie die rationale Leistung beim Rechnen einer mathematischen Aufgabe bewertbar sein muss, ohne dabei einen Wertebruch zu riskieren. Das ist freilich problemlos möglich, da die zugrunde liegenden kognitiven Prozesse immer gleich ablaufen. Diese Aussage stützt sich darauf, dass bei ausnahmslos allen kognitiven Prozessen die gleichen drei funktional unterscheidbaren Assoziationscortices beteiligt sind. Es unterscheiden sich bei einseitig gestalteter Ausbildung zwar die quantitativen Beiträge der einzelnen Cortices zu einem Resultat kognitiver Arbeit, aber die Bewertbarkeit bleibt, dank der Gleichheit der Prozesse, immer bestehen! [1][2]
Bewertungskriterien dürfen nicht davon abhängen, ob nun ein Ton im Gesang getroffen wurde oder eine bestimmte Zeit beim 100 m Lauf erzielt wurde, ob eine Aufgabe nun 10 Rechenschritte hat oder ein Vokabeltest 20 oder nur 5 Worte überprüft. Alle diese fachspezifischen Parameter müssen jedoch in das zu erstellende System hineinpassen ohne modifiziert zu werden!
2.2 Themenneutralität
Innerhalb einer Fachdisziplin sollen unterschiedlich gelagerte und unterschiedlich anspruchsvolle Themen nach einem einheitlichen Maßstab bewertbar sein. Dem Lehrenden muss die Möglichkeit offen stehen, grundverschiedene Testmethoden zu nutzen und die damit erhobenen Ergebnisse dennoch nach gleichen Maßstäben bewerten zu können. Zudem muss ein und dasselbe Thema von unterschiedlichen Lehrkräften immer in gleicher Weise bewertet werden, was zur Zeit praktisch nicht realisiert wird, wenn nicht der identisch gleiche Test mit gleicher Bewertung geschrieben wird, was aber den Bezug zum Lehrstil und den konkreten Inhalten in der Vermittlungspraxis der doch zum Teil stark differierenden Lehrerpersönlichkeiten verloren geben würde.
2.3 Skalierbarkeit
Je nach Ausbildungsziel und Entwicklungsstand der Lehrenden und Lernenden, sowie nach dem jeweiligen Fortschritt des Lehrbetriebes, muss man die Ansprüche an die Bewertungskriterien anpassen können. So ist die Prozentrechnung für einen Schüler der 6. Klasse ein wirklich großes Problem, für einen Studenten der Mathematik im 5. Semester hingegen sollte sie kein wirklich anspruchsvolles Problem mehr darstellen. Entsprechend wäre die Bewertung einer entsprechenden Aufgabenlösung für einen Schüler der 6. Klasse anders auszulegen als für den Mathematikstudenten.
Das Bewertungsschema sollte dennoch auf dem gleichen Prinzip beruhen um die Entwicklung des Lernenden darstellen zu können. Weiterhin sollte es möglich sein, unterschiedliche Komplexitäten und Schwierigkeitsgrade von Inhalten bei gleicher Zielgruppe innerhalb eines einheitlichen Systems bewerten zu können, ohne dabei das System zum Nachteil der einen oder anderen Schülergruppe adaptieren zu müssen. In der Praxis wird damit dem Problem zunehmender Heterogenität der Klassen vor allem in der beruflichen Erstausbildung und der Weiterbildung Rechnung getragen. Es soll quasi möglich sein, mehr als 100 % zu erreichen ohne dem Rest der Klasse den Nachteil der Unmöglichkeit der Note 1 zuzumuten.
2.4 Schwierigkeitsgrad
Der Schwierigkeitsgrad eines Leistungsanspruches ist wesentlich für die Wertigkeit von Zensuren. Da man bei starkem Leistungsgefälle zwischen verschiedenen Klassen einer Ausbildungsrichtung nicht überall den gleichen Inhalt vermitteln kann und entsprechend auch nicht überall die gleichen Leistungstests durchführbar sind, muss ein Bewertungssystem also eine Möglichkeit inkludieren, die erreichten Zensuren in ihrer Wertigkeit zu gewichten. So lassen sich letztendlich aussagekräftige Leistungsprofile erstellen, die eine Vergleichbarkeit erreichter Noten und eine saubere Evaluierung der tatsächlichen Leistungen ermöglichen.
2.5 Kompatibilität
Ein allgemeingültiges Bewertungskonzept muss sich wegen der Unveränderbarkeit bestehender Systeme in diese nahtlos einfügen. Entsprechend muss ein Bewertungssystem im Sinne dieser Arbeit letztendlich Punkte liefern, die auf einzelne Aufgabenlösungen verteilt werden können und mit den üblichen Zensurenskalen in inhaltlicher Weise soweit übereinstimmen, dass es keine wesentlichen Brüche gibt, die Vorteile des neuen Systems aber dennoch zum Tragen kommen ohne neue Nachteile zu produzieren.
2.6 Flexibilität und Simplizität
Ein System mit einer so großen Anzahl von zum Teil recht komplexen Forderungen muss zugleich in seiner Handhabung sehr einfach und technisch wie manuell nutzbar sein. Es muss für alle direkt wie indirekt Beteiligten transparent sein. Entsprechend muss es für den Schüler genauso verständlich sein wie für dessen Eltern und es muss für jede Lehrkraft eindeutig und ohne großen Aufwand umsetzbar sein (Akzeptanzproblem). Die Lehrkraft muss zudem die erhaltenen Ergebnisse einfach kommunizieren und jederzeit vertreten können. Weiterhin muss das System von Instanzen wie dem Kultusministerium oder gar dem Regionalschulamt verstanden und anerkannt werden und den Forderungen dieser Instanzen gerecht werden. In der Folge muss das System für Personalmanager in der Wirtschaft transparent und praktisch sein, es muss hier einen leicht nachvollziehbaren und sofort wirkenden Zusatznutzen gegenüber bisherigen Zeugnissen haben.
2.7 Umsetzbarkeit
In der Praxis arbeiten nicht alle Lehrkräfte mit einem Computer. Entsprechend muss es möglich sein, auch diesen Kolleginnen und Kollegen einen Zugang zur Nutzung des Bewertungssystems zu eröffnen. Rein rechnerisch bedeutet das, dass alle mit dem Modell in Beziehung stehenden Berechnungen im Kopf ausführbar sein müssen, die verwendeten Skalen sollten also nur ganze Zahlen verwenden und möglichst leicht zu merken sein.
2.8 Selektivität
Das Bewertungssystem soll jedoch neben den genannten Randbedingungen vor allem eines leisten: Es soll die unterschiedlichen Lernstrategien und die verschiedenen Strategien der Schüler zum Erreichen möglichst guter Noten mit möglichst wenig Aufwand bestmöglich kompensieren. Anwendungsbereitem Wissen führt gegenüber reinem Auswendiglernen eher zu einer guten oder sehr guten Bewertung.
3. Lernpsychologie
Der Lehr- und Lernprozess wird durch eine Vielzahl von Modellen in der Neurologie, der Psychologie und der Pädagogik veranschaulicht. Alle diese Modelle haben für den Zweck, welchem zu dienen sie entworfen wurden, vieles geleistet. Es soll daher nicht noch ein neues Modell hinzugefügt werden. Vielmehr soll ohne eine tiefer gehende Dokumentation der einzelnen Entscheidungsschritte eine kleine Begriffswelt geschaffen werden, die als Anschauung dienlich ist, um nachfolgend brauchbare Ergebnisse zu erzielen.
Die Bewertung von erbrachten Lernleistungen geschieht anhand von zwei Dimensionen:
- Die Verständnistiefe bewertet, wie weit der Lerner in der Kompetenzentwicklung zu einem Lernfeld oder Lerngegenstand voran geschritten ist (Tiefe der kognitiven Verarbeitung).
- Das Anspruchsniveau bewertet, wie schwierig das Thema des Tests relativ zum aktuellen Entwicklungsstand des Lerners ist.
3.1 Verständnistiefe
Als Maß für die Verständnistiefe sollen in dieser Arbeit jene drei Phasen des Erwerbs von Fertigkeiten verstanden werden, die von FITTS und POSNER in [3] erkannt wurden:
- Kognitive Phase: Ausbildung einer deklarativen Encodierung von Fertigkeiten
- Assoziative Phase: Fehler finden und eliminieren, Verbindungen zwischen den gelernten Fakten herstellen, wobei deklaratives Wissen nicht unbedingt durch prozedurales Wissen ersetzt werden muss, auch eine Koexistenz ist nach [4] möglich.
- Autonome Phase: Verbesserung der Geschwindigkeit und Qualität der Fertigkeiten, Verbessern und/oder Neuentwickeln von Produktionsregeln
Diese Begrifflichkeiten lassen sich nun an ihren Ergebnissen zusammenfassen. Die kognitive Phase liefert etwas, was hier Faktenkenntnis heißen soll. Die assoziative Phase liefert Methodenkenntnis und/oder Methodenkompetenz, was sich in sofern unterscheidet, als dass die reine Kenntnis von Methoden noch keine Anwendbarkeit derselben garantiert, während die Methodenkompetenz die Kenntnis einschließt und die Verwendbarkeit der Kenntnisse garantiert. Die autonome Phase liefert anwendungsbereite Kenntnisse. Es soll hier von Anwendungskompetenz gesprochen werden.
3.2 Anspruchsniveau
Eine erreichte Kenntnis oder Kompetenz ist relativ zum aktuellen Fortschritt in der Lernbiografie zu sehen und es wird hier ein fachinhaltlicher Fokus gesetzt.
- Basiswissen
stellt das für den aktuell anstehenden Lernschritt notwendige und erwartbare Grundlagenwissen dar - Hauptwissen
fasst die im aktuellen Lernschritt zu erwerbenden Themen zusammen - Detailwissen
bezeichnet jene Themen, die über den Durchschnitt hinaus gehen, also die Themen des Hauptwissens im Detail vertiefen - Zusatzwissen
wird in individuellen und oft über die geplanten Lehrveranstaltungen hinaus gehenden Lerneinheiten erworben und geht über die curricularen Vorgaben hinaus - Expertenwissen
dient der individuellen Vertiefung besonders interessierter Lernender, die für bestimmte Themen eine außergewöhnliche Expertise anstreben
4. Bewertungsweise
Die Bewertung erfolgt entsprechend dem kognitiven Anspruch der nachgewiesenen Leistungen. Eine reine Faktenkenntnis wird geringer bewertet als eine nachgewiesene Anwendungskompetenz, mitgebrachtes Basiswissen niedriger als über die Erwartungen hinaus erworbenes Detailwissen. Die Leistungsbewertung wird damit sehr transparent, reproduzierbar und liefert Lehrenden wie Lernenden eine sehr konkrete Aussage darüber, wie weiter zu arbeiten ist.
4.1 Punktzahlen
| Verständnistiefe | Punkte |
|---|---|
| Faktenkenntnis (FKe) | 1 |
| Methodenkenntnis (MKe) | 2 |
| Methodenkompetenz (MKo) | 3 |
| Anwendungskompetenz (AKo) | 4 |
Tabelle 1: Bewertung von Verständnistiefen
| Anspruchsniveau | Faktor |
|---|---|
| Basiswissen | 1 |
| Hauptwissen | 2 |
| Detailwissen | 3 |
| Zusatzwissen | 4 |
| Expertenwissen | 5 |
Tabelle 2: Bewertung von Anspruchsniveau von Lernleistungen
Um nun die Punktbewertung für eine Aufgabe zu definieren, wird das nachgefragte Thema einfach in die „didaktische Tabelle“ eingeordnet, welche das Anspruchsniveau in Relation zum aktuellen Wissensstand des Lernenden, zum Ausbildungsziel und zur konkreten Lernsituation setzt.
Es stellt sich also folgende, einfache Formel für die Punktberechnung einer Aufgabe dar:
4.2 Punkteverteilung
Die Bewertung innerhalb einer Aufgabe geschieht in Stufen zu 25%. Dies ist darin begründet, dass der Bewertende nun klar entscheiden muss, ob etwa die geforderte Kenntnis bzw. Kompetenz vollumfänglich, überwiegend, zur Hälfte, in Ansätzen oder gar nicht vorhanden ist. Eine feinere Abstufung, etwa in 10% Stufen oder gar noch feiner, liefert eine suggestive Genauigkeit, die recht unrealistisch wäre. Die Bewertung geschieht nach dem Grundsatz in dubio pro reo und damit eindeutig.
5. Zusammenfassung
Die Bewertung erfolgt gemäß den vorgegebenen Erwartungen gemäß den curricularen Vorgaben. Es wird also eine absolute Leistungsbewertung favorisiert, keine relative. Es ist schließlich ein Lernziel zu erreichen und das Maß für das Erreichen dieses Ziels ist in Leistungsnachweisen gesucht. Die Bewertung wird abgestuft nach den erreichten Verständnistiefen und Anspruchsniveaus der Aufgaben, welches wiederum relativ zum aktuellen Lernstadium bestimmt wird. Die Bewertung geschieht nach dem Grundsatz „in dubio pro reo“ und damit eindeutig.
Quellen
- [1]
- Alzheimer C., Integrative Funktionen des ZNS, Hauptvorlesung Physiologie, LMU München, 1998
- [2]
- Krieger S., Funktionell isolierbare kognitive Subprozesse und schizophrene Störungen, Inaugural-Dissertation zur Erlangung des Grades eines Doktors der Humanbiologie, FB Humanmedizin, Gießen: Justus-Liebig-Universität, 1999
- [3]
- Fitts P. M., Posner M. I., Human Performance, Belmont, CA: Brooks College, 1967
- [4]
- Sleeman D., Brown J.S., Intelligent tutoring systems, New York: Academic Press, 1982
Feedback geben