Fallstudie: KI-Klausurkorrektur an der DHBW

Ausgangslage

120 Klausuren. 6 Seiten pro Klausur. 4 inhaltlich unterschiedliche Aufgaben, darunter Freitext- und Rechenaufgaben. Die Korrektur war keine Aufgabe für einen Nachmittag, sondern eine für mehrere Abende.

Das Problem bei langen Korrekturdurchläufen ist selten das Tempo, sondern die Konsistenz. Wer am ersten Abend eine Klausur mit 18 von 20 möglichen Punkten bewertet, kann am dritten Abend dieselbe Leistung mit 16 Punkten bewertet haben — nicht aus Böswilligkeit, sondern weil Bewertungsmaßstäbe ohne äußere Kontrolle driften. Es ist ein verbreitetes, aber selten offen diskutiertes Problem in der Hochschullehre.

Der Dozent an der DHBW wusste das. Er hatte die Erfahrung aus früheren Semestern. Und er suchte eine Lösung, die nicht nur Zeit spart, sondern auch dieses strukturelle Problem adressiert.

120 Klausuren in Einzelkorrektur bedeuten: die letzten 20 Klausuren werden zwangsläufig anders bewertet als die ersten 20 — auch wenn niemand das beabsichtigt.

Herausforderung

Der Einsatz war kein Pilotprojekt unter kontrollierten Laborbedingungen. Die Anforderungen entsprachen realen Gegebenheiten an einer deutschen Hochschule:

Zeitdruck zwischen Prüfungsende und Noteneingabe: keine Wochen, sondern wenige Tage.
Konsistente Bewertung über alle 120 Klausuren hinweg, ohne zweiten Korrektor.
Kein separates Korrektur-Team verfügbar: die Verantwortung lag bei einer Person.
Handschriftliche Antworten: kein automatisiertes Scan-Tool, das Klartextexporte liefert.

Die letzte Herausforderung war die kritische. Handschriften variieren stark. Die Frage war, ob ein KI-System damit umgehen kann — nicht nur mit gedruckten oder getippten Texten, sondern mit echten studentischen Handschriften unter Prüfungsbedingungen.

Durchführung

Der Ablauf war bewusst einfach gehalten. Kein IT-Projekt, keine Systemintegration, keine Schulungswochen. Der Dozent hat Korrex an einem Abend eingerichtet und am nächsten Morgen mit dem Korrekturprozess begonnen.

1 Musterlösung als PDF hochgeladen — mit Teilpunkten je Aufgabe. ~15 Min.
2 120 Klausuren (PDF oder Bilddatei) als Batch hochgeladen. Korrex beginnt die Korrektur im Hintergrund.
3 Korrex bewertet jede Klausur anhand der Musterlösung, erkennt Handschriften und markiert Fälle mit niedriger Erkennungssicherheit automatisch zur Überprüfung.
4 Ergebnisübersicht geprüft. Einzelne Grenzfälle manuell nachkorrigiert: 8 von 120 Klausuren. ~60 Min.
5 Notenexport als Excel für die Noteneingabe im Hochschulsystem. <5 Min.

Die Musterlösung war der entscheidende Vorbereitungsschritt. Wer dort präzise mit Teilpunkten arbeitet, bekommt von Korrex präzise Ergebnisse zurück. Der Aufwand für die Musterlösung ist nicht zusätzlich, er ist ohnehin Teil jeder Prüfungsvorbereitung.

Ergebnisse

Die Zahlen sind deutlich. Aber die qualitative Aussage ist genauso relevant: 112 von 120 Klausuren wurden ohne Eingriff des Dozenten korrekt und konsistent bewertet. Für 8 Klausuren war eine manuelle Prüfung nötig — alle markiert, keine übersehen.

Kennzahl	Vorher	Nachher
Gesamtkorrekturzeit	~14 Stunden	~2,5 Stunden
Zeit pro Klausur (geschätzt)	~7 Minuten	~1,25 Minuten
Zeitersparnis	—	82%
Bewertungskonsistenz	Manuell, driftanfällig	Identische Grundlage für alle 120
Nachkorrekturbedarf	—	8 Klausuren (6,7%)
Handschrifterkennungsrate	—	~93% ohne manuelle Hilfe

Die 93% Handschrifterkennung sind kein Selbstläufer. Korrex hat die restlichen 7% selbst als unsicher eingestuft und zur Prüfung markiert. Das ist der entscheidende Unterschied zu einem System, das einfach eine Bewertung ausgibt: Unsicherheit wird explizit gemacht, nicht versteckt.

Von 14 Stunden auf 2,5 Stunden — KI-Klausurkorrektur an der DHBW

Ausgangslage

Herausforderung

Durchführung

Ergebnisse

Lessons Learned

Musterlösung mit Teilpunkten formulieren

Handschriften: 93% ohne Eingriff

Nachkorrekturen einplanen

Für die eigene Veranstaltung testen