Ausgangslage
120 Klausuren. 6 Seiten pro Klausur. 4 inhaltlich unterschiedliche Aufgaben, darunter Freitext- und Rechenaufgaben. Die Korrektur war keine Aufgabe für einen Nachmittag, sondern eine für mehrere Abende.
Das Problem bei langen Korrekturdurchläufen ist selten das Tempo, sondern die Konsistenz. Wer am ersten Abend eine Klausur mit 18 von 20 möglichen Punkten bewertet, kann am dritten Abend dieselbe Leistung mit 16 Punkten bewertet haben — nicht aus Böswilligkeit, sondern weil Bewertungsmaßstäbe ohne äußere Kontrolle driften. Es ist ein verbreitetes, aber selten offen diskutiertes Problem in der Hochschullehre.
Der Dozent an der DHBW wusste das. Er hatte die Erfahrung aus früheren Semestern. Und er suchte eine Lösung, die nicht nur Zeit spart, sondern auch dieses strukturelle Problem adressiert.
Herausforderung
Der Einsatz war kein Pilotprojekt unter kontrollierten Laborbedingungen. Die Anforderungen entsprachen realen Gegebenheiten an einer deutschen Hochschule:
- Zeitdruck zwischen Prüfungsende und Noteneingabe: keine Wochen, sondern wenige Tage.
- Konsistente Bewertung über alle 120 Klausuren hinweg, ohne zweiten Korrektor.
- Kein separates Korrektur-Team verfügbar: die Verantwortung lag bei einer Person.
- Handschriftliche Antworten: kein automatisiertes Scan-Tool, das Klartextexporte liefert.
Die letzte Herausforderung war die kritische. Handschriften variieren stark. Die Frage war, ob ein KI-System damit umgehen kann — nicht nur mit gedruckten oder getippten Texten, sondern mit echten studentischen Handschriften unter Prüfungsbedingungen.
Durchführung
Der Ablauf war bewusst einfach gehalten. Kein IT-Projekt, keine Systemintegration, keine Schulungswochen. Der Dozent hat Korrex an einem Abend eingerichtet und am nächsten Morgen mit dem Korrekturprozess begonnen.
- 1 Musterlösung als PDF hochgeladen — mit Teilpunkten je Aufgabe. ~15 Min.
- 2 120 Klausur-PDFs als Batch hochgeladen. Korrex beginnt die Korrektur im Hintergrund.
- 3 Korrex bewertet jede Klausur anhand der Musterlösung, erkennt Handschriften und markiert Fälle mit niedriger Erkennungssicherheit automatisch zur Überprüfung.
- 4 Ergebnisübersicht geprüft. Einzelne Grenzfälle manuell nachkorrigiert: 8 von 120 Klausuren. ~60 Min.
- 5 Notenexport als Excel für die Noteneingabe im Hochschulsystem. <5 Min.
Die Musterlösung war der entscheidende Vorbereitungsschritt. Wer dort präzise mit Teilpunkten arbeitet, bekommt von Korrex präzise Ergebnisse zurück. Der Aufwand für die Musterlösung ist nicht zusätzlich, er ist ohnehin Teil jeder Prüfungsvorbereitung.
Ergebnisse
Die Zahlen sind deutlich. Aber die qualitative Aussage ist genauso relevant: 112 von 120 Klausuren wurden ohne Eingriff des Dozenten korrekt und konsistent bewertet. Für 8 Klausuren war eine manuelle Prüfung nötig — alle markiert, keine übersehen.
| Kennzahl | Vorher | Nachher |
|---|---|---|
| Gesamtkorrekturzeit | ~14 Stunden | ~2,5 Stunden |
| Zeit pro Klausur (geschätzt) | ~7 Minuten | ~1,25 Minuten |
| Zeitersparnis | — | 82% |
| Bewertungskonsistenz | Manuell, driftanfällig | Identische Grundlage für alle 120 |
| Nachkorrekturbedarf | — | 8 Klausuren (6,7%) |
| Handschrifterkennungsrate | — | ~93% ohne manuelle Hilfe |
Die 93% Handschrifterkennung sind kein Selbstläufer. Korrex hat die restlichen 7% selbst als unsicher eingestuft und zur Prüfung markiert. Das ist der entscheidende Unterschied zu einem System, das einfach eine Bewertung ausgibt: Unsicherheit wird explizit gemacht, nicht versteckt.