Aktuelles

English

Mit DAKODA dem Sprachenlernen auf der Spur

[10.04.2026]

Wie lernen Menschen Deutsch? Das CATALPA-Projekt DAKODA hilft Forschenden, mehr darüber herauszufinden.


Eine Reihe von fünf Würfeln mit der Beschriftung A1 bis C1, ein Finger kippt den sechsten Würfel mit der Beschriftung C2 an, so dass eine Deutschland-Flagge zu sehen ist. Foto: Frank H. - stock.adobe.com
Tests messen den Sprachstand von Lernenden. Aber wie gut bilden sie tatsächlich den Sprachstand ab? Das Projekt DAKODA macht Forschung dazu einfacher.

Wer aus dem Ausland kommt und in Deutschland studieren möchte, muss Deutschkenntnisse nachweisen. Mindestens Sprachniveau C1 nach dem Gemeinsamen Europäischen Referenzrahmen ist die Regel, meist sogar C2 oder die Deutsche Sprachprüfung für den Hochschulzugang.

Über das Projekt

DAKODA steht für Datenkompetenzen in DaF/DaZ: Exploration sprachtechnologischer Ansätze zur Analyse von L2-Erwerbsstufen in Lernerkorpora des Deutschen. Das Projekt wurde vom Bundesministerium für Forschung, Technologie und Raumfahrt gefördert. Verbundpartner war die Universität Leipzig. Das Projekt macht Daten breit zugänglich, auch für andere Forschende, und schafft damit eine wichtige Basis, die für Grundlagenforschung, aber auch für Learning Engineering genutzt werden kann.

Aber wie gestaltet man solche Tests, damit sie auch wirklich das an der Uni notwendige Sprachniveau abbilden?

Datenbasis für weitere Forschung

Unter anderem mit solchen Fragen beschäftigen sich Sprachforschende schon lange. Um sie valide beantworten zu können, müssen die Wissenschaftler*innen den Spracherwerb genauer unter die Lupe nehmen. „Allerdings gab es dafür bisher keine zufriedenstellende Datenbasis“, erklärt Prof. Dr. Torsten Zesch. „Genau hier hat das Projekt DAKODA Abhilfe geschaffen.“

Lernerkorpora für Forschung nutzbar machen

Die Idee hinter dem Projekt: Bestehende annotierte Sammlungen von Lernersprache, die sogenannten Lernerkorpora, sollten zusammengeführt und für Forschende nutzbar gemacht werden. „Das war nicht ganz einfach“, so Computerlinguist Zesch: Die Korpora waren sehr unterschiedlich – mal waren es Essays, mal fiktive Briefe, mal Beschreibungen von Bildergeschichten. Zwei Korpora beinhalteten gesprochene Texte, alle anderen geschriebene. Auch das Sprachniveau der Lernenden war ganz unterschiedlich.

Ziel war, über die verschiedenen Textkorpora hinweg Analysen zu ermöglichen, unabhängig vom inhaltlichen Kontext. „Zentral ist dabei, wie in Sätzen der Lernenden das Verb platziert ist, denn das sagt viel über das Sprachniveau aus”, so Zesch: Vom Anfänger-Satz mit typischen Fehlern („Ich Schule gehen“) bis hin zur korrekten Verbstellung im Nebensatz („Bevor ich in die Schule gegangen bin, …“) liegen – so der aktuelle Forschungsstand – verschiedene Stadien des Spracherwerbs. „Und das Verb spielt dabei eine Schlüsselrolle“, so Zesch.

Interaktives Dashboard ermöglicht Suche

Neben den computerlinguistisch-technischen Herausforderungen mussten dafür auch Datenschutz-Fragen geklärt werden: Welche der vorhandenen Korpora können überhaupt rechtssicher genutzt, welche online frei verfügbar gemacht werden? Schließlich entstanden einige der Texte schon vor mehreren Jahrzehnten, die Einverständniserklärungen der Teilnehmenden passten daher nicht alle zum heutigen Bedarf.

Nach über drei Jahren Arbeit an dem Projekt ist das DAKODA-Team rund um Zesch und seine Kollegin Prof. Dr. Katrin Wisniewski von der Universität Leipzig nun aber sehr zufrieden mit dem Ergebnis: Ein Repositorium ermöglicht den Download von Korpora in verschiedenen Dateiformaten. Über ein interaktives Dashboard können Forschende Daten korpusübergreifend auswerten, zum Beispiel nach Sprachniveau oder Muttersprache. Beispielhafte Analysen mit Jupyter-Notebooks (einer browserbasierten Umgebung für Datenanalyse) zeigen, wie die Daten aus den Korpora untersucht werden können. „Das soll den Zugang für Forschende ohne tiefe IT-Kenntnisse erleichtern“, so Zesch.

Vorstellung auf Methodenmesse

Josef Ruppenhofer mit einem Messebesucher am Demo-ScreenFoto: privat
Dr. Josef Ruppenhofer (rechts) präsentierte das Projekt auf einer Methodenmesse in Mannheim.

Um gerade dieser Gruppe den Zugang zu den Angeboten des Projekts zu erleichtern, bot Projektmitarbeiter Dr. Josef Ruppenhofer verschiedene Workshops an und präsentierte das Angebot auch auf Tagungen. Zuletzt stellte er DAKODA vor kurzem in Mannheim vor, bei der Methodenmesse „Deutsch im europäischen Sprachraum“, veranstaltet vom Leibniz-Institut für Deutsche Sprache. Er konnte dort viele Interessierte für die Arbeit mit den Korpora gewinnen. „Für die Forschenden eröffnet DAKODA neue Möglichkeiten für grundlegende Erkenntnisse zum Spracherwerb“, sagt Zesch. „Wir freuen uns, dass wir von CATALPA hierzu einen Beitrag leisten konnten.“

Christina Lüdeke | 10.04.2026