Forschungsgruppe II: digital humanities – Forschen im digitalen Raum

-
An der Schnittstelle zwischen Informatik und Geistes- und Kulturwissenschaften beschäftigt sich die Forschungsgruppe digital humanities – Forschen im digitalen Raum damit, neue Entwicklungen in der Informatik auf ihre Verwendbarkeit in den Geisteswissenschaften zu prüfen und eigenständig neue Verfahren zu entwickeln. Interessant wird die Nutzung neuer Informationstechnologie vor allem dort, wo mit computergestützten Verfahren die Grenzen traditioneller Methoden überschritten werden und neues Forschungsterrain betreten wird. Sei es, dass in Untersuchungen viel größere Datenmengen eingebracht werden können und dadurch sogleich neue und andere Fragestellungen bearbeitbar werden; sei es, dass ganz neue Gegenstandsbereiche erschlossen werden, z.B. durch die Möglichkeit, nicht bewusste Spracheigentümlichkeiten zu beschreiben und in großen Textkorpora nachzuweisen. Die Forschungsgruppe versteht sich als Agent digitaler Methoden, indem sie in den geistes- und kulturwissenschaftlichen Fachcommunities für deren Nutzung wirbt. Dabei begleitet sie den Prozess der daten- und informationstechnologisch getriebenen Forschung selbstreflexiv und kritisch. Die gemeinsame Arbeit von Informatik und Geistes- und Kulturwissenschaften fördert das Verständnis zwischen den Disziplinen.
In enger Zusammenarbeit von Informatiker*innen und Geisteswissenschaftler*innen will die Forschungsgruppe digital humanities. Forschen im digitalen Raum Kompetenzen bündeln, weiterentwickeln und innovative Forschungsvorhaben angehen. Ein Schwerpunkt sind die Herausforderungen digitaler Forschungs- und Informationsinfrastrukturen. Computergestützte Verfahren der Text- und Audioanalyse spielen hier ebenso eine Rolle wie Fragen des Datenmanagements, -retrievals und die Bereitstellung von Daten und Analysewerkzeugen zum kollaborativen Arbeiten im digitalen Raum. Ein Ziel der Forschungsgruppe ist der Aufbau eines Kompetenznetzwerkes im Bereich digitaler Forschungs- und Informationsinfrastrukturen. Methodisch will die Forschungsgruppe die Anwendung computergestützter Verfahren des Natural Language Processing und Text Mining/Audio Mining voranbringen, in Projekten erproben und deren wissenschaftlichen Ertrag reflektieren.
-
Open.Oral-History: Empfehlungen und Werkzeuge für die Risikobewertung, Anonymisierung und Bereitstellung rechtlich geschützter und ethisch sensibler audiovisueller Interviews
Die narrativ-biografischen Interviews der Oral History weisen spezifische ethische und rechtliche Schutzbedarfe auf. Daraus ergeben sich erhebliche fachspezifische Hürden für ihre Bereitstellung. Zugleich besteht jedoch ein beträchtliches disziplinübergreifendes Forschungsinteresse an ihrer Nachnutzung. Das Projekt „Open.Oral-History“ begegnet diesem Bedarf, indem es Sammlungsverantwortliche dabei unterstützt, die Voraussetzungen für eine Bereitstellung ihrer Interviews systematisch zu bewerten und gegebenenfalls mit Hilfe eines durch Künstliche Intelligenz (KI) unterstützen Anonymisierungsverfahrens zu ermöglichen.
Bei vielen Sammlungsverantwortlichen fehlt ein strukturiertes Wissen über die juristischen Bedingungen und technischen Möglichkeiten für eine digitale Bereitstellung. Die komplexen Datenschutz-, persönlichkeits- und urheberrechtlichen Einschränkungen, wie fehlende oder unzureichende Einwilligungserklärungen oder die darin geforderte Anonymisierung, stellen häufig eine scheinbar unüberwindbare Hürde dar. In Zusammenarbeit mit den Inhaber*innen von Interview-Sammlungen in deutscher, englischer, polnischer und ukrainischer Sprache werden exemplarische Use-Cases identifiziert. Mit juristischer Unterstützung werden für diese verschiedenen Szenarien Workflows zur rechtlichen Klärung und Risikoabschätzung entwickelt. Die Ergebnisse werden als Handreichung veröffentlicht.
Da Oral-History-Interviews akustische und visuelle Informationen in Form von Bewegtmedien enthalten, sind sie schwieriger zu anonymisieren als andere Forschungsdaten. Ihre Anonymisierung kann vom Ausblenden einzelner akustischer oder visueller Interviewinhalte bis hin zur Verhinderung der Re-Identifikation von Personen reichen, gleichzeitig soll die Quelle im Interesse qualitativer Forschung möglichst nur minimal verändert werden. Dafür werden mit Hilfe einer KI-basierten Spracherkennung automatisiert maschinenlesbare Transkripte generiert, aus denen mittels Named Entity Recognition zu anonymisierende Wörter und Passagen identifiziert und (nach einer qualitativen Auswahl) automatisiert in der Audio- und/oder Videospur unkenntlich gemacht werden. Die Sammlungsverantwortlichen erhalten die anonymisierten Textderivate und audiovisuellen Medien sowie maschinenlesbare Lizenz- und Rechteinformationen zur Bereitstellung und Nachnutzung der Oral-History-Interviews.
Die erarbeitete rechtlich geprüfte Handreichung und die prototypischen technologischen Verfahren sollen generisch auf Datensätze anderer Fachdisziplinen anwendbar sein. Im Austausch mit anderen Pilotprojekten und Vertreter*innen verwandter Disziplinen wird die Übertragbarkeit der entwickelten Lösungen ermittelt.
Oral-History.Digital
Das DFG-Projekt Oral-History.Digital konzipiert und implementiert eine digitale Informationsinfrastruktur für wissenschaftliche Sammlungen von audiovisuell aufgezeichneten narrativen Interviews, v.a. für die zeitgeschichtliche Forschung. Die Arbeitsumgebung unterstützt sammelnde Institutionen und Forschungsprojekte bei der Archivierung, Erschließung und Bereitstellung sowie der sammlungsübergreifenden Recherche, Annotation und Auswertung.
Interviewprojekte können Audio- und Video-Interviews mit zugehörigen Transkripten, Biographien, Bildern etc. einstellen, bearbeiten und mittels einer differenzierten Nutzerverwaltung den wissenschaftlichen Communities zugänglich machen. Das konfigurierbare Set von teils bewährten, teils neu entwickelten Werkzeugen unterstützt die mit den Interviews arbeitenden Forscher/innen bei der sammlungsübergreifenden Suche über Metadaten und timecodierte Volltexte und bei der Annotation von Suchergebnissen.
Das an der FernUniversität beheimatete Archiv "Deutsches Gedächtnis" ist im Besitz der ältesten Oral History-Sammlung in Deutschland und wird mit seiner langjährigen Expertise auf dem Gebiet der Digitalisierung von audiovisuellen Quellen eine tragende Rolle im Projekt Oral-History.Digital spielen.
Oral-History.Digital 2. Konsolidierung und Optimierung der Erschließungs- und Rechercheplattform für audiovisuelle narrative Interviews
Das Projekt Oral-History.Digital 2. ist die Fortsetzung des Projektes Oral-History.Digital, das eine digitale Informationsinfrastruktur für wissenschaftliche Sammlungen von audiovisuell aufgezeichneten narrativen Interviews, v.a. für die zeitgeschichtliche Forschung konzipiert und implementiert. Die Arbeitsumgebung unterstützt sammelnde Institutionen und Forschungsprojekte bei der Archivierung, Erschließung und Bereitstellung sowie der sammlungsübergreifenden Recherche, Annotation und Auswertung.
Interviewprojekte können Audio- und Video-Interviews mit zugehörigen Transkripten, Biographien, Bildern etc. einstellen, bearbeiten und mittels einer differenzierten Nutzerverwaltung den wissenschaftlichen Communities zugänglich machen. Das konfigurierbare Set von teils bewährten, teils neu entwickelten Werkzeugen unterstützt die mit den Interviews arbeitenden Forscher/innen bei der sammlungsübergreifenden Suche über Metadaten und timecodierte Volltexte und bei der Annotation von Suchergebnissen.
Seit September 2023 ist Oral-History.Digital (Link: https://portal.oral-history.digital/de) online. Das Folgeprojekt dient der Konsolidierung und Optimierung der Erschließungs- und Rechercheplattform und erschließt interdisziplinäre und internationale Zugänge.
Aufbau einer Archivverwaltungsinfrastruktur mit Langzeitarchivierung
In enger Zusammenarbeit mit dem Lehrgebiet für Multimedia- und Internetanwendungen entsteht eine datenbankbasierte Verwaltungsinfrastrukur für das Archiv "Deutsches Gedächtnis". Besonderes Augemerk liegt hierbei auf der Langzeitarchivierung digitalisierter historischer Quellen und der aktiven Nachwuchsförderung. Bislang sind am LGMMIA eine Bachelor- und eine Masterarbeit im Zusammenhang mit dem Aufbau der Infrastruktur entstanden.
Anwendung, Adaption und Reflexion von Methoden aus dem Bereich Natural Language Processing bzw. Text Mining
Die Forschungsgruppe baut an der Fakultät Kultur- und Sozialwissenschaften in Kooperation mit der Fakultät Mathematik und Informatik Kompetenzen im Bereich des Natural Language Processing bzw. Text Mining auf, indem sie deren Methoden anwendet und an Fragestellungen der beteiligen Lehrgebiete bzw. Institute adaptiert. Dabei ist die Entwicklung und Erprobung von Methoden eng verknüpft mit deren kritischer Reflexion. Wir gehen davon aus, dass die Digital Humanities die klassischen Methoden und Fragestellungen der Geisteswissenschaften konstruktiv und fruchtbringend erweitern können. Gleichzeitig ergeben sich aus den praktizierten Verfahren Fragen nach dem epistemologischen Wandel im Zuge der Digitalisierung. Was bedeutet es, wenn die Beziehungen der sprachlichen Zeichen untereinander statistisch modelliert werden? Was heißt das für die Struktur des sprachlichen Zeichens und für die Struktur der Repräsentation?
KA3 - Kölner Zenrum Analyse und Archivierung von AV-Daten. Teilprojekt: Pilotprojekt Oral History [abgeschlossen]
Das Projekt dient dem Aufbau und der Weiterentwicklung eines fach‐ und standortübergreifenden Kölner Zentrums für Analyse und Archivierung audiovisueller Daten (KA3) mit den drei Komponenten Analyse, Archivierung/Publikation und Schulung/Beratung. Besondere Aufmerksamkeit gilt den mit einander zusammenhängenden Problemen der interaktionsbezogenen Strukturierung und der effizienten Bereitstellung und Archivierung von audiovisuellen Daten, die sowohl geisteswissenschaftlich wie informationstechnologisch erforscht werden sollen und die von grundlegen‐ der Bedeutung für die wissenschaftliche Arbeit mit AV‐Daten sind.
Foto: Veit Mette
Das Archiv "Deutsches Gedächtnis" stellt seine umfängliche Datensammlung zur Verfügung, die im Rahmen des Projekts unter Anwendung der von den Technologiepartnern zur Verfügung gestellten Werkzeuge und Dienste hinsichtlich einer eng begrenzten Fragestellung untersucht werden. Übergeordnetes und langfristiges Ziel des KA3 ist es, durch den Einsatz moderner Informationstechnologien den Umgang mit AV‐Daten effizienter zu gestalten, und zwar durch die Reduktion des Ressourceneinsatzes für die die Analyse vorbereitenden Schritte und die Durchführung von Analysen mit direktem Zugriff auf das Signal, also ohne die einer Transkription inhärenten Reduktionen.
-
Dr. Dennis Möbus (Koordination)
E-Mail: dennis.moebus
Institut für Geschichte und Biographie, Fakultät KSW, FernUniversität in Hagen
ProfilProf. Dr.-Ing. Matthias Hemmje
E-Mail: matthias.hemmje
Lehrgebiet für Multimedia und Internetanwendungen, Fakultät M+I, FernUniversität in Hagen
ProfilProf. Dr. Uta Störl
E-Mail: uta.stoerl
Lehrgebiet Datenbanken und Informationssysteme, Fakultät M+I, FernUniversität in Hagen
ProfilProf. Dr. Felix Ackermann
E-Mail: felix.ackermann
Lehrgebiet Public History, Fakultät KSW, FernUniversität in Hagen
ProfilHelmut Hofbauer, M.A.
E-Mail: helmut.hofbauer
Lehrgebiet Neuere deutsche Literaturwissenschaft und Medienästhetik, Fakultät KSW, FernUniversität in Hagen
ProfilDr. Cord Pagenstecher (externes Mitglied)
E-Mail: cord.pagenstecher@fu-berlin.de
Center für Digitale Systeme (CeDiS)/Universitätsbibliothek, Freie Universität Berlin
ProfilProf. Dr. Lina Franken (externe Partnerin)
E-Mail: lina.franken@uni-vechta.de
Digital Humanities, Uni Vechta
ProfilProf. Dr. Tobias Hodel (externer Partner)
E-Mail: tobias.hodel@unibe.ch
Digital Humanities, Universität Bern
ProfilDr. Ina Serif (externe Partnerin)
E-Mail: ina.serif@uniba.ch
Bereichsassistentin für digitale und vormoderne Geschichte, Universität Basel
ProfilProf. Dr. Binh Vu (externer Partner)
E-Mail: binh.vu@srh.de
Data Science, SRH Hochschule Heidelberg
Profil -
- Named Entity Recognition in der historisch-biografischen Forschung
Workshop
Exploration und Evaluation verschiedener NER-Verfahren auf Interviewtranskripten aus der Oral-History, Kooperation mit dem Forschungsbereich CATALPA - Von Heimat zu Beheimatung - Visuelle Exploration und Sekundäranalyse von lebensgeschichtlichen Interviewsammlungen
Vortrag
Philipp Bayerschmidt stellt beim Doctoral Consortium auf der DHd 2025 sein entwickeltes Tool zur Interviewkorpusanalyse und erste Forschungsergebnisse vor - Poster zur Chronologieanalyse lebensgeschichtlicher Interviews
Forschungsergebnisse veröffentlicht
Dennis Möbus hat erfolgreich ein Poster bei der DHd 2025 eingereicht und wichtige Forschungsergebnisse präsentiert.
- Named Entity Recognition in der historisch-biografischen Forschung