Open Science und Open Education
aus der Perspektive der Digital Humanities



Christof Schöch
Trier Center for Digital Humanities
Universität Trier

Open Education und Open Science im Dialog:
Synergien für die digitale Transformation der Hochschule
KNOER-Tagung 2025

17 Juni 2025

Einstieg

Ziele / Überblick

  • 1 – Einstieg
  • 2 – ‘Openness’ in den Digital Humanities
  • 3 – Einheit von Open Science und Open Education in den DH
  • 4 – Herausforderung der ‘Openness’ durch generative Sprachmodelle
  • 5 – Fazit: Was tun?

‘Openness’ in den Digital Humanities

Was ist mit Digital Humanities gemeint?

  • Grundidee
    • Forschungsfragen aus den Geisteswissenschaften
    • Methoden aus Informatik und Statistik
  • Wechselwirkungen
    • Informatischer Blick auf Gegenstände
    • Geisteswiss. Blick auf Methoden
  • Interdisziplinarität
    • Viele beteiligte Disziplinen
    • Unterschiedliche Mischungsverhältnisse

Digital Humanities als Fach

  • 34 Fachgesellschaften weltweit
    (ab 1973: Association for Literary and Linguistic Computing)
  • 62 Fachzeitschriften
    (ab 1966: Computers and the Humanities)
  • 100+ DH-Zentren
    (ab 1964: Literary and Linguistic Computing Centre, Cambridge)
  • ~40 Professuren in Deutschland
    (ab 2008: Fotis Jannidis in Würzburg)
  • 200+ Studiengänge

Digital Humanities und Openness

Grounded in humanistic values but catalyzed by Internet values, the digital humanities seeks to push the humanities into new territory by promoting collaboration, openness, and experimentation. […] Openness operates on several levels in the digital humanities, describing a commitment to the open exchange of ideas, the development of open content and software, and transparency […]. The digital humanities community embraces openness because of both self-interest and ethical aspirations. (Spiro 2012)

Erste Zwischenbilanz

 

Woher kommt die tiefe Verbundenheit der DH mit ‘Offenheit’?

  • Rahmenbedingungen
    • Affinität mit Internet- und Hacker-Kultur
    • Digitalität und Open Science (Jäckel)
  • Überzeugungen
    • Open Science: just science done right
    • Öffentlich finanziert => öffentlich zugänglich

Einheit von Open Science
und Open Education in den DH

Computational Literary Studies
Infrastructure

  • DraCor-Dramenkorpus
    • XML-TEI sowie LOD und API
    • unterstützt Reproduzierbarkeit
  • “Repetitive Research”-Paper
    • Theoretisches Paper zu Reproduzierbarkeit in den DH
    • Open Access (aber: Gold OA)
  • Survey of Methods in CLS
    • Grid: frei wählbare Lektüre-Ordnung
    • Open Access und offene Formate
    • Offene Technologien: Gitlab, Zotero, Quarto

Weitere Beispiele

Blinder Fleck: Lehrbücher / Monographien

  • Lehrbücher
    • identitätsstiftend
    • oft nicht OA
  • OA-Monographien als Herausforderung
    • Sichtbarkeit / Auffindbarkeit (BASE, DARIAH Teach)
    • Prestige
    • Kosten (bei OA mit Verlag)

Zweite Zwischenbilanz

 

Woher kommt die enge Integration von OS und OE in den DH?

  • ‘Offenheit’ als Wert und Überzeugung
    • OS und OE werden nicht separat übernommen
    • Sondern von Offenheit abgeleitet
    • Breite Anwendung: Lehre, Forschung, Infrastruktur, WissKomm, etc.
  • Interdisziplinärer Arbeitskontext
    • Arbeitsteilung => Egalität => reduzierte Wertungsdifferenz Forschung / Lehre
    • Forschungsmethoden: importieren, adaptieren (OS) => vermitteln (OE)

Openness und generative Sprachmodelle: Herausforderungen

(1) Ersetzen generative LLMs unsere OERs?

  • Vorteile
    • Interaktivität (‘Nachfragen’)
    • Individuelles Feedback (vgl. Stackoverflow)
    • Mehrsprachigkeit
  • Probleme
    • Keine Referenzfunktion / Verlässlichkeit
    • Signifikante Lücken (bspw. SPARQL, Typst)
  • Opportunity
    • OER auch zu neueren Themen erstellen
    • LLMs für mehrsprachige OER nutzen
    • OER zum kritischen Umgang mit genLLMs

(2) Offene Lizenzierung unter Druck

  • Mögliche Entwicklung
    • Forschende und Lehrende verzichten lieber auf offene Lizenzen
    • Motivation: Kein LLM-Training ermöglichen
  • Gegenargumente
    • Lizenzvereinbarungen der Verlage (Taylor & Francis und Microsoft)
    • Impact der eigenen Ressourcen durch Training
    • Ideal der Offenheit hochhalten!

(3) Viele genLLMs sind nicht ‘offen’!

  • Herausforderungen
    • European Open Source AI Index zeigt: bekannte LLMs sind nicht offen
    • ‘Open Washing’: Offenheit wird redefiniert / untergraben
    • Gedanke: Offene LLMs haben weniger gute Performance
  • Vorteile offener und lokaler Modelle
    • transparenter und reproduzierbarer (Versionierung)
    • bieten Rechtssicherheit und Privatsphäre (lokal)
    • keine Kosten für die API-Nutzung (aber: Hardware!)

Beispiel: Ollama

  • Frei verfügbare Software zur Nutzung von offenen LLMs
  • Unterstützt Download und Interaktion mit LLMs
  • Zahlreiche Modelle für Text, Bilder, Video sind verfügbar
  • Ermöglicht interaktives Prompting und Skripting

Dritte Zwischenbilanz

 

Was ist die Antwort auf die generativen Sprachmodelle?

  • OER zu Themen erstellen, bei denen LLMs schwach sind
  • OER zur Nutzung von offenen LLMs erstellen und verbreiten
  • Die Forderung nach mehr offenen LLMs mittragen

Fazit: Was tun?

Abgeleitete Handlungsoptionen

  • Offenheit an sich als Prinzip / Wert erklären und fördern
  • Integration von OS und OE: dort unterstützen, wo schon digital geforscht wird
  • Mit OER in strategische Lücken gehen
    • unterrepräsentierte Themen
    • offene generative LLMs
  • Sich für diese Themen mit den NFDI-Konsortien solidarisieren

Vielen Dank für Ihre Aufmerksamkeit!



References

Helregel, Nicole. 2025. „AI and Open Science: Implications and Library Practice Recommendations“. Library Trends 73 (3): 177–96. https://doi.org/10.1353/lib.2025.a961191.
Jannidis, Fotis, und Malte Kohle Hubertus und Rehbein, Hrsg. 2017. Digital Humanities: Eine Einführung.
Karsdorp, Folgert, Mike Kestemont, und Allen Riddell. 2021. Humanities Data Analysis. Case Studies with Python.
Klinke, Harald. 2025. Cultural Data Science. An Introduction to R.
Sahle, Patrick. 2015. „Digital Humanities? Gibt’s doch gar nicht!“ Zeitschrift für digitale Geisteswissenschaften. https://doi.org/10.17175/sb001_004.
Schöch, Christof. 2023. „Repetitive research: a conceptual space and terminology of replication, reproduction, revision, reanalysis, reinvestigation and reuse in digital humanities“. International Journal of Digital Humanities 5:373–403. https://doi.org/https://doi.org/10.1007/s42803-023-00073-y.
Schöch, Christof, Frédéric Döhl, Achim Rettinger, Evelyn Gius, Peer Trilcke, Peter Leinen, Fotis Jannidis, Maria Hinzmann, und Jörg Röpke. 2020. „Abgeleitete Textformate: Text und Data Mining mit urheberrechtlich geschützten Textbeständen“. Zeitschrift für digitale Geisteswissenschaften. https://www.zfdg.de/2020_006.
Spiro, Lisa. 2012. „’This Is Why We Fight’: Defining the Values of the Digital Humanities“. In Debates in the Digital Humanities, herausgegeben von Matt Gold. Univ. of Minnesota Press. https://dhdebates.gc.cuny.edu/projects/debates-in-the-digital-humanities.