Beyond Words: Kurzpräsentation




Christof Schöch
(TCDH, Universität Trier)

BYOD-Lab, TCDH, Universität Trier

28 Nov 2024



Einleitung







Overview

  • 1 – Einleitung
  • 2 – Was bisher geschah: Zeta and Company
  • 3 – Was wir vorhaben: Beyond Words
  • 4 – Conclusion

Was bisher geschah:
Zeta and company

Überblick

  • Kontext SPP-CLS: 2020–2023, 2024–2026
  • Korpusaufbau: französischer Roman 1950–1999
  • Was ist Keyness / Distinktivität? (JLT-Paper)
  • Modellierung von Keyness-Maßen (Poster)
  • Implementierung von 9 Maßen (pydistinto)
  • Quantitative Evaluation 1: Klassifikation (JCLS-Paper)
  • Quantitative Evaluation 2: Synthetische Texte (DHd2025)
  • Qualitative Evaluation: Genre-Profile (DHd2025 + DHQ?)

Präsentationen und Papers

Was wir vorhaben:
Beyond Words

Überblick

  • Weitere Korpora
    • Gutenberg-Korpus: Englisch, 4 Genres, 1900–1970
    • COCA-Korpus: Englisch, 7 Genres, 1990–2010
  • Grundidee: Keyness mit komplexeren Features als Einzelwörter
    • Multi-Word-Expressions: Muster, Phrasen, etc.
    • Semantische Wort-Cluster: Word Embeddings, Topics, etc.

Conclusion

Stand der Dinge

  • Weitere Arbeit an den Korpora (Julia D.)
  • Vorüberlegungen und Experimente zu distinktiven Topics (Keli)

References


Du, Keli, Julia Dudar, Cora Rok, and Christof Schöch. 2021. “Zeta & Eta: An Exploration and Evaluation of Two Dispersion-based Measures of Distinctiveness.” In Proceedings of the Conference on Computational Humanities Research 2021, edited by Maud Ehrmann, Folgert Karsdorp, Melvin Wevers, Tara Lee Andrews, Manuel Burghardt, Mike Kestemont, Enrique Manjavacas, Michael Piotrowski, and Joris van Zundert, 2989:181–94. CEUR Workshop Proceedings. Amsterdam, the Netherlands: CEUR.
———. 2022. Kontrastive Textanalyse mit pydistinto - Ein Python-Paket zur Nutzung unterschiedlicher Distinktivitätsmaße.” Potsdam: Zenodo. https://doi.org/10.5281/zenodo.6327967.
Du, Keli, Julia Dudar, and Christof Schöch. 2022. “Evaluation of Measures of Distinctiveness. Classification of Literary Texts on the Basis of Distinctive Words.” Journal of Computational Literary Studies 1 (1). https://doi.org/10.48694/jcls.102.
Schöch, Christof. 2018. Zeta für die kontrastive Analyse literarischer Texte. Theorie, Implementierung, Fallstudie.” In Quantitative Ansätze in den Literatur- und Geisteswissenschaften. Systematische und historische Perspektiven, edited by Toni Bernhart, Sandra Richter, Marcus Lepper, Marcus Willand, and Andrea Albrecht, 77–94. Berlin: de Gruyter.
Schöch, Christof, Daniel Schlör, Albin Zehe, Henning Gebhard, Martin Becker, and Andreas Hotho. 2018. “Burrows’​ ​Zeta: Exploring​ and​ Evaluating Variants​ ​and​ ​Parameters.” In Book of Abstracts of the Digital Humanities Conference. Mexico City: ADHO. https://dh2018.adho.org/burrows-zeta-exploring-and-evaluating-variants-and-parameters/.
Schröter, Julian, Keli Du, Julia Dudar, Cora Rok, and Christof Schöch. 2021. “From Keyness to Distinctiveness Triangulation and Evaluation in Computational Literary Studies.” Journal of Literary Theory 15 (1-2): 81–108. https://doi.org/10.1515/jlt-2021-2011.

Appendix: Sample queries

Some sample queries: simple queries

Example queries: visualizations

Sample queries: networked and federated

Sample queries: comparative queries