Expertise vs. Statistik

Keyness in Subgenres des französischen Romans



Julia Röttgermann, Christof Schöch
mit Keli Du und Julia Dudar
(Universität Trier)

Workshop Digitale Gattungshermeneutik, LMU München

13 Sep 2024

Einleitung

Überblick

  • 1 – Einleitung
  • 3 – Distinktivitätsmaße
  • 4 – Korpus
  • 5 – Methode
  • 6 – Ergebnisse
  • 7 – Fazit

La différence n’est pensée que dans le jeu comparé de deux similitudes.
(Gilles Deleuze, Différence et répétition, 1968)

Distinktivitätsmaße

Hintergrund: Evaluations-Studie

Verwendete Distinktivitätsmaße

Korpus

Vier Untergattungen, drei Jahrzehnte

  • crime, scifi, sentimental, blanche | 1970s, 1980s, 1990s
  • Je 50 Romane: 4 x 3 x 50 = 600 Romane

Anzahl der Romane pro Jahr

Verlage

Gender und Subgenre

Methode

Vorgehensweise im Überblick

  • Expertise
    • Fachliteratur zu den vier Subgenres
    • Qualitative Profile für vier Subgenres (7 Kategorien)
  • Statistik
    • Korpus: 600 Romane in vier Subgenres
    • Keyword-Extraktion (3 Maße x 4 Subgenres vs. Rest): je 50 Keywords
  • Zusammenführung
    • Zuordnung der Keywords zu den Kategorien (Annotationstask)
    • Auswertung der Ergebnisse: expected/unexpected, Kategorien, IAA etc.

Subgenre-Profile

  • Für vier Subgenres
  • Kategorien
    • Thematic Concepts (bspw.: Technologie)
    • Language Patterns (bspw.: Neologismen)
    • Main Characters (bspw.: Wissenschaftler:in)
    • Space / Setting (bspw.: Weltraum)
    • Tonality (bspw.: schwarzer Humor)
    • Narrative form (bspw.: Introspektion )
    • Narrative structure (bspw.: Reise eines Einzelgängers)
  • Beispiel language patterns in science fiction: “Language patterns one can observe in this genre are neologisms, technical vocabulary and intertextual references, often making explicit references to older works of popular literature.”

Mapping: Subgenre-Profile vs. Keywords

  • hier: Language patterns in crime fiction

Genre-Profil Zeta LLR Welch
The language patterns of French detective fiction are characterized by sociolects, informal register and the simulation of direct speech cop, screw, guy, fella, guy, dumb, stuff, shit, eh, buddy, job, face, kid,

flic, foutre, type, gars, mec, con, truc, merde, hein, copain, boulot, gueule, môme
say, cop, guy



dire, flic, mec
copy, say, yes, screw, guy, dumb, stuff, shit, ah


flic, dire, oui, foutre, type, con, truc, merde, ah

13/50 words

3/50 words

9/50 words

Ergebnisse

Anzahl der ‘matching keywords’ (nach Maß und Subgenre)

Keywords und Kategorien (Welch)

Unexpected bei ‘literary fiction’

Zeta (24/50) LLR (43/50) Welch (32/50)
winter, summer, horse, marie, flower, king, spring, court, country, sea, self, cross, bird, belly, everyone, party, English, sunday, among, sing rose, season, music, eat

hiver, été, cheval, marie, fleur, roi, printemps, cour, pays, mer, soi, croix, oiseau, ventre, chacun, fête, anglais, dimanche, parmi, chanter, rose, saison, musique, manger
you, my, we, you, marie, me, rhada, the, their, oneself, of, mr, antoine, which, lalla, he, isambour, not, as, have, ludo, djafar, prisko, your, camier, yourself, madeleine, can, by, mercier, planet, vito, to ask, fintan, our, pélagie, khan, their, but, ship, daquin, where, david

vous, mon, on, tu, me, rhada, le, lui, se, de, mr, antoine, qui, lalla, il, isambour, pas, comme avoir, ludo, djafar, prisko, mercier, planète, vito, demander, fintan, notre, pélagie, khan, leur, mais, vaisseau, daquin, où, david
who, like, day, where, we, by, whose, every, at, the of, in, my, big, that, more, even, without, everyone, their, bottom, or, there, summer, night, our, self, spring, nor, me, winter, white

qui, comme, jour, où, on, par, dont, chaque, au, le, de, dans, mon, grand, celui, plus, même, sans, chacun, leur, fond, ou, là, été, nuit, notre, soi, printemps, ni, me, hiver, blanc

Fazit

Was haben wir herausgefunden?

  • Zeta und Welch haben deutlich bessere Performance als LLR
    (= hoher Anteil an Keywords, die auf die Profile gemappt werden können)
  • Zeta und Welch identifizieren auch recht ähnliche Keywords
    (der exakte Grad der Überlappung wäre zu bestimmen)
  • Je besser ein Maß funktioniert, in der Perspektive der qualitativen Evaluation, desto weniger überraschend sind die Ergebnisse
  • Der Fokus auf die Jahreszeiten bei ‘literary fiction’ setzt einen kleinen Akzent auf eine bisher nicht so klar benannte Eigenschaft dieser Textgruppe


Vielen Dank für die Aufmerksamkeit!











Ressourcen

Bibliographie


Burrows, John. 2006. All the Way Through: Testing for Authorship in Different Frequency Strata.” Literary and Linguistic Computing 22 (1): 27–47. https://doi.org/10.1093/llc/fqi067.
Du, Keli, Julia Dudar, and Christof Schöch. 2022. “Evaluation of Measures of Distinctiveness. Classification of Literary Texts on the Basis of Distinctive Words.” Journal of Computational Literary Studies 1. https://doi.org/10.48694/jcls.102.
Dunning, Ted. 1993. “Accurate Methods for the Statistics of Surprise and Coincidence.” Edited by Julia Hirschberg. Computational Linguistics 19 (1): 61–74. https://aclanthology.org/J93-1003.
Schöch, Christof, Daniel Schlör, Albin Zehe, Henning Gebhard, Martin Becker, and Andreas Hotho. 2018. “Burrows’​ ​Zeta: Exploring​ and​ Evaluating Variants​ ​and​ ​Parameters.” In Book of Abstracts of the Digital Humanities Conference. Mexico City: ADHO. https://dh2018.adho.org/burrows-zeta-exploring-and-evaluating-variants-and-parameters/.
Welch, B. L. 1947. The Generalization of the ’Student’s’ problem when several different population variances are involved.” Biometrika 34 (1-2): 28–35. https://doi.org/10.1093/biomet/34.1-2.28.

Fachliteratur zu den Subgenres

  • Angenot, Marc. 1975. Le roman populaire: recherches en paralittérature. Montreal: Presses de l’université du Québec. http://digitale-objekte.hbz-nrw.de/storage/2009/11/07/file_18/3292944.pdf.
  • Baudou, Jacques. 2003. La Science-fiction. 1e édition. Que sais-je? Presses Universitaires de France - PUF.
  • Constans, Ellen. 1999. Parlez-moi d’amour: le roman sentimental : des romans grecs aux collections de l’an 2000. Presses Univ. Limoges.
  • Dubois, Jacques. 2005. Le roman policier ou la modernité. Armand Colin.
  • Gonon, Laetitia, Vannina Goossens, Olivier Kraif, Iva Novakova, und Julie Sorba. 2018. „Motifs textuels spécifiques au genre policier et à la littérature blanche“. Herausgegeben von F. Neveu, B. Harmegnies, L. Hriba, und S. Prévost. SHS Web of Conferences 46:06007. https://doi.org/10.1051/shsconf/20184606007.
  • Gonon, Laetitia, Vannina Goossens, Iva Novakova, und Iva Novakova. 2017. „Les phraséologismes spécifiques à deux sous-genres de la paralittérature : le roman sentimental et le roman policier“. In . Université d’Artois, Arras. Helgorsky, Françoise. 1985. „Harlequin ou la quête du grand amour“. Communication et langages 63 (1): 83–98. https://doi.org/10.3406/colan.1985.1666.
  • Helgorsky, Françoise. 1987. „Harlequin : l’unité dans la diversité et vice-versa“. Pratiques 54 (1): 5–19. https://doi.org/10.3406/prati.1987.1434. Mather, Philippe, und Sylvain Rheault. 2016. Rediscovering French Science-Fiction in Literature, Film and Comics: From Cyrano to Barbarella. Cambridge Scholars Publishing.
  • Millet, Gilbert, und Denis Labbé. 2001. La science-fiction. Sujets. Paris: Belin.
  • Olivier-Martin, Yves. 2013. Histoire du roman populaire en France de 1840 à 1980. Albin Michel.
  • Slusser, George. 1989. „‚Science Fiction in France‘: An Introduction“. Science Fiction Studies 16 (3): 251–53. https://www.jstor.org/stable/4239952. Thomas, Pascal J. 1989. „The Current State of Science Fiction in France (L’état actuel de la science-fiction en France)“. Science Fiction Studies 16 (3): 298–306. https://www.jstor.org/stable/4239955.
  • Todorov, Tzvetan. 1971. „Typologie du roman policier“. In Poétique de la prose, 55–65. Paris: Seuil.
  • Vanoncini, André. 2002. Le roman policier. Paris: Presses Univ. de France.

Bonusfolien

Clustering

Inter-Annotator Agreement

TXM: “pouvoir”

TXM: “humain”

TXM: “femme”

TXM: “regard”

TXM: PCA auf PRO:POS

TXM: PCA auf CIT

TXM: PCA auf INTERJ

Keywords und Typizität / Hybridität