eBooks „kapitellänge“
Es wurden 1 eBooks für den Suchbegriff „kapitellänge“ gefunden.
Bücher (1)
Marie de Sade, Dr. Olaf Hoffmann
Charakteristika quantitativer Textanalyse digitaler Bücher
Quantitative Linguistik an EPUBs
- Sprache und Literatur
- Deutsch
- 36287 Wörter
- Ab 16 Jahren
- 862
Im Rahmen der quantitativen Linguistik werden Werke statistisch untersucht, aus statistischen Verteilungen werden Zahlenwerte zu einem Werk berechnet, welche als Charakteristika das jeweilige Werk repräsentieren können sollen.
Charakteristika von Werken, welche in digitaler Form als EPUBs oder XHTML-Dokumente frei verfügbar sind, werden in dieser Arbeit für einen deutschsprachigen und einen englischsprachigen Korpus sowie darin befindliche Sammlungen oder Einzelwerke ermittelt und hinsichtlich ihrer Relevanz und Aussagekraft untersucht.
Der deutsche Korpus umfaßt mehr als 101 Millionen Wörter, der englische mehr als 115 Millionen Wörter. Die Korpora setzen sich aus den gesammelten Werken bekannterer und weniger bekannter Autoren zusammen, hinzu kommen weitere Sammlungen und Einzelwerke aus unterschiedlichen Quellen.
Die ermittelten Wort-Rangfolge-Häufigkeitsverteilungen sowie Worttypen-Häufigkeitsverteilungen werden ferner verwendet, um simulierte Werke definierter Länge mit vorgegebenem Vokabularium zu erzeugen und zu analysieren, um die Abhängigkeit der Charakteristika vom verwendeten Vokabularium sowie der Werklänge nachzuvollziehen, Charakteristika besser in ihrer Relevanz und Aussagekraft einzuordnen.
Ferner werden weitere charakteristische Textstrukturen ermittelt, etwa Verteilungen, deren statistische Momente zu Wortlängen, Satzlängen, Häufigkeit von Kommata pro Satz, Absatzlängen, Kapitellängen, verwendete Elemente zur semantischen Textauszeichnung. Entsprechend werden für beide Korpora ebenso verwendete Elemente zur semantischen Textauszeichnung, Zeichen-Rangfolge-Häufigkeitsverteilungen ermittelt, sowie die häufigsten verwendeten Zeichen, Wörter aufgelistet.
Charakteristika:Zeichenanzahl: 345127Wortanzahl: 47671Wortumfang: 14097Variabilität: 0.296Guiraud-Index: 64.6Informationsgehalt: 11.42 ShannonSatzanzahl: 12157186 Graphiken134 Tabellen
Ausgaben:1: 2020-02-012: 2021-02-01Ergänzungen:2020-07-012023-11-05
2024-01-01
[mehr]
Stichwörter: Charakteristika, quantitativ, Textanalyse, Linguistik, Statistik, digitales Buch, EPUB, Korpus, deutsch, englisch, Wortumfang, Wortanzahl, Variabilität, Diversifikationsquotient, Type-Token-Verhältnis, Guiraud-Index, Informationsgehalt, statistische Momente, Wortlänge, Satzlänge, Absatzlänge, Kapitellänge, Worthäufigkeit, Zeichenhäufigkeit, Verteilung, Rangfolge-Verteilung, Wortschatz, Worttypen-Häufigkeitsverteilung [mehr]
Kostenlos
Keine weiteren Ergebnisse