Significant Sequences in World Englishes: A Data-driven Approach to Variationist Models

The present study attempts a strictly data-driven/bottom-up evaluation of models of World Englishes. Methodologically, diverging degrees of association within lexical and grammatical n-grams are chosen as the linguistic basis on which to estimate similarities and differences between 15 varieties of...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Koch, Christopher
Beteiligte: Kreyer, Rolf (Prof. Dr.) (BetreuerIn (Doktorarbeit))
Format: Dissertation
Sprache:Englisch
Veröffentlicht: Philipps-Universität Marburg 2021
Schlagworte:
Online Zugang:PDF-Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!

Die vorliegende Studie unternimmt eine streng datengesteuerte (bottom-up) Auswertung von Modellen der World Englishes. Methodisch werden dafür abweichende Assoziationsstärken innerhalb lexikalischer und grammatischer Mehrworteinheiten (n grams) als sprachliche Grundlage zur Bewertung der Ähnlichkeiten zwischen den 15 Varietäten von World Englishes verwendet, welche im International Corpus of English repräsentiert sind. Zu diesem Zweck werden Mehrworteinheiten dynamischer wie statischer Länger aus bereinigten und homogenisierten regionalen Komponenten des Korpus extrahiert, wobei sowohl die lexikalische Datengrundlage des Korpus verwendet wird als auch eine nach Wortart annotierte Form. Die Auswertung der Kollokationsprofile geschieht durch die Anwendung von fünf Assoziationsmaßen etablierter (MI-score, t-score, log-likelihood) wie auch innovativer Art (lexical gravity, Delta P) auf die jeweiligen Datengrundlage. Auf Grundlage der Bindungsstärken zwischen lexikalischen bzw. grammatischen Items innerhalb der verschiedenen Datensätze werden durch die Anwendung von Clusteranalysen Gruppen von Varietäten gebildet, welche ähnliche Assoziationsprofile aufweisen und somit als besonders ähnlich zueinander beurteilt werden können. Clusterverfahren identifizieren binäre Paare mit maximaler Ähnlichkeit und verschmelzen diese schrittweise. Dieser Ablauf wird wiederholt, bis alle Varietäten in der Clusterstruktur abgebildet sind. Weil allerdings Clusterverfahren eine Tendenz besitzen, selbst in zufälligen Daten Muster zu erkennen, werden die Ergebnisse mehrerer Verfahren (hierarchisches Clustering, k-means, phylogenetisches Clustering) trianguliert und die möglichen Trennungen innerhalb der hierarchischen Methoden zusätzlich durch randomisiertes Resampling der Daten substanziiert. Die so gewonnenen Varietätencluster werden in der Folge mit Erwartungen abgeglichen, welche sich aus der Lektüre einflussreicher sprachexterner Modelle ergeben. Dabei ergeben sich vor allem drei Gruppen von Modellen: 1) traditionelle Einteilungen in mutter-, zweit- und fremdsprachlichen Gebrauch des Englischen, 2) auf regionaler und kultureller Ähnlichkeit basierende Modelle (Hundt 2013) sowie 3) Evolutionsmodelle wie vorrangig Schneiders (2007, 2014) dynamic model. Jedes dieser Modelle legt unterschiedliche Gruppierungen in den Daten nahe und werden gegen die empirischen Befunde in Form von varietätenspezifischen Assoziationsprofilen abgeglichen. Die Ergebnisse der Arbeit zeigen, dass eine Beschreibung der sprachlichen Ähnlichkeiten zwischen den betrachteten Varietäten am besten entlang regionaler Kategorien gelingt. Insbesondere die afrikanischen Varietäten stellen eine konsistente Gruppe dar, welche zudem interne regionale Differenzierung aufweist. In den gesprochenen Daten zeigen sich die traditionellen muttersprachlichen Varietäten zwar eine Tendenz zur Abgrenzung von den übrigen Daten, in den umfangreicheren schriftlichen Daten stellt sich allerdings auch hier eine Unterscheidung entlang Faktoren von räumlicher und kultureller Nähe dar. Die Interpretation entlang regionaler Kriterien gelingt am schlechtesten für die asiatischen Daten, welche oft in kleinere und stärker fluide Gruppen zerfallen. Allerdings zeigen sich auch hier verlässlich wiederkehrende Paare, welche sich am besten durch räumliche und kulturelle Nähe erklären lassen. Übereinstimmungen mit Schneiders dynamic model zeigen sich i.d.R. eher selten. Zwar entsprechen einige Cluster jenen, die auf Grundlage des Modells erwartet werden können, jedoch ist die Passung zu einer proximitätsbasierten Erklärung in fast allen Fällen höher. Letztere entsprechen überdies nicht nur auf der Makroebene den sprachlichen Befunden sondern bilden auch im Detail zumeist besser die gewonnenen Daten ab. Demgegenüber ergeben sich einige Gruppen, welche auf Basis ähnlicher Grade exo- und endonormativer Stabilisierung erwartet werden können kaum oder gar nicht aus den sprachlichen Beobachtungen. Deshalb schließt die Analyse mit einer deutlichen Präferenz für die Nutzung räumlicher und kultureller Nähe als Grundlage für die Beschreibung von Assoziationspräferenzen in World Englishes.