Essays on Natural Language Processing and Central Banking.

Humans generally interact, communicate, and form social structures using natural language. Due to the high dimensionality of language, much of the wealth of information from these interactions has been barred from the economic profession. However, recent technological advancements lead to increasing...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Zahner, Johannes
Beteiligte: Schulte, Elisabeth (Prof. Dr.) (BetreuerIn (Doktorarbeit))
Format: Dissertation
Sprache:Englisch
Veröffentlicht: Philipps-Universität Marburg 2021
Schlagworte:
Online Zugang:PDF-Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!

Menschliche Interaktion, Kommunikation, sowie die Bildung sozialer Strukturen ereignen sich in der Regel mittels natürlicher Sprache. Durch die hohe Dimensionalität der Sprache war ein Großteil der reichhaltigen Informationen, die sich aus diesen Interaktionen ergeben, den Wirtschaftswissenschaften bisher vorenthalten. Jüngste technologische Fortschritte führen jedoch zu einer zunehmenden Verwendung von Text als Datenbasis in ökonomischen Anwendungen. Diese Entwicklung wurde durch die Rede des Nobelpreisträgers Robert J. Shiller vor der American Economic Association "Narrative Economics" weiter beschleunigt, in der er sich für eine stärkere Berücksichtigung von Narrativen - Geschichten, die individuelle Entscheidungen und kollektive Handlungen beeinflussen - durch die wirtschaftswissenschaftliche Gemeinschaft einsetzt. In den letzten Jahren wurden Forschungsarbeiten veröffentlicht, die textbasierte Informationen nutzen, um latente Variablen wie Unsicherheit zu quantifizieren, makroökonomische Variablen in Echtzeit zu prognostizieren und Vermögenspreise vorherzusagen. Zur selben Zeit hat sich die Sichtweise der Geldpolitik im Hinblick auf die Transparenz und Kommunikation der Zentralbank gewandelt. Statt Geldpolitik auf Zinsmaßnahmen zu beschränken, ist die Kommunikation zu einem wichtigen Instrument im Werkzeugkasten der Zentralbanker geworden. Heute werden Worte verwendet, um Erwartungen zu verankern und den von den Zentralbanken gewünschten Gleichgewichtspfad zu unterstützen. Infolgedessen hat die Erforschung der Geldpolitik unermüdlich neue Methoden zum Messen von Text und neue unstrukturierte Datenquellen wie Nachrichten, Pressekonferenzerklärungen und Reden in ihre Forschung einbezogen. Die Literatur wird dabei laufend durch eine Erweiterung der traditionellen empirischen Instrumente aus dem Bereich des maschinellen Lernens ergänzt. Die hier vorgelegte kumulative Dissertation besteht aus vier Aufsätzen, die sich auf alle diese Bereiche beziehen, nämlich Text als Daten, Geldpolitik und maschinelles Lernen. Mein Hauptaugenmerk liegt auf der Europäischen Zentralbank (EZB), aber die Methoden und Ideen lassen sich auch auf andere Zentralbanken übertragen. In dieser Dissertation wird Text aus unterschiedlichen Quellen einbezogen und mit unterschiedlichen Techniken analysiert, um unterschiedliche latente Variablen zu ermitteln. Infolgedessen wird der Text manchmal als abhängige Variable und manchmal als unabhängige Variable verwendet. Der erste Aufsatz zählt die relative Häufigkeit von Begriffen in EZB Presseerklärungen, um die Vielfalt der Kommunikation der Zentralbank in Bezug auf ihre Themen anekdotisch zu belegen, während der zweite Aufsatz sich auf positive und negative Begriffe in Reden konzentriert, um die latente Variable des Zentralbankverlustes zu approximieren. Im dritten Aufsatz werden die Auswirkungen sprachlicher Komplexität auf Finanzmarktteilnehmer untersucht, und der letzte Aufsatz wendet sich an die Computer-Linguistik zur Entwicklung eines neuartigen zentralbankspezifischen Sprachmodells zur besseren Quantifizierung der geldpolitischen Kommunikation. Im Folgenden finden Sie eine kurze Zusammenfassung der vier Aufsätze dieser Dissertation. Mein erster Aufsatz analysiert die regelbasierte Geldpolitik im Euroraum vor und nach der Finanzkrise. Jonas Gross und ich argumentieren, dass das Umfeld, in dem geldpolitische Entscheidungsträger agieren, weitaus komplexer ist, als es traditionelle modellbasierte Analysen der geldpolitischen Regeln erlauben. Wir ergänzen diese Sichtweise durch Erkenntnisse aus EZB-Pressekonferenzen, die zeigen, dass die Zentralbank ein breites Spektrum an Themen jenseits der traditionellen Taylor-Regel-Variablen diskutiert. Da jede Variable das Potenzial hat, für das Verständnis der Reaktionsfunktion der Zentralbank relevant zu sein, kombinieren wir eine Literaturanalyse mit der Auswertung von Pressekonferenzen, um eine Reihe potenzieller Einflussfaktoren zu ermitteln. Der traditionelle Ansatz einer einzigen Zinsreaktionsfunktion wird dann durch die Anwendung von Bayesian Model Averaging auf diese Determinanten gegenübergestellt. Da wir eine große Anzahl von Determinanten mit einbeziehen, schätzen wir insgesamt 33.000 verschiedene Modellkombinationen. Unsere Ergebnisse deuten darauf hin, dass die EZB entgegen der anhaltenden Kritik bei ihren Zinsentscheidungen in erster Linie auf Änderungen in der Inflation reagiert. Die Inflationsrate stellt in fast allen untersuchten Modellkombinationen eine signifikante Variable dar. Darüber hinaus stellen wir fest, dass die EZB auch auf Veränderungen bei Konjunkturindikatoren wie Arbeitslosigkeit und Produktion reagiert. Wir stellen jedoch eine Verschiebung der Gewichtung im Laufe der Zeit fest. Konjunkturindikatoren hatten vor der Finanzkrise für die EZB Priorität, haben aber seitdem an Bedeutung verloren, was darauf hindeutet, dass die Inflationsrate die einzige treibende Kraft für geldpolitische Entscheidungen seit der Krise ist. Abschließend bewerten wir unsere Ergebnisse anhand von Textdaten aus den EZB-Pressekonferenzen, wo wir in Übereinstimmung mit den vorherigen Ergebnissen die gleiche Verschiebung feststellen. Mein zweiter Aufsatz konzentriert sich auf die Zielsetzung der EZB und quantifiziert die Zufriedenheit der Zentralbank mit den aktuellen wirtschaftlichen Bedingungen anhand einer Textanalyse. Es wird angenommen, dass die EZB durch die Maximierung einer impliziten Zielfunktion ein Inflationsziel verfolgt, dem die Unterstützung der allgemeinen Wirtschaftspolitik der Europäischen Union untergeordnet ist. Ich berechne die Zufriedenheit der Zentralbank anhand der öffentlichen Kommunikation der Zentralbank, indem ich die Anzahl der positiven und negativen Wörter in den Reden zähle. Dies ermöglicht es mir die Zielfunktion zu quantifizieren. Unter Annahme einer typischen funktionalen Form kann ich dann die optimalen Niveaus in Bezug auf Inflation und Wirtschaftstätigkeit ermitteln, d.h. die Werte, bei denen die Kommunikation der Zentralbank am positivsten ist. Die Verwendung eines Wörterbuchansatzes zur Schätzung des Zielfunktion führt zu mehreren interessanten Ergebnissen. Das überraschendste Resultat dürfte die konkave Inflationszielfunktion mit einem impliziten Inflationsziel von 'über, aber nahe 2%' sein. Bei Abweichungen von dieser Inflationsrate wird die Sprache in den Reden pessimistischer. In Bezug auf das untergeordnete Ziel stelle ich eine konvexe Zielfunktion im Hinblick auf das Produktionswachstum und eine lineare Zielfunktion im Hinblick auf die Arbeitslosenquote fest. Darüber hinaus deuten meine Ergebnisse darauf hin, dass Abweichungen vom primären Ziel, der Inflationsrate, keinen größeren Einfluss auf die Sprache der Reden haben als Abweichungen von einem der Sekundärziele. Im Gegensatz zur Inflation sind vielmehr sowohl die Produktion als auch die Arbeitslosigkeit durchweg signifikante Variablen. Abschließend lässt sich feststellen, dass die Finanzmarktbedingungen im Gegensatz zu den Ergebnissen in den Vereinigten Staaten keinen signifikanten Einfluss auf die Reden der EZB haben. Im dritten Aufsatz untersuchen Bernd Hayo, Kai Henseler, Marc Steffen Rapp und ich die Auswirkungen von Zentralbank-Kommunikation auf die Finanzmärkte. Wir interessieren uns insbesondere wie die Komplexität dieser Kommunikation den Finanzhandel beeinflusst. Um ebendiese Beziehung empirisch zu analysieren, verwenden wir Hochfrequenzdaten von europäischen Aktienindex-Futures während der Einführungsstatements der EZB-Pressekonferenzen. Ein Lesbarkeits-Test bestimmt die sprachliche Komplexität dieser Statements. In Verbindung mit dem einzigartigen Pressekonferenz-Konzept der EZB sind wir in der Lage, die Auswirkungen von erhöhter sprachlicher Komplexität auf den Handel zu messen, sowie die Effekte zwischen der einleitenden Erklärung und der anschließenden Q&A-Runde zu trennen. Da unsere Stichprobe Ankündigungen unkonventioneller geldpolitischer Maßnahmen (UMPM) enthält, sind wir in der Lage zu analysieren, ob der Inhalt der Erklärungen mit der Reaktion der Händler auf ihre sprachliche Komplexität zusammenhängt. Wir stellen fest, dass die Q&A-Runden - in Bezug auf die sprachliche Komplexität - weniger komplex und damit verständlicher sind. Nur wenn UMPM angekündigt werden, korrelieren die Handelsvolumina negativ mit Komplexität, was zu einer zeitlichen Verschiebung des Handels in Richtung der weniger komplexen Q&A-Runde führt. Diese Verschiebung ist ein erster Hinweis darauf, dass die Finanzmärkte auf sprachliche Komplexität kontextspezifisch reagieren. Diese Argumentation wird durch die Beobachtung verstärkt, dass Pressekonferenzen, die UMPM enthalten, vom Wortlaut her weniger Ähnlichkeiten mit früheren Konferenzen aufweisen. Infolgedessen glauben wir, dass die Finanzmarkthändler auf neuartige komplexe Informationen in einleitenden Erklärungen zu UMPM reagieren. Die anschließende Diskussion und Erläuterung des kognitiv kostspieligen Inhalts während der Q&A-Runde mildert den Effekt ab und verlagert so den Handel von der Phase der Einführungsstatements in die Q&A-Phase. Der letzte Aufsatz befasst sich mit der Quantifizierung von Zentralbank-Kommunikation, d.h. er untersucht, wie geldpolitische Texte effektiv zusammen-gefasst und analysiert werden können. Martin Baumgärtner und ich schlagen ein neuartiges Sprachmodell vor, das auf maschinellem Lernen aufbaut. Die Notwendigkeit und Durchführbarkeit, die Kommunikation von Zentralbanken auf diese Weise zu messen, ergibt sich aus zwei wichtigen Entwicklungen im Be-reich der Geldpolitik und des maschinellen Lernens in den letzten zwei Jahrzehnten. Zum einen hat die Kommunikation der Zentralbanker, sowie deren Analyse, erheblich zugenommen. Dieser Fortschritt erfordert eine Art von Quantifizierung der qualitativen Komponenten, ein Forschungsthema, das von Wörterbuchansätzen dominiert wird. Andererseits ermöglichten Fortschritte an der Schnittstelle zwischen Linguistik und Informatik den zunehmenden Einsatz von maschinellem Lernen. Die so trainierten Sprachmodelle können die Mehrdimensionalität und Kontextabhängigkeit von Sprache adäquat erfassen. Die daraus resultierenden Modelle sind in der Regel frei zugänglich. Aufgrund des Fachjargons der Zentralbanker sind sie jedoch für den Einsatz in der Praxis im Allgemeinen ungeeignet. In diesem Aufsatz wenden wir Computer-linguistische Forschung auf die Geldpolitik an, indem wir ein Sprachmodell entwickeln, das ausschließlich auf die Kommunikation von Zentralbanken trainiert ist. Zu diesem Zweck erstellen wir einen umfangreichen und vielfältigen Textkorpus, mit welchem wir eine Reihe von modernsten Algorithmen für maschinelles Lernen vergleichen. Wir wählen den vielversprechendsten aus und entwickeln ein zentralbankspezifisches Sprachmodell. Anhand mehrerer Anwendungen wird die breite Anwendbarkeit dieses Sprachmodells aufgezeigt. Zunächst schlagen wir eine neue Methode zum Vergleich von Zentralbanken vor, die verdeutlicht, dass die Ähnlichkeit durch gemeinsame Ziele bedingt ist. Anschließend konstruieren wir einen Zeitreihen-Index, der die Bereitschaft der EZB widerspiegelt, als letzte Refinanzierung-Instanz zu agieren. Der Index deutet darauf hin, dass eine ähnliche Kommunikation wie Mario Draghis "whatever it takes"-Rede die Finanzmärkte in Zeiten großer Unsicherheit beruhigen kann. Die dritte Anwendung unterstreicht das Vorliegen von Vorurteilen, selbst in dem technischen Jargon von Notenbankern. Wir zeigen, wie sich soziale Muster, z.B. die Verteilung der Geschlechter im Beruf, in der Kommunikation der Zentralbanker widerspiegeln. Die letzte Anwendung ist eine Prognoseübung, welche darauf hindeutet, dass Notenbankreden möglicherweise genauere Vorhersagen ermöglichen, als die bisherige Forschung vermuten lässt.