A machine learning based 24-h-technique for an area-wide rainfall retrieval using MSG SEVIRI data over Central Europe
The aim of the present study was to develop a 24-h-technique for the process-related and quantitative estimation of precipitation in connection with extra-tropical cyclones in the mid-latitudes based on MSG SEVIRI data using the machine learning algorithm random forest. The algorithms and approach...
Main Author: | |
---|---|
Contributors: | |
Format: | Doctoral Thesis |
Language: | English |
Published: |
Philipps-Universität Marburg
2014
|
Subjects: | |
Online Access: | PDF Full Text |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Das Ziel der vorliegenden Arbeit war die Entwicklung einer neuen 24-Stunden-Methode zur prozessbasierten und quantitativen Niederschlagserfassung, basierend auf MSG SEVIRI Daten und dem maschinellen Lernverfahren Random Forest. Der Fokus lag dabei auf Niederschlagsprozessen im Zusammenhang mit außertropischen Zyklonen in den Mittelbreiten. Die dafür notwendigen Algorithmen und Ansätze wurden in den folgenden Arbeitspaketen erfolgreich umgesetzt: (WP1) Das ursprünglich für Terra MODIS implementierte Verfahren zur Ableitung von Wolkeneigenschaften SLALOM wurde an die spezifischen Anforderungen des SEVIRI Systems angepasst und erfolgreich übertragen. In einer umfangreichen Validierungsstudie wurden die mit Hilfe von SLALOM abgeleiteten Wolkeneigenschaften effektiver Wolkenradius und optische Wolkendicke mit dem NASA MODIS Wolkenprodukt (MODIS 06) sowie dem optische Wolkendicke Produkt (2B-Tau) von CloudSat verglichen. Die Eignung von SLALOM konnte für eine Region im Nordatlantik sowie über dem europäischen Kontinent gezeigt werden (Kapitel 3). Die abgeleiteten Wolkenparameter dienten als Basis für eine verbesserte Niederschlagserfassung in den Arbeitspaketen WP2 und WP3. (WP2) Ein neues Verfahren für die Zuweisung von Niederschlagsraten wurde für MSG SEVIRI entwickelt. Hierbei diente das maschinelle Lernverfahren Random Forest als grundlegender Vorhersagealgorithmus. Basierend auf den dominierenden Niederschlagsprozessen in Verbindung mit außertropischen Zyklonen erfolgte die Zuweisung der Niederschlagsraten durch einzelne RF Modelle für bereits identifizierte advektiv-stratiforme und konvektive Regenflächen. Die Identifikation der Flächen erfolgte mit Hilfe von Radardaten. Als Prediktorvariablen für die RF Modelle wurden satellitenbasierte Informationen über die Wolkenhöhe, Wolkenoberflächentemperatur, Wolkenphase und Wolkenwasserweg herangezogen. Entsprechend der unterschiedlichen Beleuchtungsbedingungen (Tag, Dämmerung und Nacht) wurde eine passende Auswahl an SEVIRI Spektralkanälen gewählt. Die Entwicklung erfolgte in drei Schritten: Als erstes wurde eine intensive Studie zur Anpassung der einzelnen RF Modelle durchgeführt um die Modellparameter individuell anzupassen. Unter der Verwendung dieser Modellparamter erfolgte im nächsten Schritt das Training der RF Modelle. Diese RF Modelle wurden dann für die Zuweisung der Niederschlagsraten für unabhängige Validierungsdatensätze verwendet und die Ergebnisse gegen Niederschlagsraten des radarbasierten RADOLAN RW Produkts des Deutschen Wetterdienstes verglichen. Die hervorragenden Validierungsergebnisse zu allen Tageszeiten bestätigten die Eignung von Random Forest als Tool für die Ableitung der Niederschlagsraten von MSG SEVIRI Daten (Kapitel 4). (WP3) Ein neues Niederschlagsverfahren das gleichermaßen am Tage, zur Dämmerung und nachts anwendbar ist, wurde für MSG SEVIRI entwickelt. Ziel des Verfahrens ist es Niederschlagsraten für Niederschlagsereignisse in Verbindung mit außertropischen Zyklonen in den Mittelbreiten kontinuierlich zu bestimmen, so dass eine 24 Stunden Vorhersage erzielt wird. Basierend auf den dominanten Niederschlagsprozessen besteht das vorgestellte Verfahren aus drei Schritten, die mit Hilfe individueller Random Forest Modelle nacheinander ausgeführt werden: (i) Identifikation regnender Wolkenbereiche. (ii) Aufteilung dieser Wolkenbereiche in konvektiv und advektiv-stratiform dominierte Wolkenbereiche. (iii) Prozessbasierte Zuweisung der Niederschlagsraten. Wie bereits in WP2 wird der Zusammenhang zwischen satellitenbasierten Informationen überWolkenhöhe, Wolkenoberflächentemperatur, Wolkenphase und Wolkenwasserweg zur Ableitung der Niederschlagsinformationen verwendet und entsprechend der Beleuchtungsbedingungen eine passende Auswahl an Prediktorvariablen als Inputvariablen für die Random Forest Modelle gewählt (Kapitel 5). Das neu entwickelte Niederschlagsverfahren wurde mit Hilfe des radargestützten RADOLAN RW Produkts im Rahmen einer umfangreichen Studie über Deutschland validiert. Die Ergebnisse der Validierungsstudie zeigten eine überzeugende Performanz der neuen Technik sowohl hinsichtlich der identifizierten Niederschlagsfläche, der differenzierten Niederschlagsprozesse sowie der abgeleiteten Niederschlagsraten zu allen Tageszeiten. Dies ermöglicht die Beobachtung und Erfassung des Niederschlags 24 Stunden am Tag. Hervorzuheben sind an dieser Stelle die Anwendbarkeit während der Dämmerung sowie die guten Niederschlagsvorhersagen auf stündlicher Basis. Damit wurde ein Ansatz gefunden, der die Defizite vorheriger optischer Niderschlagsverfahren überwindet und erstmals die Niederschlagserfassung nicht nur konvektiver sondern auch advektiv-stratiform regnender Wolkenbereiche 24 Stunden am Tag ermöglicht.