Application of Machine Learning in the Detection of Antimicrobial Resistance

Antimicrobial resistance (AMR) has become one of the significant global threats to both human and animal health, intensifying the need for rapid and precise AMR diagnostic methods. Traditional antimicrobial susceptibility testing (AST) is time-consuming, low throughput, and limited to cultivable bac...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Ren, Yunxiao
Beteiligte: Heider, Dominik (Prof. Dr.) (BetreuerIn (Doktorarbeit))
Format: Dissertation
Sprache:Englisch
Veröffentlicht: Philipps-Universität Marburg 2023
Schlagworte:
Online-Zugang:PDF-Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!

Die Antibiotikaresistenz (AMR) ist zu einer der größten globalen Bedrohungen für die Gesundheit von Mensch und Tier geworden, was den Bedarf an schnellen und präzisen AMR-Diagnoseverfahren erhöht. Traditionelle antimikrobielle Empfindlichkeitstests (AST) sind zeitaufwändig, haben einen geringen Durchsatz und sind auf kultivierbare Bakterien beschränkt. Maschinelles Lernen bietet einen vielversprechenden Weg für die automatische AMR Vorhersage. Die meisten bestehenden Modelle legen jedoch den Schwerpunkt auf Merkmale, die sich nur auf bekannte Resistenzgene und -varianten beziehen, und stützen sich stark auf AMR-Referenzdatenbanken, wodurch neue AMR-bezogene Merkmale übersehen werden können. Um die oben genannten Herausforderungen zu bewältigen, werden in unserer ersten Studie genomweite maschinelle Lernmodelle zur effizienten Erkennung von AMR ohne Abhängigkeit von vorherigem AMR-Wissen eingeführt. Konkret haben wir verschiedene Modelle, darunter logistische Regression (LR), Support Vector Machine (SVM), Random Forest (RF) und Convolutional Neural Network (CNN), zur Vorhersage von Resistenzen gegen vier Antibiotika untersucht. Unsere Ergebnisse zeigen, dass diese Modelle AMR mit Label-Codierung, One-Hot-Codierung und `Frequency Matrix Chaos Game Representation' (FCGR) auf ganze Genom-Sequenzierungsdaten effektiv vorhersagen können. Im Allgemeinen übertrafen RF und CNN die LR und SVM Modelle. Wichtig ist, dass wir für jedes Antibiotikum spezifische Mutationen identifiziert haben, die mit AMR in Verbindung stehen. Darüber hinaus konzentrieren sich aktuelle AMR-Studien auf die Vorhersage der Resistenz gegen ein einzelnes Medikament und ignorieren die kumulative Natur der antimikrobiellen Resistenz im Laufe der Zeit, was die schnelle Identifizierung von Multiresistenzen (MDR) zu einer Herausforderung macht. Um diese Einschränkungen zu überwinden, haben wir in unserer zweiten Studie fünf Multi-Label-Klassifikationsmodelle (MLC) für MDR-Probleme entwickelt. Unsere Ergebnisse zeigten, dass das ECC-Modell (Ensemble Classifier Chains) die anderen MLC-Methoden übertraf und eine deutliche Wirksamkeit bei der Vorhersage von MDR zeigte. Darüber hinaus stellen begrenzte Trainingsstichproben und unausgewogene Daten erhebliche Hindernisse für die Generalisierung und Genauigkeit von AMR-Modellen dar. Um diese Herausforderungen zu überwinden, haben wir in unserer dritten Studie ein Deep-Transfer-Learning-Modell auf der Grundlage einer CNN-Architektur vorgeschlagen. Zunächst trainieren wir das Modell auf vier Datensätzen, dann wird das beste Modell als Ausgangsmodell für das `Transfer Learning' verwendet, und das Modell wird auf kleinen Datensätzen neu trainiert, indem die Architektur und Gewichte vom Ausgangsmodell übertragen werden. Unsere Ergebnisse zeigen, dass unser Deep-Transfer-Learning-Modell die Modellleistung für AMR-Vorhersagen auf kleinen, unausgewogenen Datensätzen verbessert. In einer Zeit, in der Datensicherheit und Datenschutz von entscheidender Bedeutung sind, bieten `Federated Learning' (FL) und `Swarm Learning' (SL) Lösungen, indem sie Daten während des Trainings lokal halten. Dieser Ansatz reduziert die Notwendigkeit, sensible Informationen an einen zentralen Server zu übertragen und verbessert die Effizienz durch die Verteilung der Rechenlast. Darüber hinaus wird beim Schwarmlernen eine Dezentralisierung erreicht, da im Vergleich zum föderierten Lernen kein zentraler Server zur Verwaltung der Parameter erforderlich ist, was die Sicherheit der Daten weiter verbessert. In unserer vierten Studie befassen wir uns daher mit der Anwendung des Schwarmlernens speziell im Zusammenhang mit AMR.