Maschinelles Lern-Tool hilft Krankheitserreger zu entdecken
Würzburg, Oktober 2019 - Per Computer erkennen, ob ein neu auftretender Salmonellenstamm eher eine gefährliche Infektion in der menschlichen Blutbahn oder eine Lebensmittelvergiftung verursacht – das kann ein neu entwickeltes maschinelles Lern-Tool. Die Software entstand im Rahmen eines internationalen Projekts von Wissenschaftlern des Wellcome Sanger Institute (Großbritannien), der University of Otago (Neuseeland) und des Helmholtz-Instituts für RNA-basierte Infektionsforschung (Würzburg), einem Tochterinstitut des Helmholtz-Zentrums für Infektionsforschung in Kooperation mit der Julius-Maximilians-Universität Würzburg.
Die Forscher können nun deutlich schneller solche genetischen Veränderungen identifizieren, die typischerweise im Zusammenhang mit aggressiven Salmonellenstämmen stehen. Damit ist das neue Tool auch von hoher Relevanz für das Gesundheitswesen. Wie kürzlich das Fachjournal "PLOS Genetics" berichtete, könnte das Lern-Tool von großer Bedeutung sein, um gefährliche Krankheitserreger zu erkennen, bevor sie einen Krankheitsausbruch verursachen.
Seit Genom-Sequenzierungen erschwinglich geworden sind, setzen Wissenschaftler sie auf der ganzen Welt ein, um anhand der genetischen Eigenschaften von Bakterien besser zu verstehen, wie diese Erreger Infektionen verursachen, wie sich Krankheiten verbreiten, wie Bakterien resistent gegen Medikamente werden und welche Bakterienstämme Krankheitsausbrüche auslösen können. Die Methoden, die derzeit zur Verfügung stehen, um die genetischen Veränderungen neuer Erregerstämme bei einem Krankheitsausbruch zu identifizieren, sind allerdings sehr zeitaufwendig und oft mit dem manuellen Abgleichen des neuen Stammes mit vorhandenen Referenz-Sammlungen verbunden.
Die Bakteriengattung "Salmonella", im deutschen Sprachgebrauch Salmonellen genannt, umfasst viele verschiedene Arten. Einige von ihnen verursachen Lebensmittelvergiftungen, bekannt als Magen-Darm-Salmonellen, während andere weit über den Darm hinausreichende Krankheiten hervorrufen – wie der Typhuserreger "Salmonella enterica" Serovar Typhi.
Um zu verstehen, wie bestimmte genetische Veränderungen dazu führen, dass ein neu auftretender Salmonellen-Stamm eine Lebensmittelvergiftung oder eine weitreichendere Infektion auslöst, haben die Forscher ein sogenanntes Machine-Learning-Tool entwickelt. Diese Software analysiert, welche Mutationen eine wichtige Rolle in der Krankheitsentwicklung spielen.
Das Entwicklerteam etablierte dafür ein Modell, das darauf trainiert wurde, wichtige krankheitsassoziierte Unterschiede zwischen verschiedenen Salmonellenstämmen gezielt zu erkennen. Als Trainingsdatensatz diente den Forschern die genetische Information von 13 bekannten und genetisch sehr unterschiedlichen Salmonella enterica-Stämmen mit unterschiedlichen Krankheitspotenzialen. Das Modell identifizierte dabei fast 200 Gene, die einen Einfluss darauf haben, ob ein Bakterium eher eine Lebensmittelvergiftung oder einen invasiven Infektionsprozess auslöst.
Dr. Nicole Wheeler, Ko-Hauptautorin der Studie am Wellcome Sanger Institute, sagte: "Wir haben ein neues Machine-Learning-Modell entwickelt, mit dem wir erkennen können, ob neu auftretende Bakterienstämme ein potenzielles Risiko für die öffentliche Gesundheit darstellen. Mit diesem Tool können wir große Datenmengen bewältigen und in Sekundenschnelle Ergebnisse erhalten. Dies wird zukünftig eine Form der Überwachung von krankheitserregenden Bakterien ermöglichen, die bisher noch nicht denkbar war – und das nicht nur auf einzelnen Krankenstationen, sondern weltweit."
Seinen ersten Praxiseinsatz hat das maschinelle Lern-Tool bereits erfolgreich bestanden: Beim Vergleich neuer Salmonella-Stämme, die derzeit südlich der Sahara auftreten, hat die Software aus der Gesamtheit häufig auftretender Infektionstypen (Salmonella Enteritidis und Salmonella Typhimurium) gezielt zwei Varianten des Erregers hervorgehoben, die besonders gefährlich sind und eine höhere Anzahl von Blutbahn-Infektionen auslösen. Diese Infektionen bedrohen vor allem Menschen mit einem geschwächten Immunsystem, wie es zum Beispiel HIV-Infizierte haben. Das maschinelle Lern-Tool zeigte deutlich die genetischen Veränderungen auf, die es diesen beiden Salmonella-Stämmen ermöglichen, sich an ihre Wirte anzupassen und damit invasiver zu werden.