Im Interview mit MEDICA.de berichtete er, welche Schwierigkeiten er und sein Team dabei zu meistern hatten und wie „ikarus“ bereits dazu beigetragen hat, völlig neue Erkenntnisse zu gewinnen.
Herr Dr. Akalin, Sie haben gerade "ikarus" entwickelt, ein maschinelles Lernprogramm, das krebskranke Zellen von gesunden Zellen unterscheiden kann. Wie genau funktioniert es?
Dr. Altuna Akalin: Wir haben eine Software entwickelt, die mit Einzelzell-Auflösung arbeitet und Genexpressionsmuster für bestimmte Zelltypen bestimmen kann. Im Falle von Krebserkrankungen, fand das Programm in den Tumorzellen ein krebsübergreifendes Muster, bestehend aus einer charakteristischen Kombination an Genen. Der Algorithmus entdeckte in dem Muster außerdem Arten von Genen, die man bislang nicht eindeutig mit Krebs in Verbindung gebracht hatte.
Was war die größte Herausforderung bei der Entwicklung von "ikarus"?
Dr. Akalin: Datensätze aus Einzelzell-Sequenzierungen sind häufig verrauscht. Das bedeutet, dass die darin enthaltenen Informationen über die molekularen Eigenschaften der einzelnen Zellen nicht ganz genau sind – weil zum Beispiel in jeder Zelle eine unterschiedliche Anzahl von Genen erkannt wird, oder weil die Proben nicht immer gleich verarbeitet werden. Unser Team durchforstete daher unzählige Publikationen und kontaktierte etliche Forschungsgruppen, um geeignete Datensätze zu bekommen. Das Team verwendete schließlich Daten von Lungen- und Darmkrebszellen, um den Algorithmus zu trainieren, bevor sie ihn auf Datensätze von weiteren Tumorarten anwandten.