auch die Überlebensraten sind sehr verschieden. Meist werden sie auf der Basis von Genexpressionsdaten in Subtypen klassifiziert.
"Die meisten Krankheiten sind deutlich komplexer als ein einzelnes Gen", sagt Dr. Altuna Akalin, der Leiter der Forschungsgruppe Bioinformatik am Berliner Institut für Medizinische Systembiologie (BIMSB) des Max-Delbrück-Centrums für Molekulare Medizin (MDC). "Um diese Komplexität zu erfassen, brauchen wir irgendeine Art von maschinellem Lernen, die wirklich sämtliche Daten verarbeiten kann."
Um die zahlreichen im genetischen Material vorhandenen Merkmale, einschließlich der Genexpression, Punktmutationen und strukturelle Veränderungen, bei denen ein DNA-Abschnitt mehrfach erzeugt wird (CNV, copy number variants), analysieren zu können, haben Akalin und sein Doktorand Jonathan Ronen die "Multi-omics Autoencoder Integration"-Plattform, kurz "maui", entworfen.
Für überwachtes maschinelles Lernen braucht man normalerweise menschliche Experten, die die Daten kennzeichnen und den Algorithmus dann so trainieren, dass er diese Kennzeichen vorhersagen kann. Beim unüberwachten maschinellen Lernen ist hingegen kein Training notwendig. Ein Deep-Learning-Algorithmus wird mit Daten ohne Kennzeichnungen gefüttert und sichtet diese, um gemeinsame Muster oder typische Eigenschaften – in der Fachsprache heißen sie latente Faktoren – zu finden.
Als Deep-Learning-Plattform ist maui in der Lage, mehrere Omics-Datensätze zu analysieren und die wichtigsten Muster oder Merkmale, in diesem Fall Gensätze oder Indikatoren für Darmkrebs, zu erkennen.
Die maui-Plattform erkannte in den Daten Muster, die mit den vier bekannten Subtypen kolorektaler Karzinome übereinstimmen, und ordnete Tumore diesen Subtypen mit hoher Präzision zu. Sie hat noch eine interessante Entdeckung gemacht. Sie fand ein Muster, das nahelegt, dass ein Subtyp (CMS2) gegebenenfalls in zwei verschiedene Gruppen unterteilt werden muss.
Das Programm war nicht nur genauer, es arbeitet auch schneller als andere Algorithmen des maschinellen Lernens – nur drei Minuten braucht es, um 100 Muster herauszufiltern. Andere Programme benötigten dafür 20 Minuten oder sogar elf Stunden.
Um die Wirkung potenzieller Medikamente zu untersuchen, passte das Team das Programm etwas an: Es kann nun auch Zelllinien analysieren, die Tumoren entnommen bzw. im Labor gezüchtet wurden. Auf molekularer Ebene unterscheiden sich Zelllinien jedoch auf vielerlei Weise von echten Tumoren. Um das Ausmaß der Unterschiede abzuschätzen, verglich das Team mithilfe von maui Zelllinien, an denen derzeit Wirkstoffe gegen Darmkrebs getestet werden, mit Zellen aus echten Tumoren. Knapp die Hälfte der Zelllinien war demnach enger mit anderen Zelllinien verwandt als mit echten Tumoren. Nur eine Handvoll Linien ähneln den verschiedenen Arten kolorektaler Karzinome am meisten.
Die Suche nach neuen Medikamenten verlässt sich zwar längst nicht nur auf Zelllinien, diese Erkenntnis könnte aber dazu beitragen, das volle Potenzial der Zelllinienforschung besser auszuschöpfen.
Ein Arzt oder eine Ärztin könnte die genetischen Daten eines Erkrankten in maui einspeisen, um die beste Übereinstimmung zu finden und so den Tumor schnell und genau zu klassifizieren. Die Plattform könnte dann Medikamente empfehlen, die bei ähnlichen Tumoren gut angeschlagen haben. So könnte sie voraussagen helfen, ob eine bestimmte Therapie etwas nützt und wie die Überlebensrate ist.
MEDICA.de; Quelle: Berliner Institut für Medizinische Systembiologie (BIMSB) des Max-Delbrück-Centrums für Molekulare Medizin (MDC)