Proteine sind wesentlich für das Funktionieren unserer Zellen, doch viele Fragen zu ihrer Synthese, ihrem Vorkommen, ihren Funktionen und Defekten sind noch unbeantwortet. Hochdurchsatztechniken können helfen, unser Verständnis dieser Moleküle zu verbessern. Für die Analyse mittels Flüssigchromatographie und anschließender Massenspektrometrie (MS) werden die Proteine in kleinere Peptide zerlegt, ein Prozess, der als "Shotgun-Proteomik" bezeichnet wird. Das Masse-Ladungs-Verhältnis dieser Peptide wird anschließend mit einem Massenspektrometer bestimmt. Als Ergebnis erhält man MS-Spektren. Aus diesen Spektren können Informationen über die Identität der analysierten Proteine rekonstruiert werden. Die enorme Menge und Komplexität der Daten macht die Datenanalyse und -interpretation jedoch zu einer Herausforderung.
In der Shotgun-Proteomik werden vorwiegend zwei Methoden verwendet: Die datenabhängige Erfassung (DDA) und die datenunabhängige Erfassung (DIA). Bei der DDA-Methode werden die am häufigsten vorkommenden Peptide einer Probe vorausgewählt, bevor sie fragmentiert und gemessen werden. Somit können die Sequenzen dieser wenigen, vorselektierten Peptide rekonstruiert werden, was die Analyse einfacher und schneller macht. Allerdings führt diese Methode zu einer Verzerrung der Analyse in Richtung der am häufigsten vorkommenden Peptide. Die DIA-Methode hingegen ist robuster und sensitiver. Es werden hierbei alle Peptide aus einem bestimmten Massenbereich auf einmal fragmentiert und gemessen, ohne sie vorher nach Häufigkeit vorauszuwählen. Dadurch werden große Datenmengen generiert und die Komplexität der erhaltenen Daten steigt erheblich. Die Identifizierung der ursprünglichen Proteine war bisher nur durch den Abgleich der neu gemessenen Spektren mit Bibliotheken möglich, die bereits früher gemessene Spektren umfassen.
Cox und sein Team haben nun eine Software entwickelt, die einen vollständigen, computergestützten Workflow für DIA-Daten bietet. Diese ermöglicht es erstmals, Algorithmen auf DDA- und DIA-Daten in gleicher Art und Weise anzuwenden. Somit werden Studien, die entweder auf DDA oder DIA basieren, nun leichter vergleichbar. MaxDIA analysiert Proteomik-Daten mit und ohne Verwendung spektraler Bibliotheken. Mithilfe von maschinellem Lernen sagt die Software die Peptidfragmentierung und die spektralen Intensitäten voraus. Sie erzeugt somit präzise spektrale MS-Bibliotheken in silico. MaxDIA beinhaltet auch einen bibliotheksfreien Discovery-Modus mit zuverlässiger Kontrolle von falsch-positiven Protein-Identifikationen. Darüber hinaus unterstützt die Software neue Technologien wie Bootstrap DIA, BoxCar DIA und Trapped Ion Mobility Spectrometry DIA.
Das Team arbeitet bereits an der weiteren Verbesserung der Software. Es werden mehrere Erweiterungen entwickelt, zum Beispiel zur Verbesserung der Analyse posttranslationaler Modifikationen und zur Identifizierung von quervernetzten Peptiden.
MEDICA.de; Quelle: Max-Planck-Institut für Biochemie