Proteine: Datenbank für biomedizinische Forschung

12/06/2013
Foto: Moleküle

Der Datenbestand von "ProteomicsDB" bildet mehr als 18.000 Gene der etwa 20.000 menschlichen Gene ab;
© panthermedia.net/Ivan Mikhaylov

„ProteomicsDB“ der SAP AG und der Technischen Universität München bietet die bislang vollständigste Sammlung an Proteinen und Peptiden, die Wissenschaftler bislang identifiziert haben.

Der derzeitige Datenbestand macht über 90 Prozent des menschlichen Proteoms aus; er bildet mehr als 18.000 Gene der etwa 20.000 menschlichen Gene ab. ProteomicsDB verschafft Wissenschaftlern auf der ganzen Welt kostenfreien Zugang zu Proteindaten für die biologisch-medizinische Forschung. Eines der großen Ziele der medizinischen Forschung ist es, Menschen individuell zu therapieren: Die „personalisierte“ Medizin berücksichtigt genetische Aspekte ebenso wie den Stoffwechsel und das Proteinportfolio der Patienten. Auf der Grundlage individueller Daten können Wissenschaftler neue Ansatzpunkte für Therapien, Wirkstoffkandidaten und Medikamente entwickeln. Diese Informationen lassen sich aber nur mit sehr umfangreichen Datenanalysen gewinnen.

ProteomicsDB setzt einen bedeutenden Meilenstein für die Kartierung des menschlichen Proteoms. Derzeit enthält die Datenbank über 11.000 Datensätze aus menschlichen Krebszelllinien, Geweben und verschiedenen Körperflüssigkeiten. Diese multidimensionalen Daten lassen sich unter verschiedenen Blickwinkeln darstellen, zum Beispiel in Bezug auf die chromosomale Herkunft und den Genort oder auf Übereinstimmungen mit anderen Proteinen. Auf diese Weise können wissenschaftliche Fragestellungen umgehend analysiert und bewertet werden.

ProteomicsDB ist eine einfach zu bedienende und schnelle Web-Anwendung, mit der sich Datensätze hochladen und durchsuchen lassen. Wie in einem Katalog können die Anwender das menschliche Proteom durchblättern und proteinspezifische Daten laden, zum Beispiel die Funktion eines Proteins oder seine Verbreitung im Gewebe. Der Zugang zur Datenbank ist kostenfrei – und bietet Anwendern aus der Forschung sowie der Pharma- und Biotechbranche einen bisher einzigartigen Einblick in das menschliche Proteom. Mit der Auswertung von Proteindaten können Wissenschaftler künftig zum Beispiel die Entwicklung neuer Medikamente vorantreiben, die sehr gezielt in einzelne Abläufe in der Zelle eingreifen und damit Nebenwirkungen vermeiden helfen.

Das Rückgrat der Datenbank bilden 50 Terabyte an Speicher, 2 Terabyte RAM und 160 Prozessorkerne. Eine direkte Schnittstelle für die Programmiersprachen L, C++ und R erlaubt komplexe Rechenvorgänge, die weit über den SQL-Standard hinausgehen. Das Webinterface bedient sich eines JavaScript-Frameworks für HTML5 und ist für den Einsatz mit dem Chrome-Webbrowser optimiert, läuft aber auch unter Internet Explorer und Firefox.

Professor Bernhard Küster beschreibt die Vorteile: „Mit dem Verfahren der Massenspektrometrie generiert die biomedizinische Forschung enorme Datenmengen. Für die Wissenschaftler wird es daher immer schwieriger, ‚den Wald vor all den Bäumen’ zu erkennen. ProteomicsDB ist ein bedeutender Meilenstein auf unserem Weg, Krankheiten besser zu verstehen und neue Therapiemöglichkeiten auszuloten. Die Software unterstützt Wissenschaftler und andere Zielgruppen dabei, experimentelle Daten zu speichern, zu verknüpfen und in Echtzeit auszuwerten. Damit können wir biologische Systeme wesentlich genauer untersuchen als bisher.“

MEDICA.de; Quelle: Technische Universität München