Auf diese Hürden stießen auch Prof. David Blumenthal und sein Team, als sie selbst im Bereich der KI forschten. Daraufhin haben sie AIMe entwickelt: Das Tool soll KI reproduzierbar und transparenter machen. Wie das Tool funktioniert, wie es stets auf dem aktuellen Stand bleibt und welche Möglichkeiten Blumenthal für KI im Bereich der biomolekularen Forschung sieht, erklärt er im Interview mit MEDICA.de.
Welches Ziel verfolgen Sie mit AIMe?
David Blumenthal: Wir wollen Forschern und Entwicklern helfen, transparente Berichte über biomedizinische KI-Systeme zu erstellen, in denen insbesondere Meta-Parameter, Validierungs-Strategie und Daten genau beschrieben werden. Das Ziel dabei ist, dass Transparenz und Reproduzierbarkeit von solchen Systemen erhöht werden, damit dann wiederum das Vertrauen in solche Systeme gestärkt wird – zum Beispiel von Menschen, die solche Systeme in der klinischen Praxis nutzen könnten.
Für welche Anwendungsfälle ist AIMe gedacht?
Blumenthal: AIMe ist ein generischer Standard, der im Prinzip für alle biomedizinischen KI-Systeme verwendet werden kann. Da wir selbst aus dem Bereich der molekularen Forschung kommen, hatten wir entsprechend Anwendungsfälle, deren Ausgangspunkt molekulare Daten waren. Diesen Hintergrund hatten wir bei der Entwicklung des AIMe-Standards im Hinterkopf, aber letztendlich ist AIMe für jede biomedizinische KI-Anwendung nutzbar.
Und wie genau funktioniert AIMe?
Blumenthal: Es gibt einerseits den AIMe-Standard: Der Informationsstandard besteht aus circa 25 Fragen, die in verschiedene Abschnitte aufgeteilt sind. Jeweils fünf Fragen behandeln einen Abschnitt: Meta-Data, Purpose – sprich was ist das Ziel der KI – und Data-Set – da sollen die Datensätze beschrieben werden, die verwendet werden. Dazu kommen noch die Fragen nach der Methode – also welche KI-Methoden wurden verwendet, wie wurden die Hyper-Parameter gesetzt, wie wurde das Ganze validiert; und zum Schluss noch Fragen nach der Reproduzierbarkeit. Da geht es darum, die KI und ihre Entwicklung bestmöglich nachverfolgen zu können: Wo ist der Source Code verfügbar, wo sind die Datensätze verfügbar? Gibt es gute Tutorials, die erklären, wie die spezielle KI funktioniert?
Das sind die ersten fünf Abschnitte, mit denen der Informationsstandard erstellt wird.
Das Ganze gibt es dann auch noch in digitaler Form: Im AIMe-Webservice bekommen Interessierte einen Online-Fragebogen, in dem diese Fragen gestellt werden. Nach Beantwortung der Fragen wird ein AIMe-Eintrag erstellt, der in unserer Datenbank abgespeichert wird und eine eindeutige URL bekommt. Daraufhin ist die Datenbank durchsuchbar: Wenn jemand an bestimmten Anwendungen interessiert ist, kann er oder sie sich mit einer Stichwort-Suche durch die existierenden Einträge in dieser Datenbank blättern.
Die URL ist außerdem dafür da, sich in Forschungsarbeiten genauer auf die jeweilige KI zu beziehen: Arbeitet jemand beispielsweise an einem Paper, kann der Forscher erläutern, dass genauere Beschreibungen zu den Datensätzen, der Validierung, Strategie und so weiter im Anhang des Papers zu finden sind. Dort kann die URL angegeben werden, sodass dem Leser auf unserer Website mehr Informationen über die KI zur Verfügung stehen.
Abschließend gibt es noch das AIMe steering committee, das dafür zuständig ist, einerseits das Feedback der Nutzenden zum derzeitigen Standard zusammenzufassen und diesen dann jedes Jahr – basierend auf dem Feedback – zu aktualisieren. Außerdem ist das Committee natürlich auch dafür zuständig, die Website zu hosten und damit die technische Seite abzudecken.