Dr. Holger Pfeifer leitet das Kompetenzfeld Software Dependability bei fortiss, dem Landesforschungsinstitut des Freistaats Bayern für softwareintensive Systeme, und erläutert in diesem MEDICA.de-Interview, welchen Beitrag fortiss bei der Forschung übernommen hat, welche Erfolge in dem Projekt erzielt werden konnten und welche Hindernisse Forscher und Forscherinnen bei der Arbeit mit Deep Learning-Systemen immer wieder überwinden müssen.
Herr Dr. Pfeifer, wie funktioniert die Erkennung der Krankheit normalerweise und wie funktioniert Ihre neue Diagnose?
Dr. Holger Pfeifer: Bis jetzt bildet der Arzt die Netzhaut mit einer speziellen Kamera ab und stellt dann anhand dieses Bildes und bestimmter Indikatoren, die auf eine Schädigung hinweisen können, eine Diagnose. Das Verfahren, das von der Firma Ubotica Technologies entwickelt worden ist, versucht, das mithilfe von Künstlicher Intelligenz (KI) automatisiert zu machen. Die Idee ist, dass wir die Bilder, die aus der Kamera kommen, in ein neuronales Netz einspeisen und dieses dann klassifiziert: Entweder ja, hier gibt es Indikatoren für die diabetische Retinopathie, oder nein, hier gibt es keine Beweise. Es ist ein Hilfsmittel, das den Arzt unterstützt, diese Klassifikation vorzunehmen.
Wir bei fortiss erstellen Software-Tools, mithilfe derer man diese KI hinsichtlich ihrer Qualität untersuchen kann. Wir wollen sicherstellen, dass diese KI-Verfahren eine gute Genauigkeit haben, sodass sie die Krankheitsindikatoren tatsächlich erkennen und keine falsch positiven Meldungen geben, wenn keine Indikatoren vorliegen. Und wir möchten auch untersuchen und verstehen können, warum in bestimmten Fällen das Ergebnis "ja" oder "nein" zustande kommt – welche Dinge sind hierfür tatsächlich ausschlaggebend?
In diesem speziellen Anwendungsfall war es der Firma Ubotica wichtig, dieses KI-Verfahren direkt in die Kamera zu integrieren. Die üblichen KI-Verfahren sind relativ berechnungsaufwändig, oftmals werden dafür leistungsstarke Computer oder Cloud-Anwendungen genutzt. Aber die Vorstellung, dass wir diese Daten womöglich in eine Cloud geben müssen, um dort die Analyse durchzuführen, ist in Bezug auf Datenschutz und Privatsphäre kritisch. Daher war die Idee eine Chip-Technologie zu nutzen, um das KI-Modell direkt auf diesen Chip zu implementieren und diesen in die Kamera zu bauen, sodass die Analyse in der Praxis während der Untersuchung gemacht werden kann.
Wir wollen Ubotica in diesem recht kritischen Anwendungsfall mit unserem Neural Network Dependability Kit (NNDK) helfen, ihr Lösungsmodell hinsichtlich der Genauigkeit und der Größe besser zu verstehen, denn das Modell muss für den Chip entsprechend klein sein und schnell berechnen können. All diese Fragestellungen kann man mit unserem NNDK-Software-Tool untersuchen.
In diesem Projekt haben wir es geschafft, die Größe des ursprünglichen Chips sehr stark zu reduzieren. Außerdem konnten wir feststellen, dass die Reduktion der Größe keinen signifikanten Einfluss auf die Genauigkeit hat.
Zuletzt konnten wir eine weitere Funktion des NNDK nutzen: Wir können die Art und Weise, wie die KI auf ein Bild reagiert abspeichern und ähnliche Bilder von anderen Patienten aus unserem Datenpool herausfiltern, die möglichst ähnlich sind zu dem, was man beim aktuellen Patienten sieht. Der Arzt kann dann erkennen, dass die KI anhand der Ähnlichkeit mit anderen Beispielen eine ähnliche Klassifizierung vornimmt. Die Bilder wurden vorher von Experten gesichtet und als exemplarisch für diese Krankheit eingeordnet. Das bietet dem Arzt eine zusätzliche Entscheidungsunterstützung, denn er muss der KI nicht blind vertrauen, sondern bekommt eine Begründung für deren Entscheidung.
Wie weit sind Sie bei der Forschung, wann könnte das System zur Früherkennung wirklich genutzt werden?
Pfeifer: In unserem Projekt wurde ein Prototyp der Anwendung entwickelt und so die Machbarkeit der Lösung gezeigt. Natürlich gibt es sehr große Herausforderungen, wenn man neue Medizinprodukte auf den Markt bringen möchte – die regulatorischen Voraussetzungen haben wir in diesem Projekt aber nicht untersucht. Allerdings betrachten wir diese Fragestellungen bei fortiss durchaus in anderen Anwendungsfällen, beispielsweise im Bereich des autonomen Fahrens.