08/12/2010

DictaTeam - Die Diktatexperten

Spracherkennung - Arbeitserleichterung oder Kostentreiber?

Spracherkennung ist das Mittel der Wahl, wenn es das einzige Ziel ist, dass ein Dokument am Ende eines Diktates fertig geschrieben / ausgedruckt vorliegen soll, aber auch die Entstehungskosten keine Rolle spielen.

Spracherkennungssysteme liefern unbestritten, wie das Marketing es verspricht, bis zu 99% Erkennungsquote ab,
1. wenn das Raumklangklima sich niemals verändert, die Spracherkennungssoftware also idealerweise in einer sehr ruhigen Umgebung genutzt wird;
2. wenn das System immer wiederkehrend, also sehr zeitaufwendig, vom Diktanten trainiert wird. Dieser ist aber meist die teuerste Arbeitskraft in der Klinik, im Unternehmen, in der Kanzlei oder in der Praxis;
3. wenn die Stimme des Diktierenden möglichst immer gleich klingt, er also niemals erkältet oder heiser ist;
4. wenn alle Worte, die von der Spracherkennungssoftware erkannt werden sollen, dem System im vorhinein bekannt sind. Im Zweifelsfall müssen die Worte vom Diktanten zweitaufwenig händisch eingepflegt und sprachlich trainiert oder zusätzliche, teure Aufbauwortschätze, etwa für Juristen oder Mediziner, dazu gekauft werden.

Mit solchen Zusatzwortschätzen werden z.B. medizinische Fachbegriffe prinzipiell richtig erkannt. Aber was ist mit Begrifflichkeiten aus der Umgangssprache? Diese werden teilweise nicht, falsch oder entfremdet erkannt. Phonetisch eng beieinander liegende Worte werden im Zweifelsfall von der Spracherkennung verwechselt. Wenn nun „ein Karzinom“ diktiert, aber „kein Karzinom“ vom System erkannt wird und keine Korrektur erfolgt, hat das erhebliche Folgen auf die Therapie. Und das nur, weil in der Regel technische Unzulänglichkeiten von Spracherkennungsanwendern akzeptiert werden.

Bis zu 99% Spracherkennungsquote werden garantiert. Auf eine DIN A4 Seite passen ca. 300 Worte. Nach einer Gesamtinvestition von bis zu 8.500 Euro pro Spracherkennungsarbeitsplatz werden also mindestens drei Fehler pro DIN A4 Seite des Diktates vom Spracherkennungshersteller im Umkehrschluss garantiert. In der Praxis, so haben Tests ergeben, werden durchschnittlich 96% des Textes fehlerfrei erkannt. Dann sind dies schon einmal 12 Fehler pro DIN A4 Seite. Was würden Sie mit einer Schreibkraft oder Sekretärin machen, die Ihnen durchschnittlich 12 Fehler pro DIN A4 Seite abliefert?

Hinzu kommt, dass ein Dokument, welches mit Spracherkennungssystemen erzeugt wird, bis zu drei mal so teuer werden kann, als würde es eine Schreibkraft nach klassischem Diktat schreiben. Die Fehlerkorrektur muss in der Regel der Diktant selbst vornehmen. Der Diktant ist aber eine der teuersten Mitarbeiter. Diese Tatsache wurde in Untersuchungen bei Anwendern herausgefunden und ein Kostenkalkulationsschema unter http://www.digitales-diktieren.info/spracherkennung/ veröffentlicht. Claus Michael Sattler, Initiator der Untersuchungen: „Wir kamen über alle Fachrichtungen einer Klinik im Durchschnitt auf 96% Spracherkennungsquote im Klinikalltag. Natürlich ist es wunderbar, dass nach einem Diktat mit einer Spracherkennungssoftware das Dokument zur Verfügung steht – aber zu welchem Preis?“

Auch das Argument der Hersteller „Wenn der Diktant zu teuer ist, dann kann ja der vorerkannte Text von einer Schreibkraft oder Sekretärin korrigiert werden!“ hinkt. Die DictaTeam UG, einer der größeren Schreibdienste am Markt, hat diese Aussage gemeinsam mit Kunden analysiert. „Wir brauchen zwischen 15% und 30% länger, wenn wir einen vorerkannten Text korrigieren müssen, als wenn wir ihn einfach runterschreiben.“ erklärt Beate Seidel, geschäftsführende Gesellschafterin von DictaTeam UG. Hintergrund ist, dass die Konzentrationskurve der Schreibkräfte über den Tag hinweg signifikant sinkt, wenn sie einen unbekannten Text hören und das Gehörte mit dem vorerkannten Text am Bildschirm vergleichen und korrigieren müssen.

„Bei Gesprächen mit Kunden im Vorfeld der MEDICA 2010, die ein Digitales Diktatsystem einführen wollen, zeigte sich, das Spracherkennungssysteme in den Teststellungen enttäuscht haben und man daher lieber zum konventionellen Diktat greift.“ stellt Michael Heinz, Vertriebsleiter der DictaTeam UG fest. Die MEDICA 2010 scheint diesen Trend zu bestätigen. Zwei der drei wesentlichen Spracherkennungshersteller am deutschen Markt waren nicht mit eigenen Messeständen auf der weltgrößten Medizinmesse vertreten.

Im Gegenzug waren aber alle wesentlichen Diktiergeräte- und Smartphone-Diktiersoftware-Hersteller mit eigenen Messeständen in Düsseldorf vor Ort und standen den Anwendern für sachliche und technische Gespräche zur Verfügung.

Im Grunde haben die Spracherkennungshersteller mit ihrem Marketing immensen Flurschaden angerichtet, indem sie nur das fertige Dokument als Ergebnis betrachten. Oft werden die betriebswirtschaftlichen Gesamtkosten außer Acht gelassen. Es sind eben nicht nur die Anschaffungskosten, die bei jeder Neueinführung anfallen, sondern vor allem die Kosten für die veränderten Abläufe im Arbeitsalltag.

„Ich empfehle unseren Kunden grundsätzlich, eigene Texte aus der täglichen Arbeit zu Präsentationen von Spracherkennungssystemen mitzubringen, um sie vom Präsentator diktieren zu lassen. Eine Stoppuhr zeigt die tatsächlichen Zeitaufwände. Ich selbst habe bis 2008 Spracherkennungssysteme verkauft und kenne die Präsentationstricks. Die Worte der ‚Show-Texte’ sind immer wohl ausgewählt und mit dem System zig-fach trainiert. Sie funktionieren nahezu immer. Bei kundenspezifischen Texten zeigen sich die tatsächlichen Spracherkennungsquoten!“ berichtet Sattler.

Spracherkennung stößt immer wieder an ihre Grenzen. Für den lernwilligen und geduldigen Diktanten mag sie eine gute Lösung sein, Dokumente zu erstellen. Dennoch zeichnet sich ein Umdenken im Markt ab. Spracherkennung ist offensichtlich nicht optimale Lösung für den diktierenden Arzt, der einfach nur Zeit sparen will. Für ihn kommt die menschliche Spracherkennung in Form einer Schreibkraft in Frage, die auch mit den schlimmsten Diktatangewohnheiten fertig wird. Das Dokument ist meist ebenso schnell erstellt. Und wenn die Schreibkraft mal ausfällt, gibt es noch externe Schreibdienste, die einspringen. Fällt der Rechner oder die Spracherkennungssoftware aus, gibt es oft keinen kurzfristigen Ersatz.