Eigene Wege gehen
KI in RICO wird auf bewährte clinalytix-Basis umgestellt
Die steigenden Gesundheitskosten und der damit verbundene Kostendruck zwingen Gesundheitseinrichtungen dazu, die Erfassung und Abrechnung ihrer Leistungen zu optimieren. RICO, die Software für das Rightcoding von Dedalus HealthCare, unterstützt die Anwender bereits seit langem dabei, den Spagat zwischen Qualität und wirtschaftlicher Profitabilität zu bewältigen. Nun wird die Lösung auf ein neues Fundament gestellt: Die zwei wesentlichen Komponenten, die Auswertungstools für die Hauptdiagnosen (ICD-Codes) sowie die Operationen und Prozeduren (OPS), basieren auf Künstlicher Intelligenz (KI) und wurden bisher vom Fraunhofer Institut für Intelligente Analyse und Informationssysteme, kurz IAIS, beigesteuert.
„Um flexibler zu werden und weitere Algorithmen noch schneller einbinden zu können, werden wir zur Auswertung künftig unsere bewährte KI-Lösung clinalytix verwenden“, sagt Ariadne Fidalgo-Ruiz, Business Managerin MedCo/RICO bei Dedalus HealthCare. Gleichwohl führt das Unternehmen die Zusammenarbeit mit dem Fraunhofer IAIS mit etwas anderem Fokus fort, etwa bei der Erforschung von Large Language Models (LLM). „Die Konzentration der Aktivitäten rund um das Natural Language Processing (NLP) innerhalb von Dedalus ermöglicht uns eine schnellere Reaktion auf Kundenanforderungen und ergibt Synergieeffekte bei der weiteren Entwicklung der globalen Lösung“, so Fidalgo-Ruiz.
Aufwendiges Training für bessere Ergebnisse
Das Team konzentriert sich auf die Entwicklung von Modellen, die klinische Operationsberichte aus verschiedenen Krankenhäusern verarbeiten können und dabei höchst genau vorgehen. „Um zuverlässige Ergebnisse zu gewährleisten, müssen diese Modelle unter verschiedenen Bedingungen und bei unterschiedlichen Dateneingaben gut funktionieren. Daher lassen wir uns von den Grundsätzen der Robustheit, Skalierbarkeit und Präzision leiten“, so Ralph Szymanowsky, Business Development Manager BI & Analytics bei Dedalus HealthCare. clinalytix nutzt NLP-Techniken für die Multilabel-Textklassifikation mit einem erheblichen Datenungleichgewicht. Dieser Ansatz ermöglicht es dem System, textbasierte Daten zu analysieren und die für einen Operationsbericht erkannten OPS-Kodes zuzuordnen, auch wenn einige dieser Kodes in den realen Daten unterrepräsentiert sind. Dabei dauert der vollständige Trainingsprozess mit den aktuellen Daten etwa 18 Stunden. In dieser Zeit iteriert der Algorithmus über den gesamten Datensatz, um Muster aus den OP-Berichten zu lernen und seine Vorhersagen zu verfeinern. Dadurch verbessert sich die Leistung im Laufe des Trainingsprozesses schrittweise.
Tief in die Daten eintauchen
Wie der Algorithmus genau funktioniert, erläutert Szymanowsky: „Um die relevanteste Hauptdiagnose für einen Fall vorherzusagen, verwenden wir ein maschinelles Lernmodell, das Learning-to-Rank oder kurz LTR. Das Modell erstellt eine Rangliste aller möglichen ICDs für einen Fall und gibt für jede ICD eine Punktzahl an. Der OPS-Algorithmus von clinalytix besteht aus einer Multilabel-Klassifizierung auf der Grundlage von Transformatormodellen, also fortschrittlichen Architekturen für maschinelles Lernen, die zur Verarbeitung von Sprache verwendet werden können. Diese Transformatoren analysieren einen Text, indem sie ihn in kleinere Teile zerlegen, so dass die Algorithmen den Kontext und die Bedeutung der Wörter verstehen und lernen können. Einmal trainiert, können diese Algorithmen die erkannten OPS-Kodes einem OP-Bericht auf der Grundlage seines Inhalts zuordnen.“ Im Folgenden vergleicht die KI jede mögliche ICD für einen Fall mit der Menge der Merkmale für diesen Fall. Das Modell gibt dann eine Punktzahl für die ICDs aus, die für das Ranking verwendet werden. Die Punktzahl misst im Wesentlichen die Ähnlichkeit zwischen der Merkmalsgruppe und dem ICD-Code. Das Modell erlernt diese Beziehung während der Trainingsphase, indem es Millionen von Beispielen sieht.
Neu ist ein Algorithmus zur Negierungserkennung. Trainiert werden Modelle mit vormarkierten Beispielen, die entweder von menschlichen medizinischen Experten oder leistungsstarken Algorithmen wie LLMs stammen. Diese Beispiele bestehen aus dem Vermerk eines Arztes („Der Patient hat kein Fieber“), einer Entität von Interesse (wie „Fieber“) und dem Label („negiert“). Das Modell wandelt den Text in numerische Darstellungen um, in sogenannte Einbettungen, die als Eingabe für eine mathematische Funktion dienen. Die Parameter der Funktion werden im Laufe der Zeit aktualisiert, um den Beispielen bestmöglich zu entsprechen. Durch diesen Prozess lernt das Modell, verschiedene Zustände zu erkennen. „Die Sprachmodelle können die krankenhausindividuellen und medizinischen sprachlichen Besonderheiten besser abbilden als regelbasierte Algorithmen, beispielsweise bei ungewöhnlicher Zeichensetzung mit Komma-Trennung oder geschachtelten Negierungen“, führt Szymanowsky aus.
Am Ende profitieren alle
„Da wir das neue RICO komplett selbst entwickeln, ist das Training der KI deutlich vereinfacht und wir können die KI künftig unabhängig von Dritten erweitern und verbessern“, betont Ariadne Fidalgo-Ruiz einen besonderen Vorteil des neuen Weges. „Um RICO einsetzen zu können, benötigen die Kunden keine clinalytix-Komponenten, sie nutzen die Software einfach so weiter wie bisher.“
Sehr wohl profitieren jedoch andere clinalytix-Anwendungen davon, dass die KI nun auch für die Kodierung genutzt wird. NLP stellt eine KI-Basistechnologie dar und ist für eine ganze Reihe weiterer KI-Anwendungen insbesondere im Zusammenhang mit der Verarbeitung textueller Informationen eine wesentliche Voraussetzung. So werden beispielsweise für die Risikovorhersagen mit clinalytix Medical-AI-Befunde, Pflegeinformationen und Dekurse nach relevanten Informationen über den Zustand des Patienten durchsucht, da die Kodierung oftmals zu spät vorliegt. „Synergien entstehen bei der Entwicklung klinischer KI-Modelle für verschiedene Anwendungsfälle, spezifische Verfahren für die RICO Use Cases können dabei auch für andere Modelle eingesetzt werden. Wir betreiben also einen kontinuierlichen Wissensaufbau für ein breites Spektrum an Anwendungsfällen für die KI“, ist Ralph Szymanowsky überzeugt.
Die neu entwickelte Version RICO auf Basis von clinalytix steht samt ICD-, OPS- und Negations-KI ab Anfang nächsten Jahres zur Verfügung