Erweiterung der KI-Technologie für unstrukturierten biomedizinischen Text über das Englische hinaus | Azurblau…

0
186

Die Gesundheitsbranche nutzt die Möglichkeiten von Big Data, Cloud Computing und klinischen Analysen und nutzt Daten, um Erkenntnisse zu liefern, die die Versorgung und Effizienz verbessern können. Dennoch bleibt unstrukturierter Text eine Herausforderung, die durch Sprachbarrieren noch komplexer wird. Arztnotizen und andere unstrukturierte Texte bleiben oft ohne Referenz, sind schwer zu analysieren und daraus zu lernen und es ist schwierig, daraus Erkenntnisse zu gewinnen, was dazu führt, dass Gelegenheiten für Diagnosen und eine bessere Versorgung verpasst werden.

Microsoft erkennt die Notwendigkeit an, Gesundheitsorganisationen weltweit in die Lage zu versetzen, Erkenntnisse aus diesen Daten zu gewinnen – für eine bessere, schnellere und personalisiertere Versorgung und zur Verbesserung der Chancengleichheit im Gesundheitswesen. Mit Textanalyse für die Gesundheitein Teil von Azure Cognitive Serviceskönnen Gesundheitsorganisationen auf der ganzen Welt jetzt aussagekräftige Erkenntnisse aus unstrukturiertem Text in sieben Sprachen extrahieren und auf eine Weise verarbeiten, die eine klinische Entscheidungsunterstützung wie nie zuvor ermöglicht. Über Englisch hinaus hat Text Analytics for Health jetzt sechs weitere Sprachen in der Vorschau veröffentlicht – Spanisch, Französisch, Deutsch, Italienisch, Portugiesisch und Hebräisch – und diese bahnbrechende Technologie, die hilft, Erkenntnisse aus mehrsprachigen unstrukturierten klinischen Notizen zu extrahieren, für mehr Gesundheitsorganisationen weltweit zugänglich machen. Dies ist der erste seiner Art Natural Language Processing (NLP)-Service, der die Analyse unstrukturierter biomedizinischer Daten in mehreren Sprachen ganzheitlich unterstützt und mit einem föderierten Lernansatz entwickelt wurde. Die meisten Gesundheitstechnologien sind auf die englische Sprache beschränkt, was sie für Millionen von Menschen und Länder, in denen Englisch nicht die Hauptsprache ist, unzugänglich macht. Die Veröffentlichung der NLP-Technologie in mehreren Sprachen ist ein großer Schritt nach vorne, um die durch Sprachbarrieren entstandenen Lücken in der Gesundheitsgerechtigkeit zu schließen und sicherzustellen, dass der Zugang und die Qualität der Gesundheitsversorgung nicht von der Fähigkeit, Englisch zu sprechen und zu verstehen, bestimmt wird.

Text Analytics for Health verwendet leistungsstarkes NLP, um medizinische Begriffe in Texten zu erkennen und zu identifizieren, sie zu klassifizieren und sie mit klinischen Standardcodierungssystemen zu verknüpfen sowie semantische Beziehungen und Behauptungen in den Daten abzuleiten, um ein tieferes kontextuelles Verständnis zu ermöglichen. Dies eröffnet Anbietern, Kostenträgern, Biowissenschafts- und Pharmaunternehmen eine Welt voller Möglichkeiten, indem sie Datenpunkte aus unstrukturiertem Text mit strukturierten Daten vereinheitlichen und wichtige Erkenntnisse ans Licht bringen, Risiken identifizieren, das Ausfüllen von Formularen automatisieren oder klinische Daten abgleichen können Studien an Patienten zur besseren Suche nach Kandidaten – auf der Grundlage umfassender Daten, einschließlich unstrukturierter klinischer Texte.

Training des NLP-Modells für verschiedene Sprachen

Eine der Herausforderungen für einen NLP-Dienst besteht darin, über das Englische hinauszugehen und darauf abzuzielen, Text aus verschiedenen Sprachen zu analysieren. Das war das Ziel des Microsoft-Teams – das Ziel war es, alle Gesundheitsorganisationen zu stärken, unabhängig davon, in welcher Sprache ihre Texte verfasst sind. Die einzigartigen Herausforderungen ergeben sich aus der Notwendigkeit, KI-Modelle für mehrere Sprachen zu trainieren und sich an länderspezifische Gegebenheiten anzupassen braucht. Die Syntax unterscheidet sich zwischen den Sprachen, insbesondere wenn es um nicht-lateinische Sprachen geht. Sprachen haben unterschiedliche Semantiken und Grenzen, insbesondere solche mit reichhaltiger Morphologie oder zusammengesetzten Wörtern. Die Vokabeln sind unterschiedlich, der Jargon ist länderspezifisch und sogar die Codierungssysteme unterscheiden sich von Land zu Land. Wörter werden oft aus anderen Sprachen entlehnt, was zu Texten führt, die eine Mischung aus mehreren Sprachen enthalten. Geschriebener Text ist eine Mischung aus umgangssprachlichen Ausdrücken, lokalen medizinischen Begriffen und landesspezifischen Kurzschreibweisen. Das Training von Modellen, um diese Unterschiede zu verstehen, und die anschließende Bewertung dieser Modelle erforderten erhebliche Mengen an klinischen Daten und die Zusammenarbeit mit Fachexperten in verschiedenen Sprachen.

Leumit Gesundheitsdienste, einer der vier nationalen Gesundheitsfonds in Israel, arbeitete eng mit dem Forschungs- und Entwicklungsteam von Microsoft zusammen, um das TA4H-Modell für die hebräische Sprache zu trainieren. Israel verfügt über ein einzigartiges und robustes Krankenaktensystem, in dem die Aufzeichnungen jeder Person in elektronischen Krankenakten (EMR) gespeichert werden und alle Bürger mit Wohnsitz gesetzlich verpflichtet sind, einer der vier ausgewiesenen HMOs beizutreten. Die verfügbaren Gesundheitsdaten sind reichhaltig, vielfältig und bieten einen hervorragenden Ausgangspunkt für Forschung und Analyse.

Leumit Gesundheitsdienste hatte über 130 Millionen Patientendatensätze in seiner EMR, die für das Training des mehrsprachigen Modells von Text Analytics for Health für Hebräisch verwendet werden konnten. Die Herausforderung bestand darin, Microsoft den Zugriff auf anonymisierte Daten zu Schulungszwecken auf eine Weise zu ermöglichen, die die Privatsphäre und Sicherheit der Gesundheitsinformationen des Kunden schützt. Die Antwort lag in einem Federated-Learning-Ansatz – was bedeutet, dass Daten niemals die Vertrauensgrenze von Leumit verließen und Microsoft niemals Gesundheitsinformationen von Patienten ausgesetzt war. Leumit hat in Azure ein separates Abonnement mit strengen Zugriffsberechtigungen erstellt, in dem Microsoft seine föderierte Lerninfrastruktur und -tools installiert hat. Leumit fügte dann anonymisierte Daten ein, die für die Forschung benötigt wurden, und Microsoft-Entwickler lösten das Modelltraining in einem föderierten Lernaufbau mit diesen anonymisierten Daten aus – während diese Daten ihr Abonnement nie verließen und die Entwickler nie sehen konnten alle identifizierenden Details der Daten.

Leumit war dann einer der ersten Kunden, der das Text Analytics for Health-Modell für klinisches Hebräisch testete, was eine Herausforderung darstellt, da es oft hebräische und englische Wörter im selben Satz enthält. Der Anwendungsfall war der Versuch zu sehen, ob das Text Analytics for Health-Modell Freitext von Arztbesuchen analysieren kann, um Prädiktoren für Schlaganfälle bei Patienten zu identifizieren. Die vorläufigen Ergebnisse sind sehr ermutigend und positiv – sie zeigen, dass das Modell in der Lage ist, sowohl die hebräischen als auch die englischen klinischen Aussagen zu parsen und sie auf eine Weise zu analysieren, die helfen könnte, verschiedene potenzielle Indikatoren für einen Schlaganfall zu identifizieren. Dies könnte Gesundheitsdienstleistern helfen, Frühwarnmechanismen einzurichten und eine personalisiertere Versorgung für eine Vielzahl von akuten Erkrankungen bereitzustellen.

Mithilfe des hebräischen NLP von Microsoft werden wir in der Lage sein, unsere 20-jährigen EMR-Daten und Patienten-zu-Arzt-Nachrichten zu analysieren, um Tools zu entwickeln, die Ärzten Zeit sparen und ihr Burnout in einer Welt nach Covid-19 reduzieren werden.„—Izhar Laufer, Leiter von LeumitStart.

Analyse von hebräischem unstrukturiertem biomedizinischem Text mit Text Analytics for Health

Abbildung 1: Analyse von hebräischem unstrukturiertem biomedizinischem Text mit Text Analytics for Health

Analyse von hebräischem unstrukturiertem biomedizinischem Text mit Text Analytics for Health

Abbildung 2: Analyse von hebräischem unstrukturiertem biomedizinischem Text mit Text Analytics for Health

Analysieren von unstrukturiertem Text für reale Daten

Die Herausforderung unstrukturierter Daten wird in der Forschungswelt durch die Verwendung von Real-World Data (RWD) noch größer. Unter anderem in Brasilien führt das Fehlen eines Standards für Interoperabilität und Datenerfassung zu vielen unstrukturierten Daten – Erfahrungsberichten, Arztbriefen und sogar Laboruntersuchungsergebnissen. Dies verlangsamt den Recherche- und Analyseprozess für Anbieter wie z Grupo Oncoclinicas. Grupo Oncoclínicas wurde 2010 gegründet und ist mit 129 Einheiten in 33 Städten – darunter Kliniken, Genomik- und Pathologielabors und integrierte Krebsbehandlungszentren – der größte Anbieter von Onkologiebehandlungen im Privatsektor in Brasilien.

Mit der Hilfe von Datenseite, ein Microsoft-Partner in Brasilien, nutzt OncoClinicas Text Analytics for Health von Microsoft, um Daten aus nicht strukturierten Feldern wie medizinischen Notizen, anatomischer Pathologie und genomischen und bildgebenden Berichten wie MRTs zu extrahieren. Diese Daten werden dann für verschiedene Anwendungsfälle verwendet, z. B. die Durchführbarkeit klinischer Studien, ein besseres Verständnis der Szenarien für die Pharmakoökonomie und ein tieferes Verständnis der Gruppenepidemiologie und der interessierenden Ergebnisse.

Analyse von portugiesischem unstrukturiertem biomedizinischem Text mit Text Analytics for Health

Abbildung 3: Analyse von portugiesischem unstrukturiertem biomedizinischem Text mit Text Analytics for Health

Text Analytics for Health war ein Wendepunkt für Grupo Oncoclinicas um unsere Prozesse zu skalieren und unsere klinischen Notizen, Untersuchungsberichte und Feldanalysen zu strukturieren, die zuvor nur von manueller Pflege abhängig waren. Eine Lösung zu haben, die auf Portugiesisch funktioniert, ist der Schlüssel – die meisten globalen Lösungen sind in der Regel nur auf Englisch ausgerichtet und vernachlässigen dadurch andere Sprachen. Die Genauigkeit in der portugiesischen Muttersprache ermöglichte es uns, ein hohes Maß an Genauigkeit bei der Analyse des unstrukturierten Textes aufrechtzuerhalten.“—Marcio Guimaraes Souza, Leiter der Abteilung Daten und KI bei Groupo OncoClinicas.

Analyse und Strukturierung zu Fast Healthcare Interoperability Resources (FHIR®)

Das Italienischer Vita-Gruß Universität San Raffaele und IRCCS San Raffaele Krankenhaus bauen das Gesundheitswesen der Zukunft auf, indem sie die Dienste der künstlichen Intelligenz (KI) von Microsoft nutzen. Mit Text Analytics for Health können die Krankenhäuser die enorme Menge an klinischen Daten, die im Krankenhaus verfügbar sind, klassifizieren, standardisieren und analysieren, um eine innovative digitale Plattform für das Datenmanagement zu schaffen. Mithilfe dieser Plattform können die Ärzte des Krankenhauses wichtige klinische Erkenntnisse über ihre Patienten gewinnen und eine personalisiertere Versorgung bieten. Einer der Anwendungsfälle, der derzeit unter Verwendung dieser Datenplattform entwickelt wird, besteht darin, die Auswahl von Patienten zu ermöglichen, die für eine Immuntherapie bei nicht-kleinzelligem Lungenkrebs in Frage kommen. Medizinisches Personal kann die Analyse von KI-Lösungen nutzen, um die Erfolgsrate der Therapie zu erhöhen, indem es die relevante Behandlung den am besten geeigneten Patienten zuordnet.

Text Analytics for Health hat eine Schlüsselrolle bei der Analyse der enormen Menge an unstrukturierten klinischen Daten gespielt, die wir im Krankenhaus haben. Wir nutzen auch die FHIR-Strukturierungsfähigkeit, die eine größere Interoperabilität mit anderen Krankenhaussystemen ermöglicht. Die Verfügbarkeit von Text Analytics for Health auf Italienisch ermöglicht es uns, unsere Fähigkeiten noch weiter auszubauen, um unseren Patienten die bestmögliche Versorgung zu bieten.“—Professor Carlo Tacchetti, Professor für menschliche Anatomie, Vita-Salute San Raffaele University, und Koordinator des Projekts.

Analyse von italienischem unstrukturiertem biomedizinischem Text mit Text Analytics for Health

Abbildung 4: Analyse von italienischem unstrukturiertem biomedizinischem Text mit Text Analytics for Health

Machen Sie mehr aus Ihren Daten mit Microsoft Cloud for Healthcare

Mit Text Analytics for Health können Gesundheitsorganisationen ihre Patientenversorgung transformieren, neue Erkenntnisse gewinnen und die Leistungsfähigkeit von maschinellem Lernen und KI nutzen, indem sie unstrukturierten Text nutzen. Microsoft ist bestrebt, Technologie bereitzustellen, die Ihre Daten für die Zukunft der Gesundheitsinnovation mit neuen Features in der Microsoft Cloud for Healthcare bereitstellt.

Wir freuen uns darauf, Ihr Partner zu sein, wenn Sie die Zukunft der Gesundheit gestalten.
• Lerne mehr über Textanalyse für die Gesundheit.
• Lerne mehr über Microsoft Cloud für das Gesundheitswesen.

®FHIR ist eine eingetragene Marke von Health Level Seven International, eingetragen beim US Trademark Office, und wird mit deren Genehmigung verwendet.



Source link

LEAVE A REPLY

Please enter your comment!
Please enter your name here