Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Combiner Amazon Comprehend Medical avec de grands modèles linguistiques
Une étude réalisée en 2024 par NEJM AI
-
Améliorez la précision des sélections d'entités en utilisant les premiers résultats d'Amazon Comprehend Medical comme contexte pour le LLM
-
Implémentez la reconnaissance d'entités personnalisées, la synthèse, la réponse aux questions et des cas d'utilisation supplémentaires
Cette section explique comment associer Amazon Comprehend Medical à un LLM en utilisant une approche RAG (Retrieval Augmented Generation). La génération augmentée de récupération (RAG) est une technologie d'IA générative dans laquelle un LLM fait référence à une source de données faisant autorité qui se trouve en dehors de ses sources de données de formation avant de générer une réponse. Pour plus d'informations, voir Qu'est-ce que RAG ?
Pour illustrer cette approche, cette section utilise l'exemple du codage médical (diagnostique) lié à la CIM-10-CM. Il inclut un exemple d'architecture et des modèles d'ingénierie rapides pour vous aider à accélérer votre innovation. Il inclut également les meilleures pratiques pour utiliser Amazon Comprehend Medical dans un flux de travail RAG.
Architecture basée sur RAG avec Amazon Comprehend Medical
Le schéma suivant illustre une approche RAG pour identifier les codes de diagnostic ICD-10-CM à partir des notes des patients. Il utilise Amazon Comprehend Medical comme source de connaissances. Dans une approche RAG, la méthode de récupération extrait généralement des informations d'une base de données vectorielle contenant les connaissances applicables. Au lieu d'une base de données vectorielle, cette architecture utilise Amazon Comprehend Medical pour la tâche de récupération. L'orchestrateur envoie les informations de la note du patient à Amazon Comprehend Medical et récupère les informations du code ICD-10-CM. L'orchestrateur envoie ce contexte au modèle de base en aval (LLM), via Amazon Bedrock. Le LLM génère une réponse en utilisant les informations du code ICD-10-CM, et cette réponse est renvoyée à l'application cliente.

Le diagramme montre le flux de travail RAG suivant :
-
L'application cliente envoie les notes du patient sous forme de requête à l'orchestrateur. Voici un exemple de ces remarques à l'intention des patients : « La patiente est une patiente de 71 ans du Dr X. La patiente s'est présentée aux urgences hier soir avec des douleurs abdominales persistantes depuis environ 7 à 8 jours. Elle n'a pas eu de fièvres ou de frissons précis et n'a aucun antécédent de jaunisse. Le patient nie toute perte de poids récente significative. »
-
L'orchestrateur utilise Amazon Comprehend Medical pour récupérer les codes ICD-10-CM relatifs aux informations médicales contenues dans la requête. Il utilise l'API Infer ICD1 0CM pour extraire et déduire les codes ICD-10-CM à partir des notes du patient.
-
L'orchestrateur crée une invite qui inclut le modèle d'invite, la requête d'origine et les codes ICD-10-CM extraits d'Amazon Comprehend Medical. Il envoie ce contexte amélioré à Amazon Bedrock.
-
Amazon Bedrock traite les entrées et utilise un modèle de base pour générer une réponse qui inclut les codes ICD-10-CM et les preuves correspondantes issues de la requête. La réponse générée inclut les codes ICD-10-CM identifiés et les preuves provenant des notes du patient qui soutiennent chaque code. Voici un exemple de réponse :
<response> <icd10> <code>R10.9</code> <evidence>history of abdominal pain</evidence> </icd10> <icd10> <code>R10.30</code> <evidence>history of abdominal pain</evidence> </icd10> </response>
-
Amazon Bedrock envoie la réponse générée à l'orchestrateur.
-
L'orchestrateur renvoie la réponse à l'application cliente, où l'utilisateur peut consulter la réponse.
Cas d'utilisation d'Amazon Comprehend Medical dans un flux de travail RAG
Amazon Comprehend Medical peut effectuer des tâches de PNL spécifiques. Pour plus d'informations, consultez la section Cas d'utilisation d'Amazon Comprehend Medical.
Vous souhaiterez peut-être intégrer Amazon Comprehend Medical dans un flux de travail RAG pour les cas d'utilisation avancés, tels que les suivants :
-
Générez des résumés cliniques détaillés en combinant des entités médicales extraites avec des informations contextuelles issues des dossiers des patients
-
Automatisez le codage médical pour les cas complexes en utilisant des entités extraites avec des informations liées à l'ontologie pour l'attribution du code
-
Automatisez la création de notes cliniques structurées à partir de texte non structuré en utilisant des entités médicales extraites
-
Analyser les effets secondaires des médicaments en fonction des noms et des attributs des médicaments extraits
-
Développez des systèmes de soutien clinique intelligents qui combinent les informations médicales extraites avec up-to-date la recherche et les directives
Bonnes pratiques pour utiliser Amazon Comprehend Medical dans un flux de travail RAG
Lorsque vous intégrez les résultats d'Amazon Comprehend Medical dans une demande de LLM, il est essentiel de suivre les meilleures pratiques. Cela peut améliorer les performances et la précision. Les principales recommandations sont les suivantes :
-
Comprendre les scores de confiance d'Amazon Comprehend Medical — Amazon Comprehend Medical fournit des scores de confiance pour chaque entité détectée et pour chaque lien d'ontologie. Il est essentiel de comprendre la signification de ces scores et d'établir des seuils appropriés pour votre cas d'utilisation spécifique. Les scores de confiance aident à filtrer les entités peu fiables, à réduire le bruit et à améliorer la qualité des entrées du LLM.
-
Utilisez les scores de confiance pour une ingénierie rapide : lors de l'élaboration des instructions pour le LLM, pensez à intégrer les scores de confiance d'Amazon Comprehend Medical comme contexte supplémentaire. Cela permet au LLM de hiérarchiser ou d'évaluer les entités en fonction de leur niveau de confiance, améliorant ainsi potentiellement la qualité du résultat.
-
Évaluez les résultats d'Amazon Comprehend Medical à l'aide de données fiables sur le terrain — Les données fiables sur le terrain sont des informations dont la véracité est reconnue. Il peut être utilisé pour valider qu'une application AI/ML produit des résultats précis. Avant d'intégrer les résultats d'Amazon Comprehend Medical dans votre flux de travail LLM, évaluez les performances du service sur un échantillon représentatif de vos données. Comparez les résultats avec des annotations fondées sur la vérité pour identifier les divergences potentielles ou les domaines à améliorer. Cette évaluation vous aide à comprendre les points forts et les limites d'Amazon Comprehend Medical pour votre cas d'utilisation.
-
Sélectionnez stratégiquement les informations pertinentes : Amazon Comprehend Medical peut fournir une grande quantité d'informations, mais elles ne sont peut-être pas toutes pertinentes pour votre tâche. Sélectionnez avec soin les entités, les attributs et les métadonnées les plus pertinents pour votre cas d'utilisation. Fournir trop d'informations non pertinentes au LLM peut introduire du bruit et potentiellement réduire les performances.
-
Aligner les définitions des entités : assurez-vous que les définitions des entités et des attributs utilisés par Amazon Comprehend Medical correspondent à votre interprétation. En cas de divergence, pensez à fournir un contexte ou des éclaircissements supplémentaires au LLM afin de combler le fossé entre les résultats d'Amazon Comprehend Medical et vos besoins. Si l'entité Amazon Comprehend Medical ne répond pas à vos attentes, vous pouvez implémenter une détection d'entité personnalisée en incluant des instructions supplémentaires (et des exemples possibles) dans l'invite.
-
Fournissez des connaissances spécifiques à un domaine — Amazon Comprehend Medical fournit des informations médicales précieuses, mais il se peut qu'il ne capture pas toutes les nuances de votre domaine spécifique. Envisagez de compléter les résultats d'Amazon Comprehend Medical par des sources de connaissances supplémentaires spécifiques au domaine, telles que des ontologies, des terminologies ou des ensembles de données sélectionnés par des experts. Cela fournit un contexte plus complet au LLM.
-
Respectez les directives éthiques et réglementaires — Lorsque vous traitez des données médicales, il est important de respecter les principes éthiques et les directives réglementaires, tels que ceux liés à la confidentialité des données, à la sécurité et à l'utilisation responsable des systèmes d'IA dans les soins de santé. Assurez-vous que votre mise en œuvre est conforme aux lois applicables et aux meilleures pratiques du secteur.
En suivant ces meilleures pratiques, les praticiens de l'IA et du ML peuvent utiliser efficacement les points forts d'Amazon Comprehend Medical et de. LLMs Pour les tâches de PNL médicale, ces meilleures pratiques permettent d'atténuer les risques potentiels et d'améliorer les performances.
Ingénierie rapide pour le contexte Amazon Comprehend Medical
L'ingénierie rapide
En fonction de l'opération d'API que vous effectuez, Amazon Comprehend Medical renvoie les entités détectées, les codes et descriptions d'ontologie, ainsi que les scores de confiance. Ces résultats deviennent contextuels dans l'invite lorsque votre solution invoque le LLM cible. Vous devez concevoir l'invite de manière à présenter le contexte dans le modèle d'invite.
Note
Les exemples d'instructions présentés dans cette section suivent les directives d'Anthropic
En général, vous insérez à la fois le texte médical d'origine et les résultats d'Amazon Comprehend Medical dans l'invite. Voici une structure d'invite courante :
<medical_text> medical text </medical_text> <comprehend_medical_text_results> comprehend medical text results </comprehend_medical_text_results> <prompt_instructions> prompt instructions </prompt_instructions>
Cette section fournit des stratégies pour inclure les résultats d'Amazon Comprehend Medical comme contexte rapide pour les tâches de PNL médicale courantes suivantes :
Filtrer les résultats d'Amazon Comprehend Medical
Amazon Comprehend Medical fournit généralement une grande quantité d'informations. Vous souhaiterez peut-être réduire le nombre de résultats que le professionnel de santé doit examiner. Dans ce cas, vous pouvez utiliser un LLM pour filtrer ces résultats. Les entités Amazon Comprehend Medical incluent un score de confiance que vous pouvez utiliser comme mécanisme de filtrage lors de la conception de l'invite.
Voici un exemple de note destinée aux patients :
Carlie had a seizure 2 weeks ago. She is complaining of frequent headaches Nausea is also present. She also complains of eye trouble with blurry vision Meds : Topamax 50 mgs at breakfast daily, Send referral order to neurologist Follow-up as scheduled
Dans cette note destinée au patient, Amazon Comprehend Medical détecte les entités suivantes.

Les entités renvoient aux codes ICD-10-CM suivants pour les crises d'épilepsie et les maux de tête.
Catégorie | Code ICD-10-CM | Description de l'ICD-10-CM | Score de confiance |
---|---|---|---|
Convulsion | R56,9 | Convulsions non précisées | 0,8348 |
Convulsion | G40,909 | Épilepsie, non précisée, non incurable, sans état épileptique | 0,5424 |
Convulsion | R56,00 | Convulsions fébriles simples | 0,4937 |
Convulsion | G40,09 | Autres crises | 0,4397 |
Convulsion | G40,409 | Autres syndromes épileptiques et épileptiques généralisés, non incurables, sans état épileptique | 0,4138 |
maux de tête | R51 | maux de tête | 0,4067 |
maux de tête | R51,9 | Céphalée, sans précision | 0,3844 |
maux de tête | G44,52 | Nouveaux maux de tête persistants quotidiens (NDPH) | 0,3005 |
maux de tête | G44 | Autre syndrome de céphalée | 0,2670 |
maux de tête | G44,8 | Autres syndromes de céphalée précisés | 0,2542 |
Vous pouvez transmettre les codes ICD-10-CM à l'invite pour augmenter la précision du LLM. Pour réduire le bruit, vous pouvez filtrer les codes ICD-10-CM en utilisant le score de confiance inclus dans les résultats d'Amazon Comprehend Medical. Voici un exemple d'invite qui inclut uniquement les codes ICD-10-CM dont le score de confiance est supérieur à 0,4 :
<patient_note> Carlie had a seizure 2 weeks ago. She is complaining of frequent headaches Nausea is also present. She also complains of eye trouble with blurry vision Meds : Topamax 50 mgs at breakfast daily, Send referral order to neurologist Follow-up as scheduled </patient_note> <comprehend_medical_results> <icd-10> <entity> <text>seizure</text> <code> <description>Unspecified convulsions</description> <code_value>R56.9</code_value> <score>0.8347607851028442</score> </code> <code> <description>Epilepsy, unspecified, not intractable, without status epilepticus</description> <code_value>G40.909</code_value> <score>0.542376697063446</score> </code> <code> <description>Other seizures</description> <code_value>G40.89</code_value> <score>0.43966275453567505</score> </code> <code> <description>Other generalized epilepsy and epileptic syndromes, not intractable, without status epilepticus</description> <code_value>G40.409</code_value> <score>0.41382506489753723</score> </code> </entity> <entity> <text>headaches</text> <code> <description>Headache</description> <code_value>R51</code_value> <score>0.4066613018512726</score> </code> </entity> <entity> <text>Nausea</text> <code> <description>Nausea</description> <code_value>R11.0</code_value> <score>0.6460834741592407</score> </code> </entity> <entity> <text>eye trouble</text> <code> <description>Unspecified disorder of eye and adnexa</description> <code_value>H57.9</code_value> <score>0.6780954599380493</score> </code> <code> <description>Unspecified visual disturbance</description> <code_value>H53.9</code_value> <score>0.5871203541755676</score> </code> <code> <description>Unspecified disorder of binocular vision</description> <code_value>H53.30</code_value> <score>0.5539672374725342</score> </code> </entity> <entity> <text>blurry vision</text> <code> <description>Other visual disturbances</description> <code_value>H53.8</code_value> <score>0.9001834392547607</score> </code> </entity> </icd-10> </comprehend_medical_results> <prompt> Given the patient note and Amazon Comprehend Medical ICD-10-CM code results above, please select the most relevant ICD-10-CM diagnosis codes for the patient. For each selected code, provide a brief explanation of why it is relevant based on the information in the patient note. </prompt>
Étendez les tâches de PNL médicale avec Amazon Comprehend Medical
Lors du traitement de textes médicaux, le contexte d'Amazon Comprehend Medical peut aider le LLM à sélectionner de meilleurs jetons. Dans cet exemple, vous souhaitez associer les symptômes diagnostiques aux médicaments. Vous souhaitez également trouver du texte relatif à des tests médicaux, tels que des termes relatifs à un test sanguin. Vous pouvez utiliser Amazon Comprehend Medical pour détecter les entités et les noms des médicaments. Dans ce cas, vous utiliserez le DetectEntitiesV2 et InferRxNorm APIs pour Amazon Comprehend Medical.
Voici un exemple de note destinée aux patients :
Carlie had a seizure 2 weeks ago. She is complaining of increased frequent headaches Given lyme disease symptoms such as muscle ache and stiff neck will order prescription. Meds : Topamax 50 mgs at breakfast daily. Amoxicillan 25 mg by mouth twice a day Place MRI radiology order at RadNet
Pour vous concentrer sur le code de diagnostic, seules les entités associées au type MEDICAL_CONDITION
with DX_NAME
sont utilisées dans l'invite. Les autres métadonnées sont exclues en raison de leur non-pertinence. Pour les entités médicamenteuses, le nom du médicament ainsi que les attributs extraits sont inclus. Les autres métadonnées d'entités médicamenteuses d'Amazon Comprehend Medical sont exclues en raison de leur non-pertinence. Voici un exemple d'invite qui utilise les résultats filtrés d'Amazon Comprehend Medical. L'invite se concentre sur MEDICAL_CONDITION
les entités qui possèdent ce DX_NAME
type. Cette invite est conçue pour relier plus précisément les codes de diagnostic aux médicaments et pour extraire plus précisément les tests d'ordonnance médicale :
<patient_note> Carlie had a seizure 2 weeks ago. She is complaining of increased freqeunt headaches Given lyme disease symptoms such as muscle ache and stiff neck will order prescription. Meds : Topamax 50 mgs at breakfast daily. Amoxicillan 25 mg by mouth twice a day Place MRI radiology order at RadNet </patient_note> <detect_entity_results> <entity> <text>seizure</text> <category>MEDICAL_CONDITION</category> <type>DX_NAME</type> </entity> <entity> <text>headaches</text> <category>MEDICAL_CONDITION</category> <type>DX_NAME</type> </entity> <entity> <text>lyme disease</text> <category>MEDICAL_CONDITION</category> <type>DX_NAME</type> </entity> <entity> <text>muscle ache</text> <category>MEDICAL_CONDITION</category> <type>DX_NAME</type> </entity> <entity> <text>stiff neck</text> <category>MEDICAL_CONDITION</category> <type>DX_NAME</type> </entity> </detect_entity_results> <rx_results> <entity> <text>Topamax</text> <category>MEDICATION</category> <type>BRAND_NAME</type> <attributes> <attribute> <type>FREQUENCY</type> <text>at breakfast daily</text> </attribute> <attribute> <type>DOSAGE</type> <text>50 mgs</text> </attribute> <attribute> <type>ROUTE_OR_MODE</type> <text>by mouth</text> </attribute> </attributes> </entity> <entity> <text>Amoxicillan</text> <category>MEDICATION</category> <type>GENERIC_NAME</type> <attributes> <attribute> <type>ROUTE_OR_MODE</type> <text>by mouth</text> </attribute> <attribute> <type>DOSAGE</type> <text>25 mg</text> </attribute> <attribute> <type>FREQUENCY</type> <text>twice a day</text> </attribute> </attributes> </entity> </rx_results> <prompt> Based on the patient note and the detected entities, can you please: 1. Link the diagnosis symptoms with the medications prescribed. Provide your reasoning for the linkages. 2. Extract any entities related to medical order tests mentioned in the note. </prompt>
Appliquez des garde-corps avec Amazon Comprehend Medical
Vous pouvez utiliser un LLM et Amazon Comprehend Medical pour créer des barrières de sécurité avant que la réponse générée ne soit utilisée. Vous pouvez exécuter ce flux de travail sur du texte médical non modifié ou post-traité. Les cas d'utilisation incluent le traitement des informations de santé protégées (PHI), la détection d'hallucinations ou la mise en œuvre de politiques personnalisées pour la publication des résultats. Par exemple, vous pouvez utiliser le contexte d'Amazon Comprehend Medical pour identifier les données PHI, puis utiliser le LLM pour supprimer ces données PHI.
Voici un exemple d'informations extraites du dossier d'un patient contenant des informations médicales médicales :
Patient name: John Doe Patient SSN: 123-34-5678 Patient DOB: 01/01/2024 Patient address: 123 Main St, Anytown USA Exam details: good health. Pulse is 60 bpm. needs to work on diet with BMI of 190
Voici un exemple d'invite qui inclut les résultats d'Amazon Comprehend Medical comme contexte :
<original_text> Patient name: John Doe Patient SSN: 123-34-5678 Patient DOB: 01/01/2024 Patient address: 123 Main St, Anytown USA Exam details: good health. Pulse is 60 bpm. needs to work on diet with BMI of 190 </original_text> <comprehend_medical_phi_entities> <entity> <text>John Doe</text> <category>PROTECTED_HEALTH_INFORMATION</category> <score>0.9967944025993347</score> <type>NAME</type> </entity> <entity> <text>123-34-5678</text> <category>PROTECTED_HEALTH_INFORMATION</category> <score>0.9998034834861755</score> <type>ID</type> </entity> <entity> <text>01/01/2000</text> <category>PROTECTED_HEALTH_INFORMATION</category> <score>0.9964448809623718</score> <type>DATE</type> </entity> </comprehend_medical_phi_entities> <instructions> Using the provided original text and the Amazon Comprehend Medical PHI entities detected, please analyze the text to determine if it contains any additional protected health information (PHI) beyond the entities already identified. If additional PHI is found, please list and categorize it. If no additional PHI is found, please state that explicitly. In addition if PHI is found, generate updated text with the PHI removed. </instructions>