偵測實體 (第 2 版) - Amazon Comprehend Medical

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

偵測實體 (第 2 版)

使用 DetectEntitiesV2 偵測單一檔案或 StartEntitiesDetectionV2Job 中的實體,以進行多個檔案的批次分析。您可以偵測下列類別中的實體:

  • ANATOMY: 偵測對身體或身體系統部分以及這些部分或系統位置的參考。

  • BEHAVIORAL_ENVIRONMENTAL_SOCIAL:偵測環境中影響個人運作狀態的行為和條件。這包括煙草使用量、酒精使用量、娛樂性藥物使用量、敏感、性別和種族/族裔。

  • MEDICAL_CONDITION: 偵測醫療狀況的跡象、症狀和診斷。

  • MEDICATION: 偵測病患上的藥物和用量資訊。

  • PROTECTED_HEALTH_INFORMATION: 偵測病患的個人資訊。

  • TEST_TREATMENT_PROCEDURE: 偵測用於判斷醫療情況的程序。

  • TIME_EXPRESSION: 偵測與偵測到的實體相關聯之時間相關的實體。

DetectEntitiesV2 操作會偵測所有六個類別。針對偵測 PHI 的特定分析,請在單一檔案上使用 DetectPHI,並使用 StartPHIDetectionJob 進行批次分析。

Amazon Comprehend Medical 偵測到下列類別中的資訊:

  • 實體:相關物件名稱的文字參考,例如人物、治療、藥物和醫療情況。例如 ibuprofen

  • 類別:實體所屬的廣義分組。例如,ibuprofen 是 MEDICATION類別的一部分。

  • 類型:在單一類別中偵測到的實體類型。例如,ibuprofen 在 MEDICATION類別的 GENERIC_NAME 類型中。

  • 屬性:與實體相關的資訊,例如藥物的用量。例如, 200 mg 是 ibuprofen 實體的屬性。

  • 特徵:Amazon Comprehend Medical 根據內容了解的實體。例如,如果患者未使用,則藥物具有NEGATION其特性。

  • 關係類型:實體與 屬性之間的關係。

Amazon Comprehend Medical 會在輸入文字中為您提供實體的位置。在 Amazon Comprehend 主控台中,它會以圖形顯示位置。當您使用 API 時,它會以數值位移顯示位置。

每個實體和屬性都包含一個分數,指出 Amazon Comprehend Medical 對偵測準確性的可信度等級。每個屬性也都有關係分數。分數表示 Amazon Comprehend Medical 在屬性與其父實體之間的關係準確性方面擁有的可信度等級。為您的使用案例識別適當的可信度閾值。在需要極高準確性的情況下使用高可信度閾值。篩選掉不符合閾值的資料。

Anatomy 類別

ANATOMY 類別會偵測對內文或內文系統的參考,以及這些部分或系統的位置。

類型

  • SYSTEM_ORGAN_SITE:身體系統、解剖位置或區域,以及身體位置。

屬性

  • DIRECTION:方向性詞彙。例如,左、右、中、橫向、上、下、後、前、遠端、近端、對側、雙邊、同側、背、尾等。

行為、環境和社會健康類別

BEHAVIORAL_ENVIRONMENTAL_SOCIAL 類別會偵測環境中影響個人運作狀態的行為和條件參考。

Type

  • ALCOHOL_CONSUMPTION:根據使用狀態、頻率、數量和持續時間定義病患的飲酒量。

  • ALLERGIES:定義病患對致敏物的敏感和回應。

  • GENDER:性別身分特性的識別。

  • RACE_ETHNICITY:具有特定種族和族群之病患身分的社交政治建構。

  • REC_DRUG_USE:根據使用狀態、頻率、數量和持續時間,定義病患對娛樂性藥物的使用。

  • TOBACCO_USE:根據使用狀態、頻率、數量和持續時間定義患者的煙草使用量。

下列偵測到的屬性僅適用於 ALCOHOL_CONSUMPTIONTOBACCO_USE和 類型REC_DRUG_USE

  • AMOUNT:使用的酒精、煙草或娛樂性藥物量。

  • DURATION:已使用酒精、煙草或娛樂性藥物多久。

  • FREQUENCY:酒精、煙草或娛樂性藥物的使用頻率。

特徵

下列偵測到的特徵僅適用於 ALCOHOL_CONSUMPTIONTOBACCO_USEALLERGIES和 類型REC_DRUG_USE

  • NEGATION:表示結果或動作為負值或未執行。

  • PAST_HISTORY:使用酒精、煙草或娛樂性藥物的跡象是來自病患的過去 (在目前事件之前)。

醫療狀況類別

MEDICAL_CONDITION 類別會偵測醫療狀況的跡象、症狀和診斷。類別有一個實體類型、四個屬性和四個特徵。一個或多個特徵可以與類型相關聯。偵測到屬性及其與診斷關係的上下文資訊,並透過 DX_NAME RELATIONSHIP_EXTRACTION. 進行映射 例如,從文字「左腿的時間性痛苦」、偵測到「時間性」為屬性 ACUITY、偵測到「左」為屬性 DIRECTION,以及偵測到「腿」為屬性 SYSTEM_ORGAN_SITE。每個屬性的關係都會映射到醫療狀況實體「痛苦」以及可信度分數。

類型

  • DX_NAME:列出的所有醫療情況。DX_NAME 類型包括目前疾病、就診原因和醫療史。

屬性

  • ACUITY:判斷疾病執行個體,例如長期、嚴重、突然、持續或漸進。

  • DIRECTION:方向性詞彙。例如,左、右、中、橫向、上、下、後、前、遠端、近端、對側、雙邊、同側、背或心室。

  • SYSTEM_ORGAN_SITE:解剖位置。

  • QUALITY:醫療情況的任何描述性術語,例如階段或等級。

特徵

  • DIAGNOSIS:確定為症狀原因或結果的醫療狀況。可以透過實體問題清單、實驗室或放射報告或任何其他方式找到症狀。

  • HYPOTHETICAL:表示醫療情況以假設表示。

  • LOW_CONFIDENCE:指出醫療情況表示為具有高度不確定性。這與提供的可信度分數不直接相關。

  • NEGATION:表示結果或動作為負值或未執行。

  • PERTAINS_TO_FAMILY:指出醫療情況與病患的家庭相關,而非病患。

  • SIGN:醫生報告的醫療情況。

  • SYMPTOM:患者報告的醫療情況。

藥物類別

MEDICATION 類別會偵測患者的藥物和用量資訊。一個或多個屬性可以套用至類型。

類型

  • BRAND_NAME:藥物或治療代理程式的著作權品牌名稱。

  • GENERIC_NAME:非品牌名稱、成分名稱或藥物或治療藥物的公式混合。

屬性

  • DOSAGE:排序的藥品數量。

  • DURATION:應給予藥物多久。

  • FORM:藥物的形式。

  • FREQUENCY:管理藥物的頻率。

  • RATE:藥物的管理速率 (主要用於藥物注入或 IVs)。

  • ROUTE_OR_MODE:藥物的管理方法。

  • STRENGTH:藥物強度。

特徵

  • NEGATION:任何表示患者未使用藥物的指示。

  • PAST_HISTORY:指出偵測到的藥品來自病患的過去 (目前事件之前)。

受保護醫療資訊類別

PROTECTED_HEALTH_INFORMATION 類別會偵測病患的個人資訊。若要偵測 PHI 進一步了解此操作,請參閱 。

類型

  • ADDRESS:設施內任何設施、單位或通道之地址的所有地理分區。

  • AGE:所有年齡元件、年齡範圍或任何提及的年齡。這包括患者、家人或其他人的那些。除非另有說明,否則預設值為年。

  • EMAIL:任何電子郵件地址。

  • ID:社會安全號碼、醫療記錄號碼、設施識別號碼、臨床試驗號碼、憑證或授權號碼、車輛或裝置號碼、護理地點或提供者。這也包含病患的任何生物識別編號,例如高度、重量或實驗室值。

  • NAME:所有名稱。一般而言,病患、家人或提供者的名稱。

  • PHONE_OR_FAX:任何電話、傳真或呼叫器號碼。排除具名電話號碼,例如 1-800-QUIT-NOW 和 911。

  • PROFESSION:任何與病患或病患家人相關的專業或雇主。它不包括備註中提及臨床醫生的職業。

測試、處理和程序類別

TEST_TREATMENT_PROCEDURE 類別會偵測用來判斷醫療情況的程序。一或多個屬性可以與 TEST_NAME類型的實體相關。

類型

  • PROCEDURE_NAME:介入作為對病患執行的一次性動作,以治療醫療情況或提供病患護理。

  • TEST_NAME:對病患執行的程序,用於可能具有結果值的診斷、測量、篩選或評分。這包括確定診斷、排除或尋找條件,或擴展或評分患者的任何程序、程序、評估或評分。

  • TREATMENT_NAME:在一段時間內執行的介入,以對抗疾病或障礙。這包括藥物分組,例如病毒和預防。

屬性

  • TEST_VALUE:測試的結果。僅適用於TEST_NAME實體類型。

  • TEST_UNIT:可能伴隨測試值的度量單位。僅適用於TEST_NAME實體類型。

特徵

  • FUTURE:表示測試、處理或程序是指將在備註主體之後發生的動作或事件。

  • HYPOTHETICAL:表示測試、處理或程序是以假設表示。

  • NEGATION:表示結果或動作為負值或未執行。

  • PAST_HISTORY:表示測試、治療或程序來自病患的過去 (目前遇到之前)。

時間表達式類別

TIME_EXPRESSION 類別會偵測與時間相關的實體。這包括日期和時間表達式等實體,例如「三天前」、「今天」、「目前」、「入學日」、「上個月」或「16 天」。此類別中的結果只有在與實體相關聯時才會傳回。例如,「Yesterday,病患接受 200 mg 的 ibuprofen」會傳回Yesterday為與TIME_EXPRESSION實體「ibuprofen」重疊的GENERIC_NAME實體。不過,在「昨天,病患走了狗」中,它無法辨識為實體。

類型

  • TIME_TO_MEDICATION_NAME:使用藥物的日期。此類型特有的屬性為 BRAND_NAMEGENERIC_NAME

  • TIME_TO_DX_NAME:發生醫療情況的日期。此類型的屬性為 DX_NAME

  • TIME_TO_TEST_NAME:執行測試的日期。此類型的屬性為 TEST_NAME

  • TIME_TO_PROCEDURE_NAME:執行程序的日期。此類型的屬性為 PROCEDURE_NAME

  • TIME_TO_TREATMENT_NAME:給予治療的日期。此類型的屬性為 TREATMENT_NAME

關係類型

  • 實體與 屬性之間的關係。辨識Relationship_type的 如下:

    Overlap – 與偵測到的實體TIME_EXPRESSION一致。