實體 - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

實體

實體是對真實世界物件的唯一名稱的文字參考,例如人物、地點和商業項目,以及對日期和數量等量值的精確參考。

例如,在文字中「John 於 2012 年移至 1313 Mockingbird 車道」,「John」可能辨識為 PERSON,「1313 Mockingbird 車道」可能辨識為 LOCATION,而「2012」可能辨識為 DATE

每個實體也有分數,指出 Amazon Comprehend 正確偵測到實體類型的可信度。您可以篩選分數較低的實體,以降低使用不正確偵測的風險。

下表列出實體類型。

Type 說明

COMMERCIAL_ITEM

品牌產品

DATE

完整日期 (例如 11/25/2017)、天 (星期二)、月 (五月) 或時間 (上午 8:30)

EVENT

活動,例如節日、音樂會、選舉等。

LOCATION

特定位置,例如國家/地區、城市、湖泊、建築物等。

組織

大型組織,例如政府、公司、宗教、運動隊伍等。

OTHER

不符合任何其他實體類別的實體

人員

個人、人物群組、暱稱、虛構角色

數量

量化金額,例如貨幣、百分比、數字、位元組等。

標題

提供給任何創作或創意作品的官方名稱,例如電影、書籍、歌曲等。

您可以使用 Amazon Comprehend 支援的任何主要語言來執行偵測實體操作。這只包含預先定義的 (非自訂) 實體偵測。所有文件都必須使用相同的語言。

您可以使用下列任何 API 操作來偵測文件或一組文件中的實體。

操作會傳回 API 實體物件的清單,文件中每個實體各一個。BatchDetectEntities 操作會傳回Entity物件清單,即批次中每個文件的清單。StartEntitiesDetectionJob 操作會啟動非同步任務,產生包含任務中每個文件Entity物件清單的檔案。

下列範例是來自 DetectEntities操作的回應。

{ "Entities": [ { "Text": "today", "Score": 0.97, "Type": "DATE", "BeginOffset": 14, "EndOffset": 19 }, { "Text": "Seattle", "Score": 0.95, "Type": "LOCATION", "BeginOffset": 23, "EndOffset": 30 } ], "LanguageCode": "en" }