事件 - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

事件

使用事件偵測來分析特定類型事件及其相關實體的文字文件。Amazon Comprehend 支援使用非同步分析任務跨大型文件集合進行事件偵測。如需事件的詳細資訊,包括範例事件分析任務,請參閱宣布推出 Amazon Comprehend Events

實體

從輸入文字中,Amazon Comprehend 會擷取與偵測到的事件相關的實體清單。實體可以是真實世界的物件,例如人物、地點或位置;實體也可以是概念,例如測量、日期或數量。實體每次出現都會透過提及來識別,這是輸入文字中實體的文字參考。對於每個唯一的實體,所有提及項目都會分組到清單中。此清單提供實體發生之輸入文字中每個位置的詳細資訊。Amazon Comprehend 只會偵測與支援的事件類型相關聯的實體。

與支援的事件類型相關聯的每個實體都會傳回下列相關詳細資訊:

  • 提及:輸入文字中每次出現相同實體的詳細資訊。

    • BeginOffset:輸入文字中的字元位移,顯示提及開始的位置 (第一個字元位於位置 0)。

    • EndOffset:輸入文字中的字元位移,顯示提及的結束位置。

    • 分數:Amazon Comprehend 對實體類型準確性的可信度。

    • GroupScore:來自 Amazon Comprehend 的可信度層級,指出該提及項目已正確分組為相同實體的其他提及項目。

    • 文字:實體的文字。

    • 類型:實體的類型。如需所有支援的實體類型,請參閱 實體類型

事件

Amazon Comprehend 會傳回在輸入文字中偵測到的事件清單 (支援的事件類型)。每個事件會傳回下列相關詳細資訊:

  • 類型:事件的類型。如需所有支援的事件類型,請參閱 Event types (事件類型)

  • 引數:與偵測到的事件相關的引數清單。引數包含與偵測到的事件相關的實體。引數的角色描述關係,例如執行動作的人員、時間和地點

    • EntityIndex:從 Amazon Comprehend 為此分析傳回的實體清單中識別實體的索引值。

    • 角色:引數類型,描述此引數的實體與事件的關係。如需所有支援的引數類型,請參閱 引數類型

    • 分數:Amazon Comprehend 對角色偵測準確性的可信度。

  • 觸發條件:偵測到之事件的觸發條件清單。觸發是表示事件發生的單一單字或片語。

    • BeginOffset:輸入文字中的字元位移,顯示觸發開始的位置 (第一個字元位於位置 0)。

    • EndOffset:輸入文字中的字元位移,顯示觸發程序結束的位置。

    • 分數:Amazon Comprehend 對偵測準確性的可信度。

    • 文字:觸發條件的文字。

    • GroupScore:來自 Amazon Comprehend 的可信度層級,即觸發條件已正確分組為相同事件的其他觸發條件。

    • 類型:此觸發器指示的事件類型。

偵測事件結果格式

當您的事件偵測任務完成時,Amazon Comprehend 會將分析結果寫入您在開始任務時指定的 Amazon S3 輸出位置。

對於每個偵測到的事件,輸出會以下列格式提供詳細資訊:

{ "Entities": [ { "Mentions": [ { "BeginOffset": number, "EndOffset": number, "Score": number, "GroupScore": number, "Text": "string", "Type": "string" }, ... ] }, ... ], "Events": [ { "Type": "string", "Arguments": [ { "EntityIndex": number, "Role": "string", "Score": number }, ... ], "Triggers": [ { "BeginOffset": number, "EndOffset": number, "Score": number, "Text": "string", "GroupScore": number, "Type": "string" }, ... ] }, ... ] }

實體、事件和引數支援的類型

實體類型

Type 說明
DATE 日期或時間的任何參考,無論是特定或一般。
設施 建築物、機場、高速公路、橋樑和其他永久的人工結構和房地產改善。
LOCATION 實體位置,例如街道、城市、州、國家/地區、水域或地理座標。
MONETARY_VALUE 以美元或其他貨幣為單位的物件值。值可以是特定或近似值。
組織 由已建立的組織結構定義的公司和其他人員群組。
人員 個人或虛構角色的名稱或暱稱。
PERSON_TITLE 描述人員的任何標題,通常為僱用類別 (例如 CEO) 或榮譽 (例如 Mr.)。
數量 數字或值和測量單位。
STOCK_CODE 股票代號,例如 AMZN、國際股票識別號碼 (ISIN)、統一股票識別程序委員會 (CUSIP) 或股票交易所每日官方清單 (SEDOL)。

Event types (事件類型)

Type 說明
銀行RUPTCY 涉及個人或公司無法償還未償還債務的法律程序。
僱用 當員工被僱用、被解僱、淘汰或以其他方式變更僱用狀態時發生。
CORPORATE_ACQUISTION 當公司取得大部分或所有其他公司的股票或實體資產,以取得該公司的控制權時,便會發生。
INVESTMENT_GENERAL 當個人或公司購買資產時,可能會產生未來的收入或收益。
CORPORATE_MERGER 當兩個或多個公司聯合建立新法人實體時發生。
IPO 首次公開發行 (IPO) 發行新股票時,向大眾公開發行的私有公司股票。
RIGHTS_ISSUE 提供給現有利益相關者購買額外股票的一組權利,稱為訂閱授權,與其現有持分成比例。
SECONDARY_OFFERING 公司利益相關者提供的有價證券。
SHELF_OFFERING 一種美國證交會 (SEC) 條款,可讓發行者註冊新的安全問題,並在一段時間內銷售部分問題,而不會重新註冊安全或產生懲罰。也稱為層架註冊。
TENDER_OFFERING 提議購買公司中部分或全部的利害關係人股票。
STOCK_SPLIT 當公司的董事會透過發行更多股票給目前的持有者來增加未發行的股票數量時,便會發生。此事件也適用於反向股票分割。

引數類型

BANKRUPTCY 的引數類型
引數類型 Description
FILER 申請貨幣的個人或公司。
DATE 暫停的日期或時間。
位置 發生 (或最接近) 取消的地點或設施。
EMPLOYMENT 的引數類型
Type 說明
員工 公司僱用的人員。
EMPLOYEE_TITLE 員工的標題。
員工 僱用該員工的人員或公司。
START_DATE 僱用的開始日期或時間。
END_DATE 僱用的結束日期或時間。
CORPORATE_ACQUISTION、INVESTMENT_GENERAL 的引數類型
Type 說明
AMOUNT 與交易相關聯的貨幣值。
INVESTEE 與投資相關聯的個人或公司。
INVESTOR 投資資產的人員或公司。
DATE 取得或投資的日期或時間。
位置 (或最接近) 進行取得或投資的位置。
CORPORATE_MERGER 的引數類型
Type 說明
DATE 合併的日期或時間。
新公司 合併所產生的新法人實體。
參與者 參與合併的公司。
IPO、RIGHTS_ISSUE、SecCONDARY_OFFERING、SHELF_OFFERING、TENDER_OFFERING 的引數類型
Type 說明
EXPIRE_DATE 優惠的過期日期或時間。
INVESTOR 投資資產的人員或公司。
優惠 接收優惠的人員或公司。
OFFERING_AMOUNT 與方案相關聯的貨幣值。
OFFERING_DATE 方案的日期或時間。
優惠 啟動方案的人員或公司。
OFFEROR_TOTAL_VALUE 與方案相關聯的貨幣總值。
RECORD_DATE 方案的記錄日期或時間。
SELLING_AGENT 協助銷售優惠的人員或公司。
SHARE_PRICE 與股票價格相關聯的貨幣價值。
SHARE_QUANTITY 與方案相關聯的共用數目。
編寫者 與產品承銷相關聯的公司。
STOCK_SPLIT 的引數類型
Type 說明
公司 發行股票分割份額的公司。
DATE 股票分割的日期或時間。
SPLIT_RATIO 增加的已發行新股票數量與股票分割之前目前股票數量的比率。