語法分析 - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

語法分析

使用語法分析從文件中剖析字詞,並傳回文件中每個字詞的語音或語法函數部分。您可以在文件中識別名詞、動詞、形容詞等。使用此資訊可更深入了解文件的內容,並了解文件中字詞的關係。

例如,您可以在文件中尋找名詞,然後尋找與這些名詞相關的動詞。在像是「我的祖母移動她的沙發」的句子中,您可以看到名詞、「祖母」和「咖啡」,以及動詞「移動」。您可以使用此資訊來建置應用程式,以分析您感興趣的文字組合文字。

若要開始分析,Amazon Comprehend 會剖析來源文字,以在文字中尋找個別單字。剖析文字之後,每個字詞都會被指派為在來源文字中採取的語音部分。

Amazon Comprehend 可以識別下列語音部分。

權杖 語音的一部分
ADJ

形容詞

通常修改名詞的單字。

ADP

宣告

前置或後置片語的開頭。

ADV

Adverb

通常修改動詞的單字。他們也可能修改形容詞和其他輔助詞。

AUX

輔助

伴隨動詞片語動詞的函數單字。

CCONJ

協調 結合

協調結合會連接句子中的單字、片語或子句,而不會將單字、片語或子句子句依序排列。

CONJ

連接詞

結合會連接句子中的單字、片語或子句。

DET

判斷器

指定特定名詞片語的文章和其他字詞。

INTJ

插入

用作驚嘆號或驚嘆號一部分的字詞。

NOUN

名詞

指定人物、地點、實物、動物或想法的字詞。

NUM

數值

表達數字的單字,通常是決定者、形容詞或代名詞。

O

其他

無法指派給語音類別一部分的字詞。

PART

助詞

與另一個單字或片語相關聯的函數單字可賦予意義。

PRON

代名詞

取代名詞或名詞片語的字詞。

PROPN

適當的名詞

此名詞是特定個人、位置或物件的名稱。

PUNCT

標點符號

分隔文字的非字母字元。

SCONJ

協調 結合

將相依子句加入句子的結合。子排序結合的範例是「原因」。

SYM

Symbol

類似文字的實體,例如貨幣符號 ($) 或數學符號。

VERB

動詞

發出事件和動作訊號的字詞。

如需語音部分的詳細資訊,請參閱 Universal Dependencies 網站上的 Universal POS 標籤

操作會傳回識別單字的字符,以及單字在文字中代表的語音部分。每個字符代表來源文字中的字詞。它提供來源中字詞的位置、該字詞在文字中採用的語音部分、Amazon Comprehend 對正確識別語音部分的可信度,以及從來源文字剖析的字詞。

以下是語法字符清單的結構。文件中的每個字詞都會產生一個語法字符。

{ "SyntaxTokens": [ { "BeginOffset": number, "EndOffset": number, "PartOfSpeech": { "Score": number, "Tag": "string" }, "Text": "string", "TokenId": number } ] }

每個字符都提供以下資訊:

  • BeginOffsetEndOffset- 在輸入文字中提供單字的位置。

  • PartOfSpeech- 提供兩種資訊:Tag識別語音部分的 Score,以及代表 Amazon Comprehend 語法對正確識別語音部分的可信度的 。

  • Text- 提供已識別的字詞。

  • TokenId- 提供字符的識別符。識別符是字符清單中字符的位置。