什麼是 Amazon Comprehend? - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

什麼是 Amazon Comprehend?

Amazon Comprehend 使用自然語言處理 (NLP) 擷取文件內容的洞見。它可透過識別文件中的實體、關鍵片語、語言、情感和其他常見元素,以此形成洞見。使用 Amazon Comprehend 根據對文件結構的了解來建立新的產品。例如,使用 Amazon Comprehend,您可以搜尋社交網路摘要中提及的產品,或掃描整個文件儲存庫中是否有金鑰片語。

您可以使用 Amazon Comprehend 主控台或使用 Amazon Comprehend APIs 存取 Amazon Comprehend 文件分析功能。您可以針對小型工作負載執行即時分析,也可以針對大型文件集啟動非同步分析任務。您可以使用 Amazon Comprehend 提供的預先訓練模型,也可以訓練自己的自訂模型以進行分類和實體辨識。

Amazon Comprehend 可能會儲存您的內容,以持續改善其預先訓練模型的品質。如需進一步了解,請參閱 Amazon Comprehend 常見問答集

所有 Amazon Comprehend 功能都接受 UTF-8 文字文件做為輸入。此外,自訂分類和自訂實體辨識接受影像檔案、PDF 檔案和 Word 檔案做為輸入。

Amazon Comprehend 可以根據特定功能,檢查和分析各種語言的文件。如需詳細資訊,請參閱Amazon Comprehend 支援的語言。Amazon Comprehend 主要語言的功能可以檢查文件,並判斷更廣泛語言選擇的主要語言。

Amazon Comprehend 洞察

Amazon Comprehend 使用預先訓練的模型來檢查和分析文件或一組文件,以收集其相關見解。此模型會在大量文字內文中持續訓練,因此您不需要提供訓練資料。

Amazon Comprehend 會分析下列類型的洞見:

  • 實體 – 參考文件中包含的人員、位置、項目和位置名稱。

  • 關鍵片語 – 出現在文件中的片語。例如,有關籃球遊戲的文件可能會傳回隊伍名稱、場地名稱和最終分數。

  • 個人身分識別資訊 (PII) – 可識別個人身分的個人資料,例如地址、銀行帳戶號碼或電話號碼。

  • 語言 – 文件的主要語言。

  • 情緒 – 文件的主要情緒,可以是正面、中性、負面或混合。

  • 目標情緒 – 與文件中特定實體相關聯的情緒。每個實體出現時的情緒可以是正面、負面、中性或混合。

  • 語法 – 文件中每個字詞的語音部分。

如需詳細資訊,請參閱洞見

Amazon Comprehend Custom

您可以根據您的特定需求自訂 Amazon Comprehend,無需建置機器學習型 NLP 解決方案所需的技能。使用自動機器學習或 AutoML,Amazon Comprehend Custom 會使用您已擁有的資料,代表您建置自訂的 NLP 模型。

自訂分類 – 建立自訂分類模型 (分類器),將文件組織成您自己的類別。

自訂實體辨識 – 建立自訂實體辨識模型 (辨識器),以分析特定詞彙和以名詞為基礎的片語的文字。

如需詳細資訊,請參閱Amazon Comprehend Custom

飛輪

使用飛輪簡化訓練和管理自訂模型版本的程序。飛輪有助於協調與訓練和評估新版本模型相關的任務。Flywheels 支援純文字自訂模型,可用於自訂分類和自訂實體辨識。如需詳細資訊,請參閱飛輪

文件叢集 (主題建模)

您也可以使用 Amazon Comprehend 來檢查文件的 corpus,以根據其中的類似關鍵字來組織它們。文件叢集 (主題建模) 有助於根據文字頻率,將大型文件組合組織成類似的主題或叢集。如需詳細資訊,請參閱主題建模

範例

下列範例示範如何在應用程式中使用 Amazon Comprehend 操作。

範例 1:尋找有關主題的文件

使用 Amazon Comprehend 主題建模尋找有關特定主題的文件。掃描一組文件以判斷討論的主題,並尋找與每個主題相關聯的文件。您可以指定 Amazon Comprehend 應該從文件集傳回的主題數目。

範例 2:了解客戶對您的產品的感受

如果您的公司發佈目錄,讓 Amazon Comprehend 告訴您客戶對您的產品有何想法。將每個客戶評論傳送到 DetectSentiment操作,它會告訴您客戶是否對產品感到正面、負面、中立或混合。

範例 3:探索對客戶重要的事項

使用 Amazon Comprehend 主題建模來探索客戶在論壇和訊息板上討論的主題,然後使用實體偵測來判斷他們與該主題相關聯的人員、位置和物件。使用情緒分析來判斷客戶對主題的感受。

優勢

使用 Amazon Comprehend 的優點包括:

  • 將強大的自然語言處理整合至您的應用程式 – Amazon Comprehend 透過簡單的 API 提供強大且準確的自然語言處理,消除了在應用程式中建置文字分析功能的複雜性。您不需要文字分析專業知識,就能利用 Amazon Comprehend 產生的洞見。

  • 以深度學習為基礎的自然語言處理 – Amazon Comprehend 使用深度學習技術來準確分析文字。我們的模型會持續使用跨多個網域的新資料進行訓練,以提高準確性。

  • 可擴展的自然語言處理 – Amazon Comprehend 可讓您分析數百萬份文件,以便探索其中包含的洞見。

  • 與其他 AWS 服務整合 – Amazon Comprehend 旨在與其他 AWS 服務無縫搭配 AWS KMS運作,例如 Amazon S3 和 AWS Lambda。將您的文件存放在 Amazon S3 中,或使用 Firehose 分析即時資料。支援 AWS Identity and Access Management (IAM) 可讓您輕鬆安全地控制對 Amazon Comprehend 操作的存取。使用 IAM,您可以建立和管理使用者和群組,將適當的存取權授予開發人員和最終使用者。

  • 輸出結果和磁碟區資料的加密 – Amazon S3 已可讓您加密輸入文件,而 Amazon Comprehend 更進一步延伸。透過使用您自己的 KMS 金鑰,您可以加密任務的輸出結果,以及連接至處理分析任務之運算執行個體的儲存磁碟區上的資料。結果是大幅增強安全性。

  • 低成本 – 使用 Amazon Comprehend,沒有最低費用或預付承諾。您需為分析的文件和您訓練的自訂模型付費。

Amazon Comprehend 定價

使用 Amazon Comprehend,您只需為使用的資源付費。如果您是新 AWS 客戶,可免費開始使用 Amazon Comprehend。如需詳細資訊,請參閱AWS 免費用量方案

執行即時或非同步分析任務需支付使用費。您支付訓練自訂模型的費用,並支付自訂模型管理的費用。對於使用自訂模型的即時請求,您需要為端點付費,從您啟動端點到刪除端點為止。使用飛輪不收取額外費用。不過,當您執行飛輪反覆運算時,您需要支付訓練新模型版本和儲存模型資料的標準費用。

如需費率和其他詳細資訊,請參閱 Amazon Comprehend 定價

您是第一次使用 Amazon Comprehend 嗎?

如果您是第一次使用 Amazon Comprehend,建議您依序閱讀下列各節:

  1. 運作方式 – 本節介紹 Amazon Comprehend 概念。

  2. 設定 – 在本節中,您會建立 帳戶並設定 AWS CLI。

  3. Amazon Comprehend 入門 – 在本節中,您會執行 Amazon Comprehend 分析任務。

  4. 教學課程:使用 Amazon Comprehend 分析客戶評論的洞見 – 在本節中,您會執行情緒和實體分析,並將結果視覺化。

  5. Amazon Comprehend API 參考 – Amazon Comprehend 操作的參考文件。

AWS 提供下列資源來了解 Amazon Comprehend 服務: