文件處理 - Amazon Comprehend

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

文件處理

Amazon Comprehend 支援自訂分類和自訂實體辨識的單一步驟文件處理。例如,您可以將純文字文件和半結構化文件 (例如 PDF 文件、Microsoft Word 文件和映像) 的混合輸入自訂分析任務。

對於需要文字擷取的輸入檔案,Amazon Comprehend 會在執行分析之前自動執行文字擷取。若要擷取文字內容,Amazon Comprehend 會將內部剖析器用於原生半結構化文件,並將 Amazon Textract APIs用於影像和掃描文件。

Amazon Comprehend 文件處理可在每個 Amazon Comprehend 中使用支援的區域,但亞太區域 (東京) 和 AWS GovCloud (美國西部) 僅支援自訂分類的純文字模型。

下列主題提供有關 Amazon Comprehend 支援用於自訂分析的輸入文件類型的詳細資訊。