

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 文件處理
<a name="idp"></a>

Amazon Comprehend 支援自訂分類和自訂實體辨識的單一步驟文件處理。例如，您可以將純文字文件和半結構化文件 （例如 PDF 文件、Microsoft Word 文件和映像） 的混合輸入自訂分析任務。

對於需要文字擷取的輸入檔案，Amazon Comprehend 會在執行分析之前自動執行文字擷取。若要擷取文字內容，Amazon Comprehend 會將內部剖析器用於原生半結構化文件，並將 Amazon Textract APIs用於影像和掃描文件。

Amazon Comprehend 文件處理可在每個 Amazon Comprehend 中使用[支援的區域](guidelines-and-limits.md#limits-regions)，但亞太區域 （東京） 和 AWS GovCloud （美國西部） 僅支援自訂分類的純文字模型。

下列主題提供有關 Amazon Comprehend 支援用於自訂分析的輸入文件類型的詳細資訊。

**Topics**
+ [即時自訂分析的輸入](idp-inputs-sync.md)
+ [非同步自訂分析的輸入](idp-inputs-async.md)
+ [設定文字擷取選項](idp-set-textract-options.md)
+ [映像的最佳實務](idp-images-bp.md)