本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 指南和配额
<a name="guidelines-and-limits"></a>

除非另行指定，否则 Amazon Comprehend 的配额是按区域计算的。如果应用程序需要，您可以请求提高可调配额。有关配额以及如何请求增加配额的更多信息，请参阅 [AWS 服务限额](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html)。

**Topics**
+ [支持的区域：](#limits-regions)
+ [内置模型的配额](#limits-builtin-models)
+ [自定义模型的配额](#limits-custom)
+ [飞轮配额](#limits-flywheels)

## 支持的区域：
<a name="limits-regions"></a>

Amazon Comprehend 在以下地区上市： AWS 
+ 美国东部（俄亥俄州）
+ 美国东部（弗吉尼亚州北部）
+ 美国西部（俄勒冈州）
+ 亚太地区（孟买）
+ 亚太地区（首尔）
+ 亚太地区（新加坡） 
+ 亚太地区（悉尼） 
+ 亚太地区（东京）
+ 加拿大（中部）
+ 欧洲地区（法兰克福）
+ 欧洲地区（爱尔兰）
+ 欧洲地区（伦敦）
+ AWS GovCloud （美国西部）

默认情况下，Amazon Comprehend 在每个支持的区域提供所有 API 操作。有关例外情况，请参阅 [文档处理](idp.md)。

有关 API 终端节点的信息，请参阅*《Amazon Web Services 一般参考*》中的 [Amazon Comprehend 区域和终端节点](https://docs.aws.amazon.com/general/latest/gr/comprehend.html)。

要查看某个区域的当前配额或请求增加可调整配额的配额，请打开[服务限额控制台](https://console.aws.amazon.com/servicequotas/)。

## 内置模型的配额
<a name="limits-builtin-models"></a>

Amazon Comprehend 提供内置模型供您分析 UTF-8 文本文档。Amazon Comprehend 提供使用内置模型的同步和异步操作。

**Topics**
+ [实时（同步）分析](#limits-sync)
+ [异步分析](#limits-asynch)

### 实时（同步）分析
<a name="limits-sync"></a>

本节介绍与使用内置模型进行实时分析相关的配额。

**Topics**
+ [单一文档操作](#limits-single)
+ [多个文档操作](#limits-batch)
+ [对实时（同步）请求进行节流](#limits-throttling)

#### 单一文档操作
<a name="limits-single"></a>

Amazon Comprehend API 提供将单个文档作为输入的操作。以下配额适用于这些操作。

##### 单个文档操作的常规配额
<a name="limits-sync-general"></a>

以下配额适用于用于检测实体、关键短语或主要语言的实时分析。对于实体检测，这些配额适用于使用内置模型进行的检测。有关自定义实体检测，请参阅 [自定义实体识别](#limits-custom-entity-recognition) 中的配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 最大文档大小 | 100KB | 

##### 单个文档操作的特定操作配额
<a name="limits-sync-specific"></a>

以下配额适用于检测情绪、目标情绪和语法的实时分析。


| 说明 | 配额/指南 | 
| --- | --- | 
| 最大文档大小  | 5 KB | 

#### 多个文档操作
<a name="limits-batch"></a>

Amazon Comprehend API 提供批处理操作，只需一个 API 请求即可处理多个文档。以下配额适用于批处理操作。


| 说明 | 配额/指南 | 
| --- | --- | 
| 最大文档大小 | 5 KB | 
| 每次请求的最大文件数 | 25 | 

有关使用批处理文档操作的更多信息，请参阅 [多文档同步处理](concepts-processing-modes.md#how-batch)。

#### 对实时（同步）请求进行节流
<a name="limits-throttling"></a>

Amazon Comprehend 对同步请求应用动态节流。如果系统处理带宽可用，Amazon Comprehend 会逐渐增加它处理的请求数量。为了控制您的应用程序对同步 API 操作的使用，我们建议您在应用程序中开启账单提醒或实施速率限制。

### 异步分析
<a name="limits-asynch"></a>

本节介绍与使用内置模型进行异步分析相关的配额。

每个异步 API 操作最多支持 10 个活动任务。要查看每个 API 操作的配额，请参阅《*Amazon Web Services 一般参考*》中 [Amazon Comprehend 终端节点和配额](https://docs.aws.amazon.com/general/latest/gr/comprehend.html)中的服务限额表。

对于可调整配额，您可以使用[服务限额控制台](https://console.aws.amazon.com/servicequotas/)请求增加配额。

**Topics**
+ [异步操作的常规配额](#limits-async-general)
+ [异步任务的特定操作配额](#limits-async-specific)
+ [对异步请求进行节流](#limits-async-throttling)

#### 异步操作的常规配额
<a name="limits-async-general"></a>

您可以使用控制台或任何 API `Start*` 操作运行异步分析任务。有关何时使用异步操作的信息，请参阅 [异步批处理](concepts-processing-modes.md#how-async)。以下配额适用于内置模型的大多数 API `Start*` 操作。有关例外情况，请参阅 [异步任务的特定操作配额](#limits-async-specific)。


| 说明 | 配额/指南 | 
| --- | --- | 
| 检测实体、关键短语、PII 和语言的任务中每个文档的最大大小 | 1 MB | 
| 请求中所有文件的最大总大小 | 5 GB | 
| 请求中所有文件的最小总大小 | 500 字节 | 
| 最大文件数，每个文件一个文档 | 1000000 | 
| 最大总行数，每行一个文档 | 1000000 | 

#### 异步任务的特定操作配额
<a name="limits-async-specific"></a>

本节介绍特定异步操作的配额。如果下表中未指定配额，则适用常规配额值。

**Topics**
+ [情绪](#limits--sentiment)
+ [目标情绪](#limits-targeted-sentiment)
+ [Events](#limits-events)
+ [主题建模](#limits-topic-modeling)

##### 情绪
<a name="limits--sentiment"></a>

您使用该操作创建的异步情绪[StartSentimentDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartSentimentDetectionJob.html)作业具有以下配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 每个输入文档的最大大小 | 5 KB | 

##### 目标情绪
<a name="limits-targeted-sentiment"></a>

您通过操作创建的异步定向情绪[StartTargetedSentimentDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartTargetedSentimentDetectionJob.html)作业具有以下配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 支持的文档格式 | UTF-8 | 
| 任务中每个文档的最大大小 | 10 KB | 
| 任务中所有文档的最大大小 | 300 MB | 
| 最大文件数，每个文件一个文档 | 30000 | 
| 最大总行数，每行一个文档（适用于请求中的所有文件） | 30000 | 

##### Events
<a name="limits-events"></a>

您通过该[StartEventsDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartEventsDetectionJob.html)操作创建的异步事件检测任务具有以下配额。


| 说明 | 配额 | 
| --- | --- | 
| 字符编码 | UTF-8 | 
| 任务中所有文件的总大小 | 50 MB | 
| 任务中每个文档的最大大小 | 10 KB | 
| 最大文件数，每个文件一个文档 | 5000 | 
| 最大总行数，每行一个文档（适用于请求中的所有文件） | 5000 | 

##### 主题建模
<a name="limits-topic-modeling"></a>

您使用操作创建的异步主题建模[StartTopicsDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartTopicsDetectionJob.html)作业具有以下配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 字符编码 | UTF-8 | 
| 返回主题的最大数量 | 100 | 
| 一个文件的最大文件大小，每个文件一个文档 | 100 MB | 

有关更多信息，请参阅 [主题建模](topic-modeling.md)。

#### 对异步请求进行节流
<a name="limits-async-throttling"></a>

每个异步 API 操作支持每秒的最大请求数（每个区域、每个账户），还支持最多 10 个活动任务。要查看每个 API 操作的配额，请参阅《*Amazon Web Services 一般参考*》中 [Amazon Comprehend 终端节点和配额](https://docs.aws.amazon.com/general/latest/gr/comprehend.html)中的服务限额表。

对于可调整配额，您可以使用[服务限额控制台](https://console.aws.amazon.com/servicequotas/)请求增加配额。

## 自定义模型的配额
<a name="limits-custom"></a>

您可以使用 Amazon Comprehend 构建自己的自定义模型，用于自定义分类和自定义实体识别。本节提供与训练和使用自定义模型相关的指南和配额。有关自定义模型的更多信息，请参阅 [Amazon Comprehend 自定义](concepts-custom.md)。

**Topics**
+ [常规配额](#limits-custom-general)
+ [终端节点配额](#limits-custom-endpoints)
+ [文档分类](#limits-document-classification)
+ [自定义实体识别](#limits-custom-entity-recognition)

### 常规配额
<a name="limits-custom-general"></a>

Amazon Comprehend 为每种类型的输入文档设置了常规大小配额，您可以使用自定义模型进行分析。有关实时分析配额，请参阅 [用于实时分析的最大文档大小](idp-inputs-sync.md#idp-inputs-sync-sizes)。有关异步分析配额，请参阅 [异步自定义分析的输入](idp-inputs-async.md)。

每个异步 API 操作支持每秒的最大请求数（每个区域、每个账户），还支持最多 10 个活动任务。要查看每个 API 操作的配额，请参阅《*Amazon Web Services 一般参考*》中 [Amazon Comprehend 终端节点和配额](https://docs.aws.amazon.com/general/latest/gr/comprehend.html)中的服务限额表。

对于可调整配额，您可以使用[服务限额控制台](https://console.aws.amazon.com/servicequotas/)请求增加配额。

### 终端节点配额
<a name="limits-custom-endpoints"></a>

您可以创建终端节点以使用自定义模型运行实时分析。有关终端节点的信息，请参阅 [管理 Amazon Comprehend 终端节点](manage-endpoints.md)。

以下配额适用于终端节点。有关请求增加配额的更多信息，请参阅 [AWS 服务限额](https://docs.aws.amazon.com/general/latest/gr/aws_service_limits.html)。


| 说明 | 配额/指南 | 
| --- | --- | 
| 每个账户每个区域的活动终端节点的最大数量 | 20 | 
| 每个账户每个区域的推理单元的最大数量 | 200 | 
| 每个区域每个终端节点推理单元的最大数量 | 50 | 
| 每个推理单元的最大吞吐量（字符） | 每秒 100 个 | 
| 每个推理单元的最大吞吐量（文档） | 每秒 2 个 | 

### 文档分类
<a name="limits-document-classification"></a>

本节介绍以下文档分类操作的指南和配额：
+ 从[CreateDocumentClassifier](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_CreateDocumentClassifier.html)操作开始的分类器训练作业。
+ 您从[StartDocumentClassificationJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartDocumentClassificationJob.html)操作开始的异步文档分类作业。
+ 使用该[ClassifyDocument](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_ClassifyDocument.html)操作的同步文档分类请求。

#### 文件分类的常规配额
<a name="limits-class-general"></a>

下表描述了与训练自定义分类器相关的常规配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 用户名的最大长度 | 5000 个字符 | 
| 类数（多类模型） | 2 - 1000 | 
| 类数（多标签模式） | 2 - 100 | 
| 注释格式 | 
| 每类的最小注释数量（多类模式） | 10 | 
| 每类的最小注释数量（多标签模式） | 10 | 
| 最小注释数量（多标签模式） | 50 | 
| CSV 文件格式 | 
| 每类最小训练文档数量（多类模式） | 50 | 
| 每类最小训练文档数量（多标签模式） | 10 | 
| 最小训练文档数量（多标签模式） | 50 | 

#### 纯文本文档的分类
<a name="limits-class-plaintext"></a>

您可以使用纯文本输入文档创建和训练纯文本模型。Amazon Comprehend 提供实时和异步操作，使用纯文本模型对纯文本文档进行分类。

##### 训练
<a name="limits-class-p-training"></a>

下表描述了与使用纯文本文档训练自定义分类器相关的配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 训练任务中所有文件的总大小 | 5 GB | 
| 用于训练自定义分类器的增强清单文件的最大数量 | 5 | 
| 每个增强的清单文件的最大属性名称数量 | 5 | 
| 属性名称的最大长度 | 63 个字符 | 

##### 实时（同步）分析
<a name="limits-class-p-sync"></a>

下表描述了与纯文本文档实时分类相关的配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 每个同步请求的最大文档数 | 1 | 
| 最大文本文档大小（UTF-8 编码） | 10 KB | 

##### 异步分析
<a name="limits-class-p-async"></a>

下表描述了与纯文本文档异步分类相关的配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 异步任务中所有文件的总大小 | 5 GB | 
| 一个文件的最大文件大小，每个文件一个文档 | 10 MB | 
| 最大文件数，每个文件一个文档 | 1000000 | 
| 最大总行数，每行一个文档（适用于请求中的所有文件） | 1000000 | 

#### 半结构化文档的分类
<a name="limits-class-structured"></a>

本节介绍半结构化文档的文档分类指南和配额。要对半结构化文档进行分类，请使用使用原生输入文档训练过的原生文档模型。

##### 使用半结构化文档训练原生文档模型
<a name="limits-class-s-training"></a>

下表描述了与使用半结构化文档（例如 PDF 文档、Word 文档和图像文件）训练自定义分类器相关的配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 所有文档的最大页数 | 10000 | 
| 最大注释文件大小（所有 CSV 文件大小总和） | 5 MB | 
| 文档语料库大小（训练和测试文档） | 10 GB | 
| 训练和测试文件的文件大小 | 
| 图像文件大小（JPG、PNG、TIFF）。 | 1 字节 - 10 MB。TIFF 文件：最多一页。 | 
| PDF 文档的页面大小 | 1 字节 - 10 MB | 
| Word 文档的页面大小 | 1 字节 - 10 MB | 
| Amazon Textract API 输出 JSON 大小 | 1 字节 - 1 MB | 

##### 实时（同步）分析
<a name="limits-class-s-sync"></a>

本节介绍与半结构化文档的实时分类相关的配额。

下表显示输入文档的最大文件大小。对于所有输入文档类型，输入文件的最大值为一页，不超过 10000 个字符。


| 文件类型 | 最大大小 (API) | 最大大小（控制台） | 
| --- | --- | --- | 
| UTF-8 文本文档 | 10 KB | 10 KB | 
| PDF 文档 | 10 MB | 5 MB | 
| Word 文档 | 10 MB | 5 MB | 
| 图像文件 | 10 MB | 5 MB | 
| Amazon Textract API 输出大小 | 1 MB | 不适用 | 

##### 异步分析
<a name="limits-class-s-async"></a>

下表描述了与半结构化文档异步分类相关的配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 任务所有输入文档的最大页数 | 25000 | 
| 文档语料库大小 | 25 GB | 
| 图像文件大小（JPG、PNG 或 TIFF） | 1 字节 - 10 MB。TIFF 文件：最多一页。 | 
| PDF 文档的页面大小 | 1 字节 - 10 MB | 
| Word 文档的页面大小 | 1 字节 - 10 MB | 
| Textract API 输出 JSON 大小 | 1 字节 - 1 MB。 | 

### 自定义实体识别
<a name="limits-custom-entity-recognition"></a>

本节介绍自定义实体识别的以下操作的指南和配额：
+ 实体识别器训练作业从[CreateEntityRecognizer](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_CreateEntityRecognizer.html)操作开始。
+ 异步实体识别作业从[StartEntitiesDetectionJob](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_StartEntitiesDetectionJob.html)操作开始。
+ 使用[DetectEntities](https://docs.aws.amazon.com/comprehend/latest/APIReference/API_DetectEntities.html)操作同步实体识别请求。

#### 纯文本文档的自定义实体识别
<a name="limits-cer-plaintext"></a>

Amazon Comprehend 提供异步和同步操作，可使用自定义实体识别器分析纯文本文档。

##### 训练
<a name="limits-cer-p-training"></a>

本节介绍与训练自定义实体识别器分析纯文本文档相关的配额。要训练模型，您可以提供实体列表或一组带注释的文本文档。

下表描述了与使用实体列表训练模型相关的配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 每个模型的实体数量 | 1 - 25 | 
| 文件大小 (UTF-8) | 1 - 5000 字节 | 
| 实体列表中的项目数 | 1 - 1 百万 | 
| 条目列表中单个条目（去除格式后）的长度 | 1 - 5000 | 
| 实体列表语料库大小（所有文档合并为纯文本） | 5 KB - 200 MB | 

下表描述了与使用注释文本文档训练模型相关的配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 每个实体识别器的 model/custom 实体数量 | 1 - 25 | 
| 文件大小 (UTF-8) | 1 - 5000 字节 | 
| 文档数量（参见[纯文本注释](cer-annotation.md#prep-training-data-ann)） | 3 - 200000 | 
| 文档语料库大小（所有文档合并为纯文本） | 5 KB - 200 MB | 
| 每个实体的最小注释数量 | 25 | 

##### 实时（同步）分析
<a name="limits-cer-p-sync"></a>

下表描述了与纯文本文档实时分析相关的配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 每个同步请求的最大文档数 | 1 | 
| 最大文本文档大小（UTF-8 编码） | 5 KB | 

##### 异步分析
<a name="limits-cer-p-async"></a>

下表描述了与纯文本文档的异步实体识别相关的配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 文件大小 (UTF-8) | 1 字节 - 1 MB | 
| 最大文件数，每个文件一个文档 | 1000000 | 
| 最大总行数，每行一个文档（适用于请求中的所有文件） | 1000000 | 
| 文档语料库大小（所有文档合并为纯文本） | 1 字节 - 5 GB | 

#### 半结构化文档的自定义实体识别
<a name="limits-cer-structured"></a>

Amazon Comprehend 提供异步和同步操作，可使用自定义实体识别器分析半结构后化文档。您必须使用带注释的 PDF 文档训练模型。

##### 训练
<a name="limits-cer-s-training"></a>

下表描述了与训练自定义实体识别器 (CreateEntityRecognizer) 以分析半结构化文档相关的配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 每个实体识别器的 model/custom 实体数量 | 1 - 25 | 
| 最大注释文件大小 (UTF-8 JSON) | 5 MB | 
| 文档数量 | 250 - 10000 | 
| 文档语料库大小（所有文档合并为纯文本） | 5 KB - 1 GB | 
| 每个实体的最小注释数量 | 100 | 
| 用于训练自定义实体识别器的增强清单文件的最大数量 | 5 | 
| 每个增强的清单文件的最大属性名称数量 | 5 | 
| 属性名称的最大长度 | 63 个字符 | 

##### 实时（同步）分析
<a name="limits-cer-s-sync"></a>

本节介绍与半结构化文档实时分析相关的配额。

下表显示输入文档的最大文件大小。对于所有输入文档类型，输入文件的最大值为一页，不超过 10000 个字符。


| 文件类型 | 最大大小 (API) | 最大大小（控制台） | 
| --- | --- | --- | 
| UTF-8 文本文档 | 10 KB | 10 KB | 
| PDF 文档 | 10 MB | 5 MB | 
| Word 文档 | 10 MB | 5 MB | 
| 图像文件 | 10 MB | 5 MB | 
| Textract 输出文件 | 1 MB | 不适用 | 

##### 异步分析
<a name="limits-cer-s-async"></a>

本节介绍半结构化文档异步分析的配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 图像尺寸（JPG 或 PNG） | 1 字节 - 10 MB | 
| 图像尺寸 (TIFF) | 1 字节 - 10 MB。最多一页。 | 
| 文档大小 (PDF) | 1 字节 - 50 MB | 
| 文档大小 (Docx) | 1 字节 - 5 MB | 
| 文件大小 (UTF-8) | 1 字节 - 1 MB | 
| 最大文件数，每个文件一个文档（图像文件或文档不允许每行一个 PDF/Word 文档） | 500 | 
| PDF 或 Docx 文件的最大页数 | 100 | 
| 文本提取后的文档语料库大小（纯文本，所有文件合并） | 1 字节 - 5 GB | 

有关图像限制的更多信息，请参阅 [Amazon Textract 中的硬限制](https://docs.aws.amazon.com/textract/latest/dg/limits.html) 

## 飞轮配额
<a name="limits-flywheels"></a>

使用飞轮管理自定义模型版本的训练和跟踪，以进行自定义分类和自定义实体识别。有关飞轮的更多信息，请参阅 [飞轮](flywheels.md)。

### 飞轮的常规配额
<a name="limits-flywheels-general"></a>

以下配额适用于飞轮和飞轮迭代。


| 说明 | 配额/指南 | 
| --- | --- | 
| 最大飞轮数量 | 50  | 
| 处于“创建”状态的飞轮的最大数量 | 10 | 
| 每个飞轮训练数据集的最大数量 | 50 | 
| 每个飞轮测试数据集的最大数量 | 50 | 
| 处于“提取”状态的数据集的最大数量 | 10 | 
| 每个账户正在进行的飞轮迭代的最大数量 | 10 | 

### 自定义分类模型的数据集配额
<a name="limits-flywheels-class"></a>

当您为与自定义分类模型关联的飞轮摄取数据集时，适用以下配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 每类最小训练文档数量（多标签模式） | 50 | 
| 最大训练文档数 | 1000000 | 
| 最小数据集大小 | 500 字节 | 
| 最大数据集大小 | 5 GB | 
| 一个文件的最大文件大小，每个文件一个文档 | 10 MB | 

### 自定义实体识别模型的数据集配额
<a name="limits-flywheels-class"></a>

当您为与自定义实体识别模型关联的飞轮提取数据集时，适用以下配额。


| 说明 | 配额/指南 | 
| --- | --- | 
| 最大文档大小 | 5 KB | 
| 最小训练文档数 | 3 | 
| 最大训练文档数 | 200,000 | 
| 每个实体的最小注释数量 | 25 | 
| 最大数据集大小 | 200 MB |