调整容量 - Amazon Kendra

调整容量

注意

功能支持因所用索引类型和搜索 API 而异。要查看您使用的索引类型和搜索 API 是否支持此功能,请参阅索引类型

Amazon Kendra 以容量单位为索引提供资源。每个容量单位都为索引提供了额外的资源。文档和查询的存储有单独的容量单位。您只能为 GenAI 企业版和 Amazon Kendra 企业版索引设置容量单位。无法向开发者版本索引添加容量。

文档存储容量单位为您的索引提供了以下额外存储空间。

  • Amazon Kendra GenAI 企业版 - 20000 份文档或 200 MB 的提取文本。

  • Amazon Kendra 企业版 - 100000 份文档或 30 GB 存储空间。

查询容量单位为您的索引提供以下额外查询。每秒查询次数在检索和查询 API 之间共享。

  • Amazon Kendra GenAI 企业版 - 每秒 0.1 次查询,或者每天大约 8000 次查询。

  • Amazon Kendra 企业版 - 每秒 0.1 次查询,或者每天大约 8000 次查询。

每个索引的基本容量等于 1 个容量单位(30 GB/200 MB 存储空间和每秒 0.1 次查询)。每增加一个容量单位都需要支付额外费用。有关详细信息,请参阅 Amazon Kendra 定价

您最多可以添加 100 个额外容量单位到存储中,并查询索引的资源。如果您需要更多设备,只需联系支持团队

为了适应您的使用要求,您每天最多可以将容量单位提高 5 倍。您不能将文档存储容量减少到索引中存储的文档数量以下。例如,如果您要存储 150,000 个文档,则不能将存储容量减少到 1 个额外单位以下。

您可以在控制台中查看索引正在使用的资源,方法是选择索引名称以打开索引设置和其他信息,也可以使用 DescribeIndex API。

当超过索引容量时,Amazon Kendra 还会返回异常。当所有文档的提取总大小超过索引的限制时,您会得到 ServiceQuotaExceededException。当文档数量超过索引限制时,每个文档都会得到一个 InvalidRequest。如果每秒的查询数量超出限制,则会得到 ThrottlingException。有关限制的更多信息,请参阅 Amazon Kendra 的限额

累积的查询将持续长达 24 小时。

查看容量

通过选择索引名称来访问详细信息,即可在 Amazon Kendra 控制台中查看索引正在使用的资源。控制台还提供使用情况图表,因此您可以确定索引使用的存储空间和查询容量。您可以使用此信息来帮助您计划何时添加更多容量。

要查看文档存储和查询,请使用(控制台)
  1. 登录 AWS 管理控制台 并打开 Amazon Kendra 控制台 (https://console.aws.amazon.com/kendra/home)。

  2. 从索引列表中选择要访问的索引。

  3. 滚动至设置部分,查看当前的文档存储总量和查询容量。

要使用 Amazon Kendra API 查看容量,请使用 DescribeIndex API 中的 CapacityUnits 参数。

添加和删除容量

如果您需要为索引增加容量,可以使用控制台或 Amazon Kendra API 进行添加。

添加或删除存储或查询容量(控制台)
  1. 登录 AWS 管理控制台 并打开 Amazon Kendra 控制台 (https://console.aws.amazon.com/kendra/home)。

  2. 从索引列表中选择要访问的索引。

  3. 选择编辑,或者从操作下拉列表中选择编辑

  4. 选择下一步以进入配置详细信息页面。

  5. 添加或移除文档存储和/或查询容量单位。

  6. 继续选择下一步以进入评论页面,然后选择更新以保存您的更改。

在更新索引的容量后,您所做的更改可能需要几分钟才能生效。

要使用 Amazon Kendra API 添加或移除容量,请使用 UpdateIndex API 中的 CapacityUnits 参数。

Amazon Kendra 智能排名容量

容量单位每秒为重新评分执行计划提供以下额外的重新评分请求。重新评分执行计划是用于配置重新评分 API 的资源。

  • 每秒 0.01 个请求

每个重新评分执行计划都附带一个等于 1 个容量单位(每秒 0.01 个请求)的基本容量。每增加一个容量单位都需要支付额外费用。有关详细信息,请参阅 Amazon Kendra 定价

您最多可以添加 1000 个额外容量单位来执行重新评分执行计划。如果您需要更多设备,只需联系支持团队

查询建议容量

使用查询建议时,基本查询容量为每秒 2.5 次 GetQuerySuggestions 调用。GetQuerySuggestions 容量是索引预置查询容量的五倍,或每秒 2.5 个调用的基本容量,以较高者为准。例如,索引的基本容量为每秒 0.1 个查询,GetQuerySuggestions 容量的基本容量为每秒 2.5 个调用。如果您在索引每秒共 0.2 个查询的基础上再添加 0.1 个查询,GetQuerySuggestions 容量为每秒 2.5 个调用(比每秒 0.2 个查询的五倍还要高)。

Amazon Kendra 体验容量

搜索体验容量

Amazon Kendra 会开始为您的 Amazon Kendra 体验限制 QueryQuerySuggestionsSubmitFeedback,即对于每次查询暴增,限制为每秒 15 个请求和每秒 40 个请求。对于查询容量单位超过 150 的索引,这些限制仍然适用。

例如,您的索引的查询容量单位为 150,因此您的搜索体验应用程序每秒可以处理 15 个请求。但是,如果您扩展到 200 个查询容量单位,那么您的搜索体验应用程序每秒仍只能处理 15 个请求。如果您将索引限制为 100 个查询容量单位,则您的搜索体验应用程序每秒只能处理 10 个请求。

自适应查询暴增

Amazon Kendra 预配置的基本容量为 1 个查询容量单位。您每天使用 8000 个查询,最低吞吐量为每秒 0.1 个查询(每个查询容量单位)。累积的查询将持续长达 24 小时,并且可以容纳大量流量。允许的突发量会有所不同,因为它取决于集群在任何给定时间的负载。预配置足够的查询容量单位来处理您的峰值负载水平。

处理超出预配置吞吐量的意外突发流量的一种自适应方法是 Amazon Kendra 的内置自适应查询暴增。Amazon Kendra 的企业版提供了自适应查询突发功能。

自适应查询突发是一项内置功能,允许您应用未使用的查询容量来处理意外流量。Amazon Kendra 以每秒预配置的查询速率累积未使用的查询,最多不超过您为 Amazon Kendra 索引配置的最大查询数。这些累积的查询用于超出分配容量的意外流量。自适应查询突发的最佳性能可能会有所不同,具体取决于多个因素,例如索引总大小、查询复杂性、累积的未使用查询以及索引的总体负载。建议您自行进行负载测试,以准确测量容量暴增。