多式联运知识库的先决条件 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

多式联运知识库的先决条件

除了标准知识库之外,Amazon Bedrock 多模式知识库还需要其他设置才能处理图像、音频和视频内容。具体的先决条件取决于您选择的处理方法和存储配置。

在创建多模式知识库之前,必须满足以下先决条件:

先决条件

  1. 确保您的数据位于支持的数据来源连接器中。只有 Amazon S3 和自定义数据源支持多模式内容。

  2. (可选)设置自己的受支持向量存储。如果您打算使用 AWS 管理控制台自动为您创建向量,则可以跳过此步骤。

  3. 创建具有适当多模式处理权限的自定义 AWS Identity and Access Management (IAM) 服务角色。有关详细信息,请参阅 多模式内容的权限

    注意

    如果您使用的是控制台,Amazon Bedrock 知识库将自动为您配置权限。

  4. (可选)按照知识库资源的加密中的步骤设置额外的安全配置。

  5. 如果您计划对 BDA 处理的内容使用 RetrieveAndGenerateAPI 操作,请按照中的步骤请求访问您将在要使用的区域中使用的模型。访问 Amazon Bedrock 基础模型

多模式内容的权限

除了标准知识库权限之外,多模式知识库还需要其他权限。具体权限取决于您选择的处理方法和存储配置。

您必须根据您的多模式处理方法配置以下权限:

  • Nova 多模态嵌入权限:使用 Nova 多模态嵌入进行直接的视觉和音频相似度搜索时需要。包括异步模型调用权限和多模式存储访问权限。

  • 基岩数据自动化 (BDA) 权限:使用 BDA 将多模态内容转换为文本表示形式时需要。包括数据自动化调用和状态监控权限。

  • 客户管理的 KMS 密钥权限:在 BDA 处理中使用客户管理的加密密钥时是必需的。包括密钥操作和授权创建权限。

  • 多式联运存储权限:配置多式联运存储目的地时是必需的。包括存储桶的标准 S3 权限。

有关 IAM 策略和 step-by-step权限配置的详细信息,请参阅多模式内容的权限

存储需求

Nova 多模态嵌入式

必需:您必须配置多式联运存储目的地。此目标存储您的多媒体文件副本以供检索,并确保即使源文件被修改或删除也可用。

基岩数据自动化 (BDA)

可选:您可以配置多模式存储桶以提高可靠性,也可以在运行时检索文件。但是,这不是必需的,因为 BDA 会将内容转换为文本。

注意

如果您在未配置多模式存储桶的情况下选择 BDA 解析器,则只有文本解析可用。要利用 BDA 的多模态解析功能(处理图像、音频和视频),必须配置多模态存储目标。

多式联运存储目的地配置

配置多式联运存储目的地时,请考虑以下几点:

  • 使用单独的存储桶(推荐):为您的数据源和多模式存储目标配置不同的 Amazon S3 存储桶。这提供了最简单的设置并避免了潜在的冲突。

  • 如果使用相同的存储桶:您必须为数据源指定包含前缀,以限制要提取的内容。这样可以防止重新摄取提取的媒体文件。

  • 避免 “aws/” 前缀:当对数据源和多模式存储目标使用同一个存储桶时,请勿使用以 “aws/” 开头的包含前缀,因为此路径是为提取的媒体存储保留的。