本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
多式联运知识库的先决条件
除了标准知识库之外,Amazon Bedrock 多模式知识库还需要其他设置才能处理图像、音频和视频内容。具体的先决条件取决于您选择的处理方法和存储配置。
在创建多模式知识库之前,必须满足以下先决条件:
先决条件
-
确保您的数据位于支持的数据来源连接器中。只有 Amazon S3 和自定义数据源支持多模式内容。
-
(可选)设置自己的受支持向量存储。如果您打算使用 AWS 管理控制台自动为您创建向量,则可以跳过此步骤。
-
创建具有适当多模式处理权限的自定义 AWS Identity and Access Management (IAM) 服务角色。有关详细信息,请参阅 多模式内容的权限。
注意
如果您使用的是控制台,Amazon Bedrock 知识库将自动为您配置权限。
-
(可选)按照知识库资源的加密中的步骤设置额外的安全配置。
-
如果您计划对 BDA 处理的内容使用 RetrieveAndGenerateAPI 操作,请按照中的步骤请求访问您将在要使用的区域中使用的模型。访问 Amazon Bedrock 基础模型
多模式内容的权限
除了标准知识库权限之外,多模式知识库还需要其他权限。具体权限取决于您选择的处理方法和存储配置。
您必须根据您的多模式处理方法配置以下权限:
-
Nova 多模态嵌入权限:使用 Nova 多模态嵌入进行直接的视觉和音频相似度搜索时需要。包括异步模型调用权限和多模式存储访问权限。
-
基岩数据自动化 (BDA) 权限:使用 BDA 将多模态内容转换为文本表示形式时需要。包括数据自动化调用和状态监控权限。
-
客户管理的 KMS 密钥权限:在 BDA 处理中使用客户管理的加密密钥时是必需的。包括密钥操作和授权创建权限。
-
多式联运存储权限:配置多式联运存储目的地时是必需的。包括存储桶的标准 S3 权限。
有关 IAM 策略和 step-by-step权限配置的详细信息,请参阅多模式内容的权限。
存储需求
- Nova 多模态嵌入式
-
必需:您必须配置多式联运存储目的地。此目标存储您的多媒体文件副本以供检索,并确保即使源文件被修改或删除也可用。
- 基岩数据自动化 (BDA)
-
可选:您可以配置多模式存储桶以提高可靠性,也可以在运行时检索文件。但是,这不是必需的,因为 BDA 会将内容转换为文本。
注意
如果您在未配置多模式存储桶的情况下选择 BDA 解析器,则只有文本解析可用。要利用 BDA 的多模态解析功能(处理图像、音频和视频),必须配置多模态存储目标。
多式联运存储目的地配置
配置多式联运存储目的地时,请考虑以下几点:
-
使用单独的存储桶(推荐):为您的数据源和多模式存储目标配置不同的 Amazon S3 存储桶。这提供了最简单的设置并避免了潜在的冲突。
-
如果使用相同的存储桶:您必须为数据源指定包含前缀,以限制要提取的内容。这样可以防止重新摄取提取的媒体文件。
-
避免 “aws/” 前缀:当对数据源和多模式存储目标使用同一个存储桶时,请勿使用以 “aws/” 开头的包含前缀,因为此路径是为提取的媒体存储保留的。