本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
测试和查询多模式知识库
摄取多模式内容后,您可以使用控制台或 API 测试和查询您的知识库。可用的查询类型取决于您选择的处理方法。
支持的查询类型
- 文字查询
-
同时支持 Nova 多模嵌入和 BDA 方法。使用自然语言文本进行搜索,查找所有媒体类型的相关内容。
- 图片查询
-
仅支持 Nova 多模态嵌入。上传图片以在知识库中查找视觉上相似的内容。
了解响应元数据
多模式查询响应包括多媒体内容的其他元数据:
- 来源归因
-
用于可靠访问的原始文件位置 (SourceURI) 和多模式存储位置 (supplementaLuri)
- 时态元数据
-
音频和视频片段的开始和结束时间戳,可精确导航到相关内容
- 内容类型信息
-
文件格式、处理方法和模式指示器可帮助应用程序适当地处理不同的内容类型
矢量数据库元数据结构
处理和存储多模式内容时,矢量数据库中将使用以下元数据结构:
-
文本字段:对于使用 Nova Multimodal Embeddings 处理的多媒体文件,此字段包含一个空字符串,因为内容是作为原生多媒体而不是文本嵌入的
-
metadata 字段:包含结构化信息,包括来源详细信息和相关内容引用:
{ "source": { "sourceType": "S3", "s3Location": { "uri": "s3://source-bucket/path/to/file.mp4" } }, "relatedContent": [{ "type": "S3", "s3Location": { "uri": "s3://multimodal-storage-bucket/processed/file.mp4" } }] } -
自动创建的字段:用于筛选和识别的其他字段:
-
x-amz-bedrock-kb-source-uri: 用于筛选操作的原始源 URI -
x-amz-bedrock-kb-data-source-id: 用于跟踪内容来源的数据源标识符 -
x-amz-bedrock-kb-chunk-start-time-in-millis: 音频和视频片段的开始时间戳(以毫秒为单位) -
x-amz-bedrock-kb-chunk-end-time-in-millis: 音频和视频片段的结束时间戳(以毫秒为单位) -
x-amz-bedrock-kb-source-file-mime-type: 源文件的 MIME 类型 -
x-amz-bedrock-kb-source-file-modality: 源文件的模式(文本、图像、音频、视频)
-
重要
应用程序必须使用提供的时间戳从音频和视频文件中提取和播放特定片段。知识库返回的是对完整文件的引用,而不是预先分段的片段。