使用 Amazon Neptune Analytics 分析数据库引擎中的图表构建知识库 - Amazon Bedrock

使用 Amazon Neptune Analytics 分析数据库引擎中的图表构建知识库

Amazon Bedrock 知识库通过 Amazon Neptune 提供完全托管的 GraphRAG 功能。GraphRAG 是 Amazon Bedrock 知识库提供的一项功能,将图形建模与生成式人工智能相结合来增强检索增强生成(RAG)。此功能将向量搜索结合,能够在 RAG 应用程序中快速分析来自 Amazon Neptune 的大量图表数据。

GraphRAG 会自动识别并利用摄取到知识库的文档中的实体与结构元素之间的关系。这使得基础模型能够做出与上下文相关的更全面响应,尤其是在需要通过多个逻辑步骤连接信息时。这意味着,在需要对多个文档分块连接数据和进行推理的情况下,生成式人工智能应用程序可以提供更相关的响应。这使聊天机器人等应用程序能够在需要从多个文档来源得出的相关事实、实体和关系来回答问题时,通过基础模型(FM)提供更相关的响应

GraphRAG 区域可用性

GraphRAG 在以下 AWS 区域中可用:

  • 欧洲地区(法兰克福)

  • 欧洲地区(伦敦)

  • 欧洲地区(爱尔兰)

  • 美国西部(俄勒冈州)

  • 美国东部(弗吉尼亚州北部)

  • 亚太地区(东京)

  • 亚太地区(新加坡)

使用 GraphRAG 的优势

Amazon Bedrock 知识库与 GraphRAG 协同工作,提供了以下优势:

  • 通过在摄取到 Amazon Bedrock 知识库的多个文档来源中,自动识别和利用实体与结构元素(例如章节标题)之间的关系,给出更相关和更全面的响应。

  • 增强了执行详尽搜索的能力,通过多个逻辑步骤连接不同的内容片段,从而改进了传统的 RAG 技术。

  • 更好的跨文档推理功能,通过连接各种来源的信息,获得更精确、在上下文中更准确的答案,这有助于进一步提高准确性并最大限度地减少幻觉。

GraphRAG 的工作原理

在对相关节点执行初始向量搜索后,Amazon Bedrock 知识库 GraphRAG 会执行以下步骤以生成更好的响应:

  1. 检索相关的图表节点或者与检索到的文档分块相关联的分块标识符。

  2. 通过遍历图表并从图形数据库中检索详细信息,扩展这些相关分块。

  3. 使用此扩充过的上下文,通过了解相关实体并将重点放在关键实体上,来提供更有意义的响应。

GraphRAG 注意事项和限制

以下是将 Amazon Bedrock 知识库与 GraphRAG 配合使用时的一些限制

  • 不支持用于自定义图表构建的配置选项。

  • Amazon Neptune Analytics 分析数据库引擎图表不支持自动缩放。

  • GraphRAG 仅支持 Amazon S3 作为数据来源。

  • 选择 Claude 3 Haiku 作为基础模型,来自动为您的知识库生成图表。这会自动启用情境丰富功能。

  • 每个数据来源最多可以有 1000 个文件。您可以请求将此限制提高到每个数据来源最多 10000 个文件。或者,您可以将 Amazon S3 存储桶分区为多个文件夹,每个文件夹最多可包含 1000 个文件。

  • 如果您使用分层分块作为分块策略,GraphRAG 在搜索操作期间将仅检索子分块。它不会用对应的父分块替换子分块。这意味着您的搜索结果包含来自子分块的具体而详细的内容,而不是来自父分块的更广泛的上下文。

注意

删除使用 Amazon Neptune Analytics 分析数据库引擎的知识库时,请先删除知识库,然后再删除 Amazon Neptune Analytics 分析数据库引擎图表。删除知识库不会自动删除底层图表。在您明确删除图表之前,可能会产生其他费用。或者,将数据来源删除策略设置为 RETAIN 模式,就可以先删除图表而不会导致故障。有关更多信息,请参阅 从 Amazon Bedrock 知识库中删除数据来源