在 Amazon Bedrock 中使用重排器模型提高查询响应的相关性 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 Amazon Bedrock 中使用重排器模型提高查询响应的相关性

Amazon Bedrock 提供了对重排器模型的访问权限,您可以在查询时使用这些模型来提高检索到的结果的相关性。重排器模型将计算分块与查询的相关性,并根据自己计算出的分数对结果进行重新排序。通过使用重排器模型,您可以返回更合适的响应来回答查询。或者,您也可以在运行模型推理时将结果包含在提示中,以生成更相关、更准确的响应。使用重排器模型时,您检索到的结果更少,但却更相关。通过将这些结果输入到用于生成响应的基础模型,您还可以降低成本和延迟。

重排器模型经过训练,可以根据查询识别相关性信号,然后利用这些信号对文档进行排序。因此,这些模型可以提供更相关、更准确的结果。

注意

您只能对文本数据使用重排。

有关重排模型的定价的信息,请参阅 Amazon Bedrock 定价

重排至少需要以下输入:

  • 重排器模型,用于接受用户查询和评测其可以访问的数据来源的相关性。

  • 用户查询。

  • 文档列表,重排器必须根据文档与查询的相关性对该列表进行重新排序。

您可以通过以下方式使用 Amazon Bedrock 中的重排器模型:

  • 直接通过 Amazon Bedrock API 调用 Rerank 操作。Rerank 操作会将查询、文档和任何其他配置作为输入发送到重排器模型。该模型随后会根据文档与查询的相关性对文档进行重排,并在响应中返回文档。

  • 如果您使用 Amazon Bedrock 知识库来构建检索增强生成(RAG)应用程序,请在调用 RetrieveRetrieveAndGenerate 操作时或者在 AWS 管理控制台中查询知识库时使用重排器模型。重排的结果会覆盖 Amazon Bedrock 知识库确定的默认排序。