本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在您的应用程序中使用 InvokeGuardrailChecks API
借助 InvokeGuardrailChecksAPI,您可以评估用户提示并使用特定的保护措施(例如内容过滤器、即时攻击检测和敏感信息过滤器)在应用程序中的任何位置对响应进行建模,而无需创建单独的护栏资源。您可以在各种应用程序中使用此 API,包括代理人工智能工作流程,这些工作流程涉及多回合对话,每回合都需要进行内容评估。该 API 仅限检测:它会检测不良内容并为每次安全检查返回一个数字分数,这样您就可以在应用程序逻辑中定义阈值并采取所需的操作。利用这些分数,您可以根据自定义阈值和应用程序要求构建自适应响应逻辑,例如屏蔽、旁路、重试或路由,以供人工审查。
InvokeGuardrailChecksAPI 的特点:
-
灵活性 — 您可以使用
InvokeGuardrailChecksAPI 调用任何安全检查,并将其集成到应用程序中的任何位置。在向 LLM 发送提示之前、在收到 LLM 的响应之后、在执行模型想要调用的工具之前、在工具返回结果之后,或者在你想要评估内容的任何其他时候,你可以调用 API 并进行任何安全检查。例如,您可以对输入提示进行即时攻击检测,以及使用内容过滤器的内容审核,但要检查敏感信息泄露,例如带有模型响应的 PII 内容。 -
无需预先创建资源 — 在使用 API 调用所需的保护措施之前,您无需创建护栏资源。您无需添加
CreateGuardrail步骤,也不需要跟踪单个护栏 ID 或版本。这对于环路中的不同步骤需要不同的安全姿势的代理人工智能工作流程尤其有价值。您可以在不同的步骤中应用单独的保护措施,而无需在每个步骤中创建护栏资源,从而避免运营开销。 -
Detect-only—
InvokeGuardrailChecksAPI 会返回每项安全检查的结果,其数字分数介于 0 和 1 之间。API 不会屏蔽、传递或编辑内容。您可以根据应用程序要求决定所需的操作,例如屏蔽内容、编辑 PII 匹配项或显示警告。 -
支持的保护措施 —
InvokeGuardrailChecksAPI 支持 Amazon Bedrock Guardrails 提供的以下保护措施:-
使用 Amazon Bedrock 护栏检测提示攻击— 即时攻击检测是作为
InvokeGuardrailChecksAPI 内容过滤器之外的单独保护措施提供的。这与内容过滤器中包含即时攻击安全检查的ApplyGuardrailAPI 不同。
支持的区域:
该 InvokeGuardrailChecks API 在以下 AWS 区域可用:
美国东部(弗吉尼亚州北部)
美国东部(俄亥俄州)
美国西部(俄勒冈州)
欧洲地区(伦敦)
欧洲地区(斯德哥尔摩)
亚太地区(东京)
亚太地区(悉尼)