创建蓝图 - Amazon Bedrock

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建蓝图

如何为自定义输出创建蓝图

Amazon Bedrock 数据自动化 (BDA) 允许您为 BDA 可以提取的任何文件类型创建自定义蓝图。您可以使用蓝图为输入文件定义所需的输出格式和提取逻辑。通过创建自定义蓝图,您可以定制 BDA 输出来满足特定要求。

在一个项目中,您可以应用:

  • 最多 40 个文档蓝图。这使得您可以在同一个项目中处理不同类型的文档,并让每个文档都有自己的自定义提取逻辑。

  • 一个图像蓝图。这样可以确保项目中图像处理的一致性。

  • 一个音频蓝图。

  • 一个视频蓝图。

创建蓝图

在 BDA 中可以通过两种方法创建蓝图:

  • 使用蓝图提示

  • 手动创建蓝图

使用蓝图提示

蓝图提示提供了使用自然语言的引导式界面,用于引导您创建蓝图。要使用提示创建蓝图,请执行以下操作:

  1. 在 BDA 控制台中导航到蓝图部分。

  2. 单击创建蓝图,然后选择使用蓝图提示

  3. 为蓝图选择数据类型(文档、图像、音频或视频)。

  4. 用自然语言描述要提取的字段和数据。例如:“从发票中提取发票号码、总金额和供应商名称。”

  5. 提示将根据您的描述生成蓝图。

  6. 检查生成的蓝图,根据需要进行调整。蓝图提示的交互是单回合的,这意味着您必须重新输入所有信息才能更改提示,而不仅仅是新信息。

  7. 保存并命名您的蓝图。

蓝图提示示例

下一个部分将介绍音频蓝图的蓝图提示示例。对于此使用案例,我们将创建一个蓝图,用于从客户与客户服务代表之间的对话中提取信息。以下屏幕截图显示了控制台上的提示窗口。

在屏幕截图的底部,您可以看到人工智能基于框中的输入信息生成的提示。我们可以看到系统如何处理所提到的字段。接下来,我们可以看看根据提示创建的蓝图。

此处我们可以查看希望从对话中处理的信息。如果您对字段感到满意,就可以立即开始处理音频文件。在您需要编辑蓝图时,应创建副本进行编辑,而不是直接编辑。您也可以调整提示来得到其他结果。

手动创建蓝图

更高级的用户或需要精细控制的用户可以手动创建蓝图:

  1. 在 BDA 控制台中导航到蓝图部分。

  2. 单击创建蓝图,然后选择手动创建

  3. 为蓝图选择数据类型(文档、图像、音频或视频)。

  4. 定义要提取的字段,指定数据类型、格式和任意验证规则。

  5. 配置其他设置,例如文档拆分或布局处理。

  6. 保存并命名您的蓝图。

您也可以使用蓝图 JSON 编辑器来创建或修改蓝图。这样您就可以直接通过文本编辑器调整蓝图的 JSON。

向项目添加蓝图

项目充当多模态内容处理工作流的容器,而蓝图则为这些工作流定义提取逻辑。您可以将蓝图添加到项目中,以便将蓝图应用于在该项目中处理的文件。

向项目添加蓝图:

  1. 在 BDA 控制台中导航到蓝图部分。

  2. 选择要将蓝图添加到的项目。

  3. 单击添加蓝图管理蓝图

  4. 从可用蓝图的列表中选择要添加的蓝图。

  5. 为蓝图配置任意特定于项目的设置。

  6. 保存对项目所做的更改。

定义字段

首先,您可以创建一个字段用于标识要提取或生成的信息,例如 product_type。对于每个字段,您需要提供描述、数据类型和推理类型。

要定义字段,您需要指定以下参数:

  • 描述:以自然语言说明该字段所代表的内容。此描述用于帮助了解字段的背景信息和用途,从而更准确地提取数据。

  • 类型:指定字段值的数据类型。BDA 支持以下类型:

    • 字符串:适用于基于文本的值

    • 数字:适用于数值

    • 布尔值:适用于 true 或 false 值

    • 数组:适用于可具有相同类型的多个值的字段(例如,字符串数组或数字数组)

  • 推理类型:指示 BDA 如何处理字段值的响应生成。对于图像,BDA 仅支持推断推理类型。这意味着 BDA 将根据图像中显示的信息推断字段值。

对于视频,字段还包含粒度作为选项。有关此特征的更多信息,请参阅“为视频创建蓝图”。

下图显示了 Amazon Bedrock 控制台中的 “添加字段” 模块,其中包含以下示例字段和值:

  • 字段名称:product_type

  • 类型:字符串

  • 说明:所宣传的主要产品或服务是什么,例如,是服装、电子产品还是食品和饮料等?

  • 提取类型:推断。

Amazon Bedrock 用户界面显示下拉菜单和用于指定图像字段的文本字段。

以下是对于 API,相同字段定义在 JSON 架构中样子的示例:

"product_type":{ "type": "string", "inferenceType": "inferred", "description": "What is the primary product or service being advertised, e.g., Clothing, Electronics, Food & Beverage, etc.?" }

在本示例中:

  • 类型设置为 string,指示 product_type 字段的值应基于文本。

  • inferenceType 设置为 inferred,指示 BDA 根据图像中显示的信息推断出该值。

  • 描述提供了更多背景信息,说明该字段应识别图像中的商品类型。product_type 字段的示例值包括:clothing、electronics 和 food or beverage。

通过为每个字段指定这些参数,您为 BDA 提供了必要的信息,来准确地从图像中提取和生成见解。

创建项目版本

处理项目时,您可以创建蓝图的版本。版本是蓝图的不可变快照,保留了蓝图的当前配置和提取逻辑。此蓝图版本可以在请求中传递来启动数据的处理,从而确保 BDA 在处理文档时,使用该版本创建时在蓝图中指定的逻辑。

您可以使用 CreateBlueprintVersion 操作创建版本。

Amazon Bedrock 控制台还可以让您创建和保存蓝图。保存蓝图时,系统会向该蓝图分配一个 ID。然后,您可以发布蓝图,这将创建该蓝图的无法编辑的快照版本。例如,如果与您的项目关联的蓝图为 “DocBlueprint”,则创建的项目版本将为 “DocBlueprint_1”。您将无法再对 “DocBlueprint_1” 进行任何更改,但您仍然可以编辑基础蓝图。如果您更改蓝图并再次发布,则会创建一个新版本,例如 “DocBlueprint_2”。蓝图版本可以复制并用作新蓝图的基础。