本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
创建蓝图
如何为自定义输出创建蓝图
Amazon Bedrock 数据自动化 (BDA) 允许您为 BDA 可以提取的任何文件类型创建自定义蓝图。您可以使用蓝图为输入文件定义所需的输出格式和提取逻辑。通过创建自定义蓝图,您可以定制 BDA 输出来满足特定要求。
在一个项目中,您可以应用:
-
最多 40 个文档蓝图。这使得您可以在同一个项目中处理不同类型的文档,并让每个文档都有自己的自定义提取逻辑。
-
一个图像蓝图。这样可以确保项目中图像处理的一致性。
-
一个音频蓝图。
-
一个视频蓝图。
创建蓝图
在 BDA 中可以通过两种方法创建蓝图:
-
使用蓝图提示
-
手动创建蓝图
使用蓝图提示
蓝图提示提供了使用自然语言的引导式界面,用于引导您创建蓝图。要使用提示创建蓝图,请执行以下操作:
-
在 BDA 控制台中导航到蓝图部分。
-
单击创建蓝图,然后选择使用蓝图提示。
-
为蓝图选择数据类型(文档、图像、音频或视频)。
-
用自然语言描述要提取的字段和数据。例如:“从发票中提取发票号码、总金额和供应商名称。”
-
提示将根据您的描述生成蓝图。
-
检查生成的蓝图,根据需要进行调整。蓝图提示的交互是单回合的,这意味着您必须重新输入所有信息才能更改提示,而不仅仅是新信息。
-
保存并命名您的蓝图。
蓝图提示示例
下一个部分将介绍音频蓝图的蓝图提示示例。对于此使用案例,我们将创建一个蓝图,用于从客户与客户服务代表之间的对话中提取信息。以下屏幕截图显示了控制台上的提示窗口。
在屏幕截图的底部,您可以看到人工智能基于框中的输入信息生成的提示。我们可以看到系统如何处理所提到的字段。接下来,我们可以看看根据提示创建的蓝图。
此处我们可以查看希望从对话中处理的信息。如果您对字段感到满意,就可以立即开始处理音频文件。在您需要编辑蓝图时,应创建副本进行编辑,而不是直接编辑。您也可以调整提示来得到其他结果。
手动创建蓝图
更高级的用户或需要精细控制的用户可以手动创建蓝图:
-
在 BDA 控制台中导航到蓝图部分。
-
单击创建蓝图,然后选择手动创建。
-
为蓝图选择数据类型(文档、图像、音频或视频)。
-
定义要提取的字段,指定数据类型、格式和任意验证规则。
-
配置其他设置,例如文档拆分或布局处理。
-
保存并命名您的蓝图。
您也可以使用蓝图 JSON 编辑器来创建或修改蓝图。这样您就可以直接通过文本编辑器调整蓝图的 JSON。
向项目添加蓝图
项目充当多模态内容处理工作流的容器,而蓝图则为这些工作流定义提取逻辑。您可以将蓝图添加到项目中,以便将蓝图应用于在该项目中处理的文件。
向项目添加蓝图:
-
在 BDA 控制台中导航到蓝图部分。
-
选择要将蓝图添加到的项目。
-
单击添加蓝图或管理蓝图。
-
从可用蓝图的列表中选择要添加的蓝图。
-
为蓝图配置任意特定于项目的设置。
-
保存对项目所做的更改。
定义字段
首先,您可以创建一个字段用于标识要提取或生成的信息,例如 product_type。对于每个字段,您需要提供描述、数据类型和推理类型。
要定义字段,您需要指定以下参数:
-
描述:以自然语言说明该字段所代表的内容。此描述用于帮助了解字段的背景信息和用途,从而更准确地提取数据。
-
类型:指定字段值的数据类型。BDA 支持以下类型:
字符串:适用于基于文本的值
数字:适用于数值
布尔值:适用于 true 或 false 值
数组:适用于可具有相同类型的多个值的字段(例如,字符串数组或数字数组)
-
推理类型:指示 BDA 如何处理字段值的响应生成。对于图像,BDA 仅支持推断推理类型。这意味着 BDA 将根据图像中显示的信息推断字段值。
对于视频,字段还包含粒度作为选项。有关此特征的更多信息,请参阅“为视频创建蓝图”。
下图显示了 Amazon Bedrock 控制台中的 “添加字段” 模块,其中包含以下示例字段和值:
-
字段名称:product_type
-
类型:字符串
-
说明:所宣传的主要产品或服务是什么,例如,是服装、电子产品还是食品和饮料等?
-
提取类型:推断。
以下是对于 API,相同字段定义在 JSON 架构中样子的示例:
"product_type":{ "type": "string", "inferenceType": "inferred", "description": "What is the primary product or service being advertised, e.g., Clothing, Electronics, Food & Beverage, etc.?" }
在本示例中:
类型设置为 string,指示 product_type 字段的值应基于文本。
inferenceType 设置为 inferred,指示 BDA 根据图像中显示的信息推断出该值。
描述提供了更多背景信息,说明该字段应识别图像中的商品类型。product_type 字段的示例值包括:clothing、electronics 和 food or beverage。
通过为每个字段指定这些参数,您为 BDA 提供了必要的信息,来准确地从图像中提取和生成见解。
创建项目版本
处理项目时,您可以创建蓝图的版本。版本是蓝图的不可变快照,保留了蓝图的当前配置和提取逻辑。此蓝图版本可以在请求中传递来启动数据的处理,从而确保 BDA 在处理文档时,使用该版本创建时在蓝图中指定的逻辑。
您可以使用 CreateBlueprintVersion 操作创建版本。
Amazon Bedrock 控制台还可以让您创建和保存蓝图。保存蓝图时,系统会向该蓝图分配一个 ID。然后,您可以发布蓝图,这将创建该蓝图的无法编辑的快照版本。例如,如果与您的项目关联的蓝图为 “DocBlueprint”,则创建的项目版本将为 “DocBlueprint_1”。您将无法再对 “DocBlueprint_1” 进行任何更改,但您仍然可以编辑基础蓝图。如果您更改蓝图并再次发布,则会创建一个新版本,例如 “DocBlueprint_2”。蓝图版本可以复制并用作新蓝图的基础。