View a markdown version of this page

连接您的数据 - Amazon Connect 的决定

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

连接您的数据

先决条件

在开始数据加载之前,请确保您已经:

  • Amazon Connect 决策实例

    • 您的实例应该已经使用关联的 S3 存储桶创建

  • 数据准备就绪

    • 与您的客户成功部门合作,根据您计划如何使用 Amazon Connections 决策来确定您需要哪些数据。基本数据要求包括:

      • Sales/Order 历史记录:12 个月以上的交易记录

      • 产品详情:包含规格的完整产品目录

      • Site/Location 信息:仓库、配送中心、零售地点

      • 当前库存量:每个地点的 On-hand 库存

    • 所有源数据均采用 CSV 格式并带有 UTF-8 编码

创建您的第一个源代码流

要开始载入数据,请导航至 Amazon Connections 中的 “数据管理” 选项卡。在这里,您可以看到所有现有的源流。如果您尚未设置,请选择 “创建新源” 开始。

上传您的源数据

根据您的用例所需的 CDM 表,上传包含源数据的 CSV 文件。您可以选择处理数据更新的方式:

  • 附加:向现有数据添加新数据

  • 替换:用新数据替换现有数据

当您上传文件时,Amazon Connect Decisions 会自动在 S3 中为该数据创建文件夹结构,包括:

  • 以所选源系统命名的父文件夹

  • 以所选源表名命名的子文件夹

  • 子文件夹下的所有文件都保存在同一个源表中

  • 此文件结构还用于创建 Amazon S3 文件夹路径

Source-to-CDM 目标映射

文件上传后,Amazon Connections 将开始分析您的数据,并将其自动映射到一个或多个 Amazon Connections 的 CDM 目标表。

会发生什么

  • 此步骤可能需要 10-15 分钟,具体取决于上传的数据量

  • 数据代理在后台工作,为您的源数据识别最佳 CDM 目标数据集。

  • 离开此页面将导致自动映射失败。在等待期间,请保持 Amazon Connect 决策和数据管理选项卡处于打开状态,以确保自动映射完成。

完成后,数据代理会根据重叠的数据提供源到目标映射的基本原理,您可以查看这些基本原理,并就任何映射结果向代理提问。

要查看和编辑源映射,您可以:

  • 使用自然语言直接与数据代理交互以更新源-目标映射。

  • 选择 “操作” 选项,然后选择 “编辑来源”

编辑映射

从这里,你可以:

  • 如果需要,可以手动更新源映射和目标映射

  • 使用屏幕右侧的数据代理提问以确认映射

  • 参考用户指南以了解有关特定数据集的更多信息

Column/Data 映射

源到目标映射完成后,Amazon Connect Decisions 将自动创建从您的源数据集到 CDM 目标的 SQL 转换查询。完成任何映射后,您将收到来自数据代理的通知,详细说明映射的结果:

在这里,您应该通过从 “操作” 菜单中选择 “查看 SQL” 来查看为映射生成的 SQL

查看映射 (SQL),您将看到:

  • 您已添加的源数据集列

  • 目标 CDM表列供参考

  • 连接它们的转换 SQL

  • 数据代理提供的映射理由

编辑映射

您可以通过两个选项来编辑任何映射:

  • 使用 Data Agent:使用自然语言提问、管理和更新映射

  • 直接编辑 SQL:如果您熟悉 SQL,则可以直接修改查询

测试您的更改

编辑映射查询时,请继续使用 “测试查询” 功能对其进行测试,这将为您提供可滚动的预览,了解如何将您的数据转换为目标 CDM 的示例。使用它来确保您的转换正常运行,并验证从源到目标 CDM 的所有适当更新。

对映射输出感到满意后,选择 “保存查询” 以保存该源-目标对的转换查询。

查看并接受映射

查看每个源数据集的其余映射。对于问题或疑难解答帮助,Data Agent 会一直显示在屏幕的右侧。

对所有映射都感到满意后,请接受它们以完成数据载入。

处理失败的映射

如果有任何映射失败,则可以选择 “重新启动映射” 以重新启动所有映射,或者通过 “重试 SQL 生成” 从 “操作” 菜单中手动重试单个映射。数据代理还可以使用自然语言重试映射,如果错误持续存在,它将继续帮助您识别和解决问题。

监控您的流程

“目标” 选项卡

接受映射后,您将被导航到数据管理中的目标选项卡,您可以:

  • 查看目标流程

  • 管理和编辑映射(“管理流程”)

  • 删除过时的流程

  • 查看这些流程的执行状态

选择 “管理流程” 将带您回到数据映射体验,在此体验中,您可以继续使用数据代理来随着时间的推移完善映射。

“来源” 选项卡

返回到 “来源” 选项卡,您可以找到:

  • 已创建的源数据集

  • 与其关联的 S3 存储桶

  • 以下选项:

    • 通过另一个文件上传来追加更多源数据

    • 管理流程

    • 删除流程

    • 查看执行情况

选择 “管理流程” 将带您回到数据映射体验,在此体验中,您可以继续使用数据代理来随着时间的推移完善映射。

您还可以根据需要访问 “创建新源”,以重新启动任何新数据源的数据加载流程。

最佳实践

数据准备

  • 按照 “先决条件” 部分中的步骤操作

  • 对所有 CSV 文件使用 UTF-8 编码

  • 确保文件名是唯一的

  • 上传前验证数据质量

使用数据代理

  • 请具体说明您的要求

  • 当你不明白它的任何决定时,可以要求解释

  • 在接受之前测试所有 SQL 更改

  • 使用预览功能验证变换

持续维护

  • 保持源数据更新

  • 定期监控流程执行情况

  • 收到通知后立即解决数据错误

  • 为您的团队记录自定义转换