本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
连接您的数据
先决条件
在开始数据加载之前,请确保您已经:
-
Amazon Connect 决策实例
-
您的实例应该已经使用关联的 S3 存储桶创建
-
-
数据准备就绪
-
与您的客户成功部门合作,根据您计划如何使用 Amazon Connections 决策来确定您需要哪些数据。基本数据要求包括:
-
Sales/Order 历史记录:12 个月以上的交易记录
-
产品详情:包含规格的完整产品目录
-
Site/Location 信息:仓库、配送中心、零售地点
-
当前库存量:每个地点的 On-hand 库存
-
-
所有源数据均采用 CSV 格式并带有 UTF-8 编码
-
创建您的第一个源代码流
要开始载入数据,请导航至 Amazon Connections 中的 “数据管理” 选项卡。在这里,您可以看到所有现有的源流。如果您尚未设置,请选择 “创建新源” 开始。
上传您的源数据
根据您的用例所需的 CDM 表,上传包含源数据的 CSV 文件。您可以选择处理数据更新的方式:
-
附加:向现有数据添加新数据
-
替换:用新数据替换现有数据
当您上传文件时,Amazon Connect Decisions 会自动在 S3 中为该数据创建文件夹结构,包括:
-
以所选源系统命名的父文件夹
-
以所选源表名命名的子文件夹
-
子文件夹下的所有文件都保存在同一个源表中
-
此文件结构还用于创建 Amazon S3 文件夹路径
Source-to-CDM 目标映射
文件上传后,Amazon Connections 将开始分析您的数据,并将其自动映射到一个或多个 Amazon Connections 的 CDM 目标表。
会发生什么
-
此步骤可能需要 10-15 分钟,具体取决于上传的数据量
-
数据代理在后台工作,为您的源数据识别最佳 CDM 目标数据集。
-
离开此页面将导致自动映射失败。在等待期间,请保持 Amazon Connect 决策和数据管理选项卡处于打开状态,以确保自动映射完成。
完成后,数据代理会根据重叠的数据提供源到目标映射的基本原理,您可以查看这些基本原理,并就任何映射结果向代理提问。
要查看和编辑源映射,您可以:
-
使用自然语言直接与数据代理交互以更新源-目标映射。
-
选择 “操作” 选项,然后选择 “编辑来源”。
编辑映射
从这里,你可以:
-
如果需要,可以手动更新源映射和目标映射
-
使用屏幕右侧的数据代理提问以确认映射
-
参考用户指南以了解有关特定数据集的更多信息
Column/Data 映射
源到目标映射完成后,Amazon Connect Decisions 将自动创建从您的源数据集到 CDM 目标的 SQL 转换查询。完成任何映射后,您将收到来自数据代理的通知,详细说明映射的结果:
在这里,您应该通过从 “操作” 菜单中选择 “查看 SQL” 来查看为映射生成的 SQL。
查看映射 (SQL),您将看到:
-
您已添加的源数据集列
-
目标 CDM表列供参考
-
连接它们的转换 SQL
-
数据代理提供的映射理由
编辑映射
您可以通过两个选项来编辑任何映射:
-
使用 Data Agent:使用自然语言提问、管理和更新映射
-
直接编辑 SQL:如果您熟悉 SQL,则可以直接修改查询
测试您的更改
编辑映射查询时,请继续使用 “测试查询” 功能对其进行测试,这将为您提供可滚动的预览,了解如何将您的数据转换为目标 CDM 的示例。使用它来确保您的转换正常运行,并验证从源到目标 CDM 的所有适当更新。
对映射输出感到满意后,选择 “保存查询” 以保存该源-目标对的转换查询。
查看并接受映射
查看每个源数据集的其余映射。对于问题或疑难解答帮助,Data Agent 会一直显示在屏幕的右侧。
对所有映射都感到满意后,请接受它们以完成数据载入。
处理失败的映射
如果有任何映射失败,则可以选择 “重新启动映射” 以重新启动所有映射,或者通过 “重试 SQL 生成” 从 “操作” 菜单中手动重试单个映射。数据代理还可以使用自然语言重试映射,如果错误持续存在,它将继续帮助您识别和解决问题。
监控您的流程
“目标” 选项卡
接受映射后,您将被导航到数据管理中的目标选项卡,您可以:
-
查看目标流程
-
管理和编辑映射(“管理流程”)
-
删除过时的流程
-
查看这些流程的执行状态
选择 “管理流程” 将带您回到数据映射体验,在此体验中,您可以继续使用数据代理来随着时间的推移完善映射。
“来源” 选项卡
返回到 “来源” 选项卡,您可以找到:
-
已创建的源数据集
-
与其关联的 S3 存储桶
-
以下选项:
-
通过另一个文件上传来追加更多源数据
-
管理流程
-
删除流程
-
查看执行情况
-
选择 “管理流程” 将带您回到数据映射体验,在此体验中,您可以继续使用数据代理来随着时间的推移完善映射。
您还可以根据需要访问 “创建新源”,以重新启动任何新数据源的数据加载流程。
最佳实践
数据准备
-
按照 “先决条件” 部分中的步骤操作
-
对所有 CSV 文件使用 UTF-8 编码
-
确保文件名是唯一的
-
上传前验证数据质量
使用数据代理
-
请具体说明您的要求
-
当你不明白它的任何决定时,可以要求解释
-
在接受之前测试所有 SQL 更改
-
使用预览功能验证变换
持续维护
-
保持源数据更新
-
定期监控流程执行情况
-
收到通知后立即解决数据错误
-
为您的团队记录自定义转换