本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
数据载入
1. 术语表
-
数据代理 — 帮助自动执行数据集成任务的 AI-powered 助手
-
源流 — 将数据从源系统导入的流程
-
数据集-源数据的结构化表示形式
-
S3 存储桶 — 包含您的源数据文件的 Amazon S3 存储位置
-
目标(转换)流程 — 将源数据格式转换为 AWS 规范数据模型 (CDM) 格式的过程
-
CDM — 规范数据模型,使用的标准化数据结构
-
数据映射-将源数据中的字段与 CDM 结构进行匹配的过程
2. 用途
本指南提供了有关如何将供应链数据导入使用数据代理的分步说明,该 AI-powered 助手可帮助自动执行数据载入任务和解决问题。
3. 数据载入有什么用?
数据载入是将您现有的供应链数据整合到中的过程。为了将您的数据用于规划和预测,它必须采用规范数据模型 (CDM) 的标准化数据结构中的结构化格式。Data onboarding 通过将您的字段映射到 CDM实体、转换数据类型和格式以及验证数据质量,将您的源数据转换为这种格式。这样可以确保根据您的源数据生成准确的预测和建议。
过程
数据载入分为五个阶段:
-
准备:从您的系统中收集源数据(请参阅先决条件)
-
上传:将您的供应链数据上传为 CSV 文件
-
映射:将源数据集与清洁发展机制目标数据集以及源字段与清洁发展机制实体进行匹配(例如,将您的 “商品编号” 字段映射到清洁发展机制的 “product_id”)
-
验证:运行质量检查并解决所有数据问题
在整个过程中,的 Data Agent 充当您的 AI-powered助手数据载入助手。它将保留在屏幕的左侧,您可以使用自然语言与之交互,以帮助自动执行数据加载任务,包括:
-
发现架构:自动扫描您上传的数据以识别结构和关系
-
生成源到目标映射:分析您的源数据并建议哪些 CDM目标表与您的数据最匹配
-
创建 SQL 转换查询:自动生成 SQL 以将源字段映射到 CDM目标字段
-
提供映射原理:解释为什么根据重叠数据建议特定的映射
-
问题疑难解答:确定映射或数据加载失败的原因,并推荐具体的修复方法
-
回答问题:解释概念,澄清映射,并在整个过程中提供指导