View a markdown version of this page

数据实体 - Amazon Connect 的决定

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

数据实体

下表列出了需求计划使用的数据实体和列。

如何阅读该表:

  • 必填项-此数据实体中的列是执行需求预测而不会出现任何失败的必填项。

  • 有条件必需 — 此数据实体中的列是必填的,具体取决于在需求计划设置下设置的配置。

  • 推荐用于预测质量-此数据实体中的列是预测质量的必填列。

  • 可选 — 列名是可选的。为了增强特征输出,建议在该列名中添加值。

出站订单行(必填)

这个数据实体是如何使用的? 需求计划使用此数据作为预测历史需求的主要来源。此外,选为粒度的字段将被发送用于训练,并可用作筛选器来查看需求计划。

出站订单行列

该列是必填的吗?

在预测中如何使用此列?

id

必需

id、cust_order_id 和 product_id 用于唯一标识数据实体中的记录,并且此组合应始终是唯一的。确保列值中没有诸如星号和双引号之类的无效字符。

cust_order_id

必需

product_id

必需

order_date

必需

创建预测时为必填项。标识时间序列预测的时段。

final_quantity_requested

必需

创建预测时为必填项。标识用于时间序列预测的数量。此列不得包含空值,并且必须是数字。确保值中没有逗号。例如,在 “需求计划” 中,500000.00 是可接受的值。

ship_from_site_id

有条件地要求

如果为预测维度(站点层次结构)选择了该列,则创建预测时必须使用此列。此列必须有值,用于筛选和分析数据。

ship_to_site_id

有条件地要求

channel_id

有条件地要求

如果为预测维度(渠道层次结构)选择了该列,则创建预测时必须使用此列。此列必须有值,用于筛选和分析数据。

customer_tpartner_id

有条件地要求

如果为预测维度(客户层次结构)选择了该列,则创建预测时必须使用此列。此列必须有值,用于筛选和分析数据。

ship_to_site_address_city

有条件地要求

如果为预测维度(站点层次结构)选择了该列,则创建预测时必须使用此列。此列必须有值,用于筛选和分析数据。

ship_to_site_address_state

有条件地要求

ship_to_site_address_country

有条件地要求

status

推荐用于预测质量

对于预测质量,建议使用此列。处于已取消状态的订单不被视为预测输入。

产品(必填)

这个数据实体是如何使用的?

Demand Planning 使用产品属性为需求计划审查和模型训练建立层次结构筛选器。

产品专栏

该列是必填的吗?

在预测中如何使用此列?

id

必需

将数据摄入供应链数据湖 (SCDL) 所必需的。确保列值没有重复的 ID 和特殊字符,例如星号和双引号。

描述

必填

将数据摄入供应链数据湖 (SCDL) 所必需的。此列可以包含特殊字符,例如星号、连字符、引号和双引号。

parent_product_id

有条件地要求

如果为预测维度(产品层次结构)选择了该列,则创建预测时必须使用此列。确保该列具有值,并且用于筛选和分析数据以及模型训练。

product_group_id

有条件地要求

product_type

有条件地要求

brand_name

有条件地要求

color

有条件地要求

display_desc

有条件地要求

product_available_day

推荐用于预测质量

推荐。此列中的值允许预测模型考虑新产品的推出时间,从而提高预测质量。

discontinue_day

推荐用于预测质量

推荐。此列中的值允许预测模型考虑产品停用时间,从而提高预测质量。

base_uom

推荐用于预测质量

产品的计量单位。默认为“个”。

is_deleted

推荐用于预测质量

推荐。如果应将产品编码排除在预测范围之外,请输入 Y。

pkg_height

推荐用于预测质量

推荐。预测模型可以理解的产品的物理特性。

pkg_length

推荐用于预测质量

pkg_width

推荐用于预测质量

shipping_dimension

推荐用于预测质量

casepack_size

推荐用于预测质量

product_alternative(建议用于预测质量)

这个数据实体是如何使用的?

Demand Planning 使用前置产品或替代产品的数据来创建新产品的预测。当数据被摄取到 product_alternate 数据实体时,将启用对预测的产品谱系支持。您可以跳过将数据摄取到 product_alternate 数据实体,这仍然可以生成预测。

产品备用列

该列是必填的吗?

在预测中如何使用此列?

alternative_product_id

必需

将数据摄入供应链数据湖 (SCDL) 所必需的。唯一的记录标识符。

product_id

必需

将数据摄入供应链数据湖 (SCDL) 所必需的。新产品或产品新版本的 ID。确保在产品数据实体中填充了产品编号

product_alternate_id

必需

需要将数据摄入到 SCDL 中。相似产品或产品先前版本的标识符。要将多个相似产品视为单个 product_id,请在单独的行中输入这些产品。确保在产品数据实体中填充了产品备用编码

alternate_type

必需

应用产品替代品或血统所必需的。在所有行中使用静态值 s imilar_demand_prod uct。

alternate_product_qty

必需

应用产品替代品或血统所必需的。输入要用于预测产品编号的备用产品编号的历史比例。例如,如果为 60%,则输入 60。当单个 product_id 有多个 alternative_product_id 时,alternate_product_qty 加起来不必等于 100。

alternate_product_qty_uom

必需

应用产品替代品或血统所必需的。使用特定的静态值 “百分比”。

eff_start_date

必需

需要将数据摄入到 SCDL 中。输入开始时间范围以考虑类似产品的历史记录。确保此日期等于或早于 e ff_end_dat e,或者您可以将此字段留空,需求计划将自动填充该年度 1000。

eff_end_date

必需

需要将数据摄入到 SCDL 中。输入要在类似产品的历史记录中考虑的结束时间范围。确保此日期等于 e ff_start_d ate 或之后。

status

推荐用于预测质量

推荐。输入 “非活动” 以忽略产品取代或世系映射。

supplementary_time_series(建议用于预测质量)

这个数据实体是如何使用的? Demand Planning 使用此数据作为标记促销活动、折扣、假日等偶然因素的主要来源。

补充时间序列列

该列是必填的吗?

在预测中如何使用此列?

id

必需

将数据摄入供应链数据湖 (SCDL) 所必需的。唯一的记录标识符。

order_date

必需

将数据摄入供应链数据湖 (SCDL) 所必需的。记录时间序列的时间戳。

时间序列名称

必需

将数据摄入供应链数据湖 (SCDL) 所必需的。特定类型的时间序列的名称。time_series_name 列必须以字母开头,长度为 2 到 56 个字符,并且可以包含字母、数字和下划线。不允许使用其他特殊字符。

时间序列值

必需

需要将数据摄入到 SCDL 中。对应于特定时间序列的值。需求计划仅支持数字输入,不考虑带有类别值的时间序列。

product_id

可选

推荐。特定产品的唯一标识符。如果需求驱动因素在产品层面可用,则使用此列。

site_id

可选

推荐。特定地点或位置的唯一标识符。如果需求驱动因素在站点级别可用,则使用此列。根据最低级别的站点层次结构配置,此列可以表示 ship_from_site_id 或 shi p_to_site_ id。

channel_id

可选

推荐。特定频道的唯一标识符。如果需求驱动程序在渠道级别可用,则使用此列。

customer_tpartner_id

可选

推荐。特定客户的唯一标识符。如果需求驱动因素在客户层可用,则使用此列。

历史与未来补充时间序列:了解预测中的协变量

准确的需求预测不仅需要了解历史销售模式,还需要了解推动需求变化的外部因素。补充时间序列 (STS) 数据(也称为协变量)可以捕捉这些需求驱动因素,例如促销、定价、假日和库存水平,使预测模型能够将可解释的模式与随机噪音区分开来,并预测未来的业务行为将如何影响需求。但是,仅在历史上才知道的协变量(例如过去的库存水平或竞争对手的行为)与事先已知的协变量(例如计划促销或预定假日)之间存在关键区别,了解这种差异对于建立支持积极规划决策的准确预测至关重要。

需求预测的一个关键区别在于过去的协变量和已知的协变量(也称为未来协变量)。了解这种差异对于建立准确的预测模型至关重要。

过去的协变量(历史STS数据)

过去的协变量是补充的时间序列值,仅在历史时期才知道。这些变量是与您的历史需求一起观察的,但无法提前预测或知道未来的时期。

过去协变量的示例:

  • 历史库存可用性:您知道过去的库存水平,但未来的库存量取决于需求、补货和其他不确定因素

  • 竞争对手的实际定价:竞争对手的历史价格数据是可以观察到的,但未来竞争对手的行为尚不清楚

  • 天气状况:记录了过去的天气,但未来的天气(短期预测除外)尚不确定

  • 网站流量:历史流量模式已知,但未来的流量取决于许多不可预测的因素

在预测模型中使用:过去的协变量有助于模型学习历史关系和模式。例如,如果历史上高库存可用性与更高的销量相关(由于更好的产品知名度或配送速度),则模型就会学习这种关系。但是,由于这些值在未来时期是未知的,因此模型必须在没有这些值的情况下进行预测或对其未来值进行假设。

已知协变量(未来 STS 数据)

已知协变量是已知或可以提前确定未来时期的补充时间序列值。这些是预测的最有价值的输入,因为它们提供了有关未来状况的具体信息。

已知协变量的示例:

  • 计划的促销折扣:您的营销团队已经为将来的日期安排了具有特定折扣级别的促销活动

  • 价格指数变动:计划中的价格调整是根据您的定价策略提前确定的

  • 假日指标:基于日历的事件(节假日、购物季、财政期间)提前几年获知

  • 计划营销支出:预算分配和活动时间表是预先确定的

  • 门店 Opening/Closing 活动:提前知道扩张或整合计划

在预测模型中使用:已知的协变量可以显著提高预测的准确性,因为该模型可以包含实际的未来条件而不是假设。例如,如果您知道下个月计划进行 25% 的折扣促销,则模型可以根据历史折扣响应模式预测预期的需求增长。

实际实施策略

对于历史时段(训练数据):在补充时间序列数据中包括过去的协变量和已知的协变量。这使模型能够从所有可用的需求驱动因素中学习关系。您的数据集应包含到目前为止所有时间序列类型的实际观测值。

对于未来时段(预测展望期):仅在补充时间序列数据中包含已知协变量。这些是您可以放心地为将来的日期指定的需求驱动因素。例如:

id,order_date,time_series_name,time_series_value,product_id,site_id,channel_id,customer_tpartner_id 1001,2025-02-01,discount_percentage,20.0,PROD_001,SITE_NYC,CHANNEL_ONLINE,CUST_12345 1002,2025-02-14,discount_percentage,30.0,PROD_001,SITE_NYC,CHANNEL_ONLINE,CUST_12345 1003,2025-02-01,holiday_indicator,0,PROD_001,SITE_NYC,CHANNEL_ONLINE,CUST_12345 1004,2025-02-14,holiday_indicator,1,PROD_001,SITE_NYC,CHANNEL_ONLINE,CUST_12345

这个 future 数据告诉模特,计划在 2 月 1 日提供 20% 的折扣,计划在 2 月 14 日提供 30% 的情人节促销活动。

实际应用

  • 促销计划:跟踪一段时间内的折扣百分比,以了解促销强度如何影响需求。这有助于确定最佳折扣水平,并预测未来促销带来的需求增长。

  • 价格弹性分析:监控价格指数变动,量化价格变化如何影响不同产品、地点和渠道的客户购买行为。

  • 库存约束建模:捕获库存可用性水平,以确定何时缺货或低库存限制了销售,确保预测考虑了供应限制而不是真实的需求信号。

需求规划的好处

通过整合补充时间序列数据,您的需求计划系统可以:

  • 提高 Forecast 准确性:考虑已知的需求驱动因素,而不是将其视为无法解释的差异

  • 启用情景规划:通过调整需求驱动因素的 future 值来建模 “假设会怎样” 情景

  • 确定因果关系:了解哪些因素对不同产品和市场的需求影响最大

  • S@@ upport 战略决策:为定价、促销和库存策略提供数据驱动的见解