将 ML Insights 与 Amazon QuickSight 结合使用的数据集要求
要开始使用 Amazon QuickSight 的机器学习功能,您需要连接到或导入您的数据。您可以使用现有的 Amazon QuickSight 数据集或创建一个新的数据集。您可以直接查询与 SQL 兼容的源,或将数据摄取到 SPICE 中。
数据必须具有以下属性:
-
至少一个指标(例如,销售额、订单数、发货单位数、注册量等)。
-
至少一个类别维度(例如,产品类别、通道、分段、行业等)。将忽略具有 NULL 值的类别。
-
异常检测至少需要 15 个数据点才能进行训练。例如,如果您的数据粒度是每日,则需要至少 15 天的数据。如果粒度是每月,您至少需要 15 个月的数据。
-
数据越多,预测效果越好。确保您的数据集具有足够的历史数据,以实现最佳结果。例如,如果您的数据粒度是每日,则需要至少 38 天的数据。如果粒度是每月,您至少需要 43 个月的数据。下面是每种时间粒度的要求:
-
年:32 个数据点
-
季度:35 个数据点
-
月:43 个数据点
-
周:35 个数据点
-
日:38 个数据点
-
小时:39 个数据点
-
分钟:46 个数据点
-
秒:46 个数据点
-
-
如果您要分析异常或预测,则还需要至少一个日期维度。
如果您没有数据集来开始,可以下载此示例数据集:ML Insights 示例数据集 VI。在数据集就绪后,通过该数据集创建新分析。