

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 用于预测货运需求的数据
<a name="data"></a>

对于任何机器学习模型进行有意义的预测和预测，高质量的数据都是必不可少的。对于需求预测，该数据集包含任何可能影响最终需求的相关数据。这些数据可能来自各种来源。您可以将这些数据分为两类，即内部数据和外部数据。

## 内部数据
<a name="internal-data"></a>

内部数据是业务生成的有机数据。这些数据通常存储在数据仓库中，例如 [Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/welcome.html)。

您可以直接从数据仓库中包含感兴趣产品的历史交易量的表中生成或提取目标输出值。对于航运公司，产出或目标值可以是海运的整箱装载量或航空货物的总重量单位。

您还可以生成各种历史业务指标。在预测需求时，这些可用作机器学习模型中的功能。示例功能包括历史价格、成本、容量和库存。

## 外部数据
<a name="external-data"></a>

外部数据源可用作附加功能，以提高预测的准确性。外部数据源的示例包括天气数据、宏观经济数据、行业数据和市场数据。这些因素可能对物流和运输行业产生直接或间接影响，从而影响需求。例如，市场运费为全球货运市场提供了基准，这最终会影响公司的特定需求。宏观经济数据，例如主要经济体的进出口数据，也可以用作衡量市场活动的指标。要整合这些外部数据源，您可以使用各种 API 来摄取数据。例如，St. Louis Fed提供了[https://fred.stlouisfed.org/docs/api/fred/](https://fred.stlouisfed.org/docs/api/fred/)访问宏观经济数据的权限，National Oceanic and Atmospheric Administration (NOAA)提供了[https://www.ncdc.noaa.gov/cdo-web/webservices/v2](https://www.ncdc.noaa.gov/cdo-web/webservices/v2)访问全球天气数据的权限。