

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 화물 수요 예측을 위한 기계 학습 모델
<a name="machine-learning-models"></a>

다음 이미지는 훈련 데이터의 예를 보여줍니다. 대상은 예측하려는 대상이며, 관련 시계열 1 및 2는 대상 예측과 관련된 입력 기능입니다. 기록 데이터는 훈련 및 검증에 사용되며 모델 검증을 위해 기록 데이터의 기간을 보류합니다.



![기록 데이터, 홀드아웃 데이터 및 예측을 보여주는 선 차트](http://docs.aws.amazon.com/ko_kr/prescriptive-guidance/latest/forecast-demand-freight-capacity/images/time-series-training-data.png)


수요 예측에서 출력(또는 대상)은 예측하려는 수요 볼륨입니다. 입력 기능은 출력과 관련된 시계열 데이터입니다. 수요 볼륨을 정확하게 예측하도록 ML 모델을 훈련하려면 솔루션에 두 가지 기계 학습 모델이 필요합니다. 첫 번째 모델은 내부 및 외부 데이터를 포함하여 입력 기능에 대한 시계열 예측을 수행합니다. 두 번째 모델은 모든 기능을 사용하여 최종 수요를 예측합니다. 이 두 모델을 함께 사용하면 시계열 추세와 대상과 입력 간의 관계를 효과적으로 캡처할 수 있습니다.

## 입력 기능 예측을 위한 ML 모델
<a name="ml-model-input-feature"></a>

입력 기능에는 내부 및 외부 과거 시계열 데이터가 모두 포함됩니다. 각 기능에 대한 예측을 수행하려면 1차원(1D) 시계열 모델을 사용할 수 있습니다. 다양한 알고리즘을 사용할 수 있습니다. 예를 들어, [https://facebook.github.io/prophet/](https://facebook.github.io/prophet/)는 강력한 계절 효과와 여러 계절의 과거 데이터가 있는 시계열에 가장 적합합니다. 각 개별 기능에 대해 예측이 생성됩니다.

## 대상 변수 예측을 위한 ML 모델
<a name="ml-model-target-forecast"></a>

출력의 ML 모델 또는 수요 볼륨은 모든 기능과 출력 간의 관계를 캡처하도록 구축되었습니다. , lasso, 및와 같은 다양한 지도 회귀 모델을 사용할 수 ridge regression random forest있습니다XGBoost. 모델을 구축하고 최상의 파라미터와 하이퍼파라미터를 찾을 때 홀드아웃 데이터를 사용할 수 있습니다. *홀드아웃 데이터는* 레이블이 지정된 기록 데이터의 일부로, 기계 학습 모델을 훈련하는 데 사용되는 데이터 세트에서 보류됩니다. 홀드아웃 데이터를 사용하여 예측을 홀드아웃 데이터와 비교하여 모델 성능을 평가할 수 있습니다.