View a markdown version of this page

화물 수요 예측을 위한 기계 학습 모델 - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

화물 수요 예측을 위한 기계 학습 모델

다음 이미지는 훈련 데이터의 예를 보여줍니다. 대상은 예측하려는 대상이며, 관련 시계열 1 및 2는 대상 예측과 관련된 입력 기능입니다. 기록 데이터는 훈련 및 검증에 사용되며 모델 검증을 위해 기록 데이터의 기간을 보류합니다.

기록 데이터, 홀드아웃 데이터 및 예측을 보여주는 선 차트

수요 예측에서 출력(또는 대상)은 예측하려는 수요 볼륨입니다. 입력 기능은 출력과 관련된 시계열 데이터입니다. 수요 볼륨을 정확하게 예측하도록 ML 모델을 훈련하려면 솔루션에 두 가지 기계 학습 모델이 필요합니다. 첫 번째 모델은 내부 및 외부 데이터를 포함하여 입력 기능에 대한 시계열 예측을 수행합니다. 두 번째 모델은 모든 기능을 사용하여 최종 수요를 예측합니다. 이 두 모델을 함께 사용하면 시계열 추세와 대상과 입력 간의 관계를 효과적으로 캡처할 수 있습니다.

입력 기능 예측을 위한 ML 모델

입력 기능에는 내부 및 외부 과거 시계열 데이터가 모두 포함됩니다. 각 기능에 대한 예측을 수행하려면 1차원(1D) 시계열 모델을 사용할 수 있습니다. 다양한 알고리즘을 사용할 수 있습니다. 예를 들어, Prophet는 강력한 계절 효과와 여러 계절의 과거 데이터가 있는 시계열에 가장 적합합니다. 각 개별 기능에 대해 예측이 생성됩니다.

대상 변수 예측을 위한 ML 모델

출력의 ML 모델 또는 수요 볼륨은 모든 기능과 출력 간의 관계를 캡처하도록 구축되었습니다. , lasso, 및와 같은 다양한 지도 회귀 모델을 사용할 수 ridge regression random forest있습니다XGBoost. 모델을 구축하고 최상의 파라미터와 하이퍼파라미터를 찾을 때 홀드아웃 데이터를 사용할 수 있습니다. 홀드아웃 데이터는 레이블이 지정된 기록 데이터의 일부로, 기계 학습 모델을 훈련하는 데 사용되는 데이터 세트에서 보류됩니다. 홀드아웃 데이터를 사용하여 예측을 홀드아웃 데이터와 비교하여 모델 성능을 평가할 수 있습니다.