

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 이기종 클러스터에서 훈련 작업 실행
<a name="train-heterogeneous-cluster"></a>

SageMaker Training의 이기종 클러스터 기능을 사용하면 여러 유형의 ML 인스턴스로 훈련 작업을 실행하여 다양한 ML 훈련 작업 및 목적에 맞게 리소스 규모 조정 및 활용도를 높일 수 있습니다. 예를 들어 GPU 인스턴스가 있는 클러스터에서 훈련 작업을 수행할 때 CPU 사용률이 낮고 CPU 병목 문제가 발생하는 경우, 이기종 클러스터를 사용하면 비용 효율적인 CPU 인스턴스 그룹을 추가하여 CPU 사용량이 많은 작업의 부담을 줄이고 이러한 병목 문제를 해결하고 GPU 활용도를 높일 수 있습니다.

**참고**  
이 기능은 SageMaker Python SDK v2.98.0 이상에서 사용할 수 있습니다.

**참고**  
이 기능은 SageMaker AI [PyTorch](https://sagemaker.readthedocs.io/en/stable/frameworks/pytorch/sagemaker.pytorch.html)와 [TensorFlow](https://sagemaker.readthedocs.io/en/stable/frameworks/tensorflow/sagemaker.tensorflow.html#tensorflow-estimator) 프레임워크 예측기 클래스를 통해 사용할 수 있습니다. 지원되는 프레임워크는 파이토치 v1.10 이상 및 텐서플로 v2.6 이상입니다.

[Amazon SageMaker AI 이기종 클러스터를 사용하여 모델 훈련의 가격 대비 성능 개선](https://aws.amazon.com/blogs/machine-learning/improve-price-performance-of-your-model-training-using-amazon-sagemaker-heterogeneous-clusters/) 블로그도 참조하세요.

**Topics**
+ [Amazon SageMaker AI에서 이기종 클러스터를 사용하여 훈련 작업 구성](train-heterogeneous-cluster-configure.md)
+ [Amazon SageMaker AI의 이기종 클러스터에서 분산 훈련 실행](train-heterogeneous-cluster-configure-distributed.md)
+ [훈련 스크립트를 수정하여 인스턴스 그룹을 할당하세요.](train-heterogeneous-cluster-modify-training-script.md)