

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# 異種クラスターでのトレーニングジョブの実行
<a name="train-heterogeneous-cluster"></a>

SageMaker トレーニングの異種クラスター機能を使用すると、複数のタイプの ML インスタンスでトレーニングジョブを実行し、さまざまな ML トレーニングタスクや目的に合わせてリソースのスケーリングと使用率を高めることができます。例えば、GPU インスタンスを使用したクラスター上のトレーニングジョブで、GPU 使用率が低く、CPU 負荷の高いタスクにより CPU がボトルネックになる問題が発生した場合、異種クラスターを使用することで、コスト効率の高い CPU インスタンスグループを追加し CPU 負荷の高いタスクをオフロードし、このようなボトルネックの問題を解決して、GPU の使用率を高めることができます。

**注記**  
この機能は SageMaker Python SDK v2.98.0 以降で利用できます。

**注記**  
この機能は、SageMaker AI [PyTorch](https://sagemaker.readthedocs.io/en/stable/frameworks/pytorch/sagemaker.pytorch.html) および [TensorFlow](https://sagemaker.readthedocs.io/en/stable/frameworks/tensorflow/sagemaker.tensorflow.html#tensorflow-estimator) フレームワーク推定器クラスを通じて利用できます。サポートされているフレームワークは PyTorch v1.10 以降と TensorFlow v2.6 以降です。

ブログ「[Improve price performance of your model training using Amazon SageMaker AI heterogeneous clusters](https://aws.amazon.com/blogs/machine-learning/improve-price-performance-of-your-model-training-using-amazon-sagemaker-heterogeneous-clusters/)」も参照してください。

**Topics**
+ [Amazon SageMaker AI で異種クラスターを使用したトレーニングジョブを設定する](train-heterogeneous-cluster-configure.md)
+ [Amazon SageMaker AI の異種クラスターで分散トレーニングを実行する](train-heterogeneous-cluster-configure-distributed.md)
+ [トレーニングスクリプトを変更してインスタンスグループを割り当てる](train-heterogeneous-cluster-modify-training-script.md)