

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 執行具有模型平行的 SageMaker 分散式訓練任務
<a name="model-parallel-use-api"></a>

了解如何使用 SageMaker Python SDK 搭配 SageMaker 模型平行程式庫，針對您自己的訓練指令碼執行模型平行訓練任務。

執行 SageMaker 訓練任務有三種使用案例。

1. 您可以使用其中一個預先建置的 TensorFlow 和 PyTorch AWS 深度學習容器。如果您是首次使用模型平行程式庫，則建議您使用此選項。若要尋找有關如何執行 SageMaker AI 模型平行訓練任務的教學課程，請參閱[使用 Amazon SageMaker AI 模型平行化程式庫進行的 PyTorch 訓練](https://github.com/aws/amazon-sagemaker-examples/tree/main/training/distributed_training/pytorch/model_parallel)中的範例筆記本。

1. 您也可以擴充預先建置的容器，為您的演算法或預先建置 SageMaker Docker 映像不支援的模型處理任何額外的功能要求。若要尋找如何擴充預先建置容器的範例，請參閱[延伸預先建置的容器](prebuilt-containers-extend.md)。

1. 您可以使用 [SageMaker 訓練工具組](https://github.com/aws/sagemaker-training-toolkit)，調整您自己的 Docker 容器，以便與 SageMaker AI 搭配使用。有關範例，請參閱[調整您自己的訓練容器](https://docs.aws.amazon.com/sagemaker/latest/dg/adapt-training-container.html)。

如需上述清單中的選項 2 和 3 的說明，請參閱[擴充包含 SageMaker 分散式模型平行程式庫的預先建置 Docker 容器](model-parallel-sm-sdk.md#model-parallel-customize-container)，了解如何在擴充或自訂 Docker 容器中安裝模型平行程式庫。

在所有情況下，您都可以啟動訓練任務組態，設定 SageMaker `TensorFlow` 或 `PyTorch` 估算器以啟動程式庫。如需詳細資訊，請參閱下列主題。

**Topics**
+ [步驟 1：使用 SageMaker 的分散式模型平行程式庫修改訓練指令碼](model-parallel-customize-training-script.md)
+ [步驟 2：使用 SageMaker Python SDK 啟動訓練任務](model-parallel-sm-sdk.md)