本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
搭配 Amazon ECS 受管執行個體使用 GPU
Amazon ECS 受管執行個體透過下列 Amazon EC2 執行個體類型,支援適用於機器學習、高效能運算與影片處理等工作負載的 GPU 加速運算。如需有關 Amazon ECS 受管執行個體支援之執行個體類型的詳細資訊,請參閱 Amazon ECS 受管執行個體的執行個體類型。
以下是 Amazon ECS 受管執行個體上支援的 GPU 型執行個體類型的子集:
-
g4dn:採用 NVIDIA T4 GPUs 技術,適用於機器學習推論、電腦視覺與圖形密集型應用程式。 -
g5:採用 NVIDIA A10G GPUs 技術,為圖形密集型應用程式與機器學習工作負載提供更高的效能。 -
p3:採用 NVIDIA V100 GPUs 技術,專為高效能運算與深度學習訓練而設計。 -
p4d:採用 NVIDIA A100 GPUs 技術,為機器學習訓練與高效能運算提供最高效能。
在搭配 Amazon ECS 受管執行個體使用已啟用 GPU 的執行個體類型時,執行個體上會預先安裝 NVIDIA 驅動程式與 CUDA 工具組,讓執行 GPU 加速工作負載更加輕鬆。
啟用 GPU 的執行個體選擇
若要為 Amazon ECS 受管執行個體工作負載選取已啟用 GPU 的執行個體類型,請在容量提供者的啟動範本中使用 instanceRequirements 物件。下列程式碼片段展示了可用於選取已啟用 GPU 的執行個體的屬性。
{ "instanceRequirements": { "acceleratorTypes": "gpu", "acceleratorCount": 1, "acceleratorManufacturers": ["nvidia"] } }
下列程式碼片段展示了可用於在啟動範本中指定已啟用 GPU 的執行個體類型的屬性。
{ "instanceRequirements": { "allowedInstanceTypes": ["g4dn.xlarge", "p4de.24xlarge"] } }
啟用 GPU 的容器映像
若要在容器中使用 GPU,則需使用包含必要 GPU 程式庫與工具的容器映像。NVIDIA 提供數個預先建置的容器映像 (可作為 GPU 工作負載的基礎映像),包括下列項目:
-
nvidia:cuda:具有 CUDA 工具組的基礎映像,用於 GPU 運算。 -
tensorflow/tensorflow:latest-gpu:支援 GPU 的 TensorFlow。 -
pytorch/pytorch:latest-cuda:支援 GPU 的 PyTorch。
如需有關 Amazon ECS 受管執行個體上涉及使用 GPU 的 Amazon ECS 任務定義範例,請參閱在 Amazon ECS 任務定義中指定 GPU。