本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
適用於深度學習執行個體的 Amazon ECS 任務定義
若要在 Amazon ECS 上使用深度學習工作負載,請將 Amazon EC2 DL1
考量事項
當您開始在 Amazon ECS 上部署 DL1 之前,請考量下列事項:
-
您的叢集可包含 DL1 和非 DL1 執行個體組合。
-
建立服務或執行獨立任務時,您可以在設定任務置放限制條件時使用執行個體類型屬性,以確定任務於指定的容器執行個體啟動。藉此可確保您的資源得到有效利用,並確保深度學習工作負載的任務位於 DL1 執行個體上。如需詳細資訊,請參閱Amazon ECS 如何在容器執行個體上放置任務。
以下範例在
default
叢集的dl1.24xlarge
執行個體上執行任務。aws ecs run-task \ --cluster default \ --task-definition ecs-dl1-task-def \ --placement-constraints type=memberOf,expression="attribute:ecs.instance-type == dl1.24xlarge"
使用 DL1 AMI
對於在 Amazon EC2 DL1 執行個體上執行 Amazon ECS 的 AMI,您有三個選項:
-
Habana 在此處提供的AWS Marketplace AMIshttps://aws.amazon.com/marketplace/pp/prodview-h24gzbgqu75zq
。 -
由 Amazon Web Services 提供的 Habana 深度學習 AMI。由於其不包含在內,您需要單獨安裝 Amazon ECS 容器代理程式。
-
使用 Packer 建置由 GitHub 儲存庫
提供的自訂 AMI。如需詳細資訊,請參閱 Packer documentation (《Packer 文件》)。