本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 AWS PCS 中建立運算節點群組
本主題提供可用選項的概觀,並說明在 AWS 平行運算服務 (AWS PCS) 中建立運算節點群組時應考量的事項。如果這是您第一次在 AWS PCS 中建立運算節點群組,建議您遵循 中的教學課程平行 AWS 運算服務入門。本教學課程可協助您建立運作中的 HPC 系統,而無需擴展到所有可用的選項和系統架構。
注意
您可以在運算節點群組上設定自訂 Slurm 設定,以控制資源使用率和節點層級行為。如需詳細資訊,請參閱在 AWS PCS 中設定自訂 Slurm 設定。
重要
AWS PCS 目前需要支援 IPv4 的核心進行本機節點通訊,即使您在IPv6-only的網路中使用 AWS PCS 也是如此。如需詳細資訊,請參閱AWS PCS 的自訂 Amazon Machine Image AMIs)。
先決條件
-
有足夠的服務配額,可在您的 中啟動所需數量的 EC2 執行個體 AWS 區域。您可以使用 AWS Management Console
來檢查和請求提高您的服務配額。 -
符合 AWS PCS 聯網需求的現有 VPC 和子網路 (s)。我們建議您在部署叢集以供生產使用之前,先徹底了解這些需求。如需詳細資訊,請參閱AWS PCS VPC 和子網路需求和考量事項。您也可以使用 CloudFormation 範本來建立 VPC 和子網路。 為 CloudFormation 範本 AWS 提供 HPC 配方。如需詳細資訊,請參閱 GitHub 上的 aws-hpc-recipes
。 -
IAM 執行個體描述檔,具有呼叫 AWS PCS
RegisterComputeNodeGroupInstanceAPI 動作和存取節點群組執行個體所需任何其他 AWS 資源的許可。如需詳細資訊,請參閱平行運算服務的 IAM AWS 執行個體描述檔。 -
節點群組執行個體的啟動範本。如需詳細資訊,請參閱搭配 AWS PCS 使用 Amazon EC2 啟動範本。
-
若要建立使用 Amazon EC2 Spot 執行個體的運算節點群組,您必須在您的 中具有 AWSServiceRoleForEC2Spot 服務連結角色 AWS 帳戶。如需詳細資訊,請參閱AWS PCS 的 Amazon EC2 Spot 角色。
在 AWS PCS 中建立運算節點群組
您可以使用 AWS Management Console 或 建立運算節點群組 AWS CLI。