教學課程:使用 Amazon EKS 資源建立受管運算環境 - AWS Batch

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

教學課程:使用 Amazon EKS 資源建立受管運算環境

完成下列步驟,使用 Amazon Elastic Kubernetes Service (Amazon EKS) 資源建立受管運算環境。

  1. 在 https://https://console.aws.amazon.com/batch/ 開啟 AWS Batch 主控台。

  2. 從導覽列中,選取要 AWS 區域 使用的 。

  3. 在導覽窗格中,選擇 Compute environments (運算環境)。

  4. 選擇建立

  5. 針對運算環境組態,選擇 Amazon Elastic Kubernetes Service (Amazon EKS)

  6. 針對名稱,指定運算環境的唯一名稱。名稱長度最多可達 128 個字元。可以包含大小寫字母、數字、連字號 (-) 和底線 (_)。

  7. 針對執行個體角色,選擇已連接必要 IAM 許可的現有執行個體描述檔。

    注意

    若要在 AWS Batch 主控台中建立運算環境,請選擇具有 eks:ListClusterseks:DescribeCluster許可的執行個體描述檔。

  8. 針對 EKS 叢集,選擇現有的 Amazon EKS 叢集。

  9. 命名空間中,輸入Kubernetes命名空間以將叢集中的程序分組 AWS Batch 。

  10. (選用) 展開標籤。選擇新增標籤,然後輸入鍵/值對。

  11. 選擇下一頁

  12. (選用) 針對使用 EC2 Spot 執行個體,開啟啟用使用 Spot 執行個體來使用 Amazon EC2 Spot 執行個體。

  13. (僅限 Spot) 對於最大 % 隨需價格,請在執行個體啟動之前,選擇 Spot 執行個體價格與該執行個體類型的隨需價格相比的最大百分比。例如,如果您的最高價格為 20%,則 Spot 價格必須小於該 EC2 執行個體目前隨需價格的 20%。您一律會支付最低價 (市價) 且絕不超過您的最大百分比。如果您將此欄位空,預設值是隨需價格的 100%。

  14. (僅限 Spot) 針對 Spot 機群角色,選擇SPOT運算環境的 Amazon EC2 Spot 機群 IAM 角色。

    重要

    如果配置策略設定為 BEST_FIT 或未指定,則需要此角色。

  15. (選用) 對於最小 vCPUs,選擇運算環境維護的最小 vCPUs 數量,無論任務佇列需求為何。

  16. (選用) 針對最大 vCPUs,選擇運算環境可以向外擴展的 vCPUs 數量上限,無論任務佇列需求為何。

  17. 針對允許的執行個體類型,選擇可以啟動的 Amazon EC2 執行個體類型。您可以指定執行個體系列來啟動這些系列中的任何執行個體類型 (例如 c5c5np3)。或者,您可以指定系列中的特定大小 (例如 c5.8xlarge)。金屬執行個體類型不在執行個體系列中。例如, c5 不包含 c5.metal。您也可以選擇optimal執行個體類型 (從 M4、 C4和 R4執行個體系列),因為您需要符合您任務佇列的需求。

    注意

    在建立運算環境時,您為其選取的執行個體類型必須共用相同架構。例如,您無法在相同的運算環境中混合使用 x86 和 ARM 執行個體。

    注意

    AWS Batch 會根據任務佇列中所需的數量來擴展 GPUs。若要使用 GPU 排程,運算環境必須包含來自 p3p4p5p6、、g3g3s g4g5g6系列的執行個體類型。

    注意

    目前,optimal 使用 C4、M4 和 R4 執行個體系列中的執行個體類型。在 中 AWS 區域 ,沒有來自這些執行個體系列的執行個體類型,則會使用來自 C5、 M5和 執行個體系列的R5執行個體類型。

  18. (選用) 展開其他組態

    1. (選用) 對於置放群組,輸入置放群組名稱,以在運算環境中將資源分組。

    2. 針對配置策略,選擇 BEST_FIT_PROGRESSIVE

    3. (選用) 對於 Amazon Machine Image AMIs) 組態,選擇新增 amazon Machine Image (amis) 組態

      您可以使用 Amazon EKS 最佳化 Amazon Linux AMI 或自訂 AMI。

      1. 若要使用 Amazon EKS 最佳化的 Amazon Linux AMI

        1. 針對影像類型,選擇下列其中一項:

          • Amazon Linux 2:所有 AWS 以 Graviton 為基礎的執行個體系列 (例如 C6gR6gM6gT4g) 的預設值,可用於所有非 GPU 執行個體類型。

          • Amazon Linux 2 (加速):所有 GPU 執行個體系列 (例如 P4G4) 的預設 ,可用於所有非 AWS Graviton 型執行個體類型。

          • Amazon Linux 2023: AWS Batch 支援 Amazon Linux 2023 (AL2023)。

          • Amazon Linux 2023 (加速):GPU 執行個體系列,可用於所有非 AWS Graviton 型執行個體類型。

        2. 對於Kubernetes版本,請在Kubernetes版本編號中輸入 。

      2. 若要使用自訂 AMI:

        1. 針對映像類型,選擇自訂 AMI 依據的 AMI 類型:

          • Amazon Linux 2:所有 AWS 以 Graviton 為基礎的執行個體系列 (例如 C6gR6gM6gT4g) 的預設值,可用於所有非 GPU 執行個體類型。

          • Amazon Linux 2 (加速):所有 GPU 執行個體系列 (例如 P4G4) 的預設 ,可用於所有非 AWS Graviton 型執行個體類型。

          • Amazon Linux 2023: AWS Batch 支援 AL2023。

          • Amazon Linux 2023 (加速):GPU 執行個體系列,可用於所有非 AWS Graviton 型執行個體類型。

        2. 針對映像 ID 覆寫,輸入自訂 AMI ID。

        3. 對於Kubernetes版本,請輸入Kubernetes版本編號

    4. (選用) 針對啟動範本,選擇現有的啟動範本

    5. (選用) 對於啟動範本版本,輸入 $Default$Latest或版本號碼。

    6. (選用) 對於覆寫啟動範本,若要新增覆寫,請選擇新增覆寫啟動範本

      1. (選用) 針對啟動範本,選擇要新增覆寫的啟動範本。

      2. (選用) 針對啟動範本版本,選擇啟動範本的版本編號 $Default$Latest

      3. (選用) 針對目標執行個體類型,選擇應套用此覆寫的執行個體類型或系列。這只能以允許執行個體類型中包含的執行個體類型和系列為目標。

      4. (選用) 對於 userdataType,選擇 EKS 節點初始化。只有在啟動範本或啟動範本覆寫中指定了 AMI 時,才能使用此欄位。針對以 EKS_AL2023或 為基礎的自訂 AMIs 選擇 EKS_NODEADMEKS_AL2023_NVIDIA或針對 EKS_AL2和 選擇 EKS_BOOSTRAP_SHEKS_AL_NVIDIA。預設值為 EKS_BOOSTRAP_SH

        當您在相同運算環境中同時使用 AL2 和 AL2023-based自訂 AMIs 的混合環境時,您會使用 userdataType

  19. 選擇下一頁

  20. 對於虛擬私有雲端 (VPC) ID,請選擇要啟動執行個體的 VPC。

  21. 對於子網路,選擇要使用的子網路。根據預設,所選 VPC 內的所有子網路都可用。

    注意

    AWS Batch Amazon EKS 上的 支援 Local Zones。如需詳細資訊,請參閱《Amazon EKS 使用者指南》中的 Amazon EKS 和 AWS 本地區域

  22. (選用) 針對安全群組,選擇要連接至執行個體的安全群組。預設會選取 VPC 的預設安全群組。

  23. 選擇下一頁

  24. 針對檢閱,請檢閱組態步驟。如需變更,請選擇 Edit (編輯)。完成後,請選擇建立運算環境