本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
使用 AWS PCS 運算節點群組提供登入節點
本主題提供建議的組態選項概觀,並說明當您使用 AWS PCS 運算節點群組來持續提供叢集的互動式存取時,應考量的事項。
建立登入節點的 AWS PCS 運算節點群組
在操作上,這與建立一般運算節點群組沒有太大不同。不過,有一些關鍵組態選擇:
-
設定運算節點群組中至少一個 EC2 執行個體的靜態擴展組態。
-
選擇隨需購買選項,以避免回收執行個體 (s)。
-
選擇運算節點群組的資訊名稱,例如登入。
-
如果您希望登入節點執行個體可在 VPC 外部存取,請考慮使用公有子網路。
-
如果您想要允許 SSH 存取,啟動範本將需要一個安全群組,該安全群組會將 SSH 連接埠公開到您選擇的 IP 地址。
-
IAM 執行個體描述檔應該只有您希望最終使用者擁有的 AWS 許可。如需詳細資訊,請參閱 平行運算服務的 IAM AWS 執行個體描述檔。
-
考慮允許 AWS Systems Manager Session Manager 管理您的登入執行個體。
-
考慮限制只有管理使用者才能存取執行個體 AWS 登入資料
-
選取較一般運算節點群組便宜的執行個體類型,因為登入節點會持續執行。
-
使用與其他運算節點群組相同的 (或衍生) AMI,以協助確保所有執行個體都安裝相同的軟體。如需自訂 AMIs的詳細資訊,請參閱 AWS PCS 的 Amazon Machine Image AMIs)
-
在登入節點上設定與運算執行個體相同的網路檔案系統 (Amazon EFS、Amazon FSx for Lustre 等) 掛載。如需詳細資訊,請參閱搭配 AWS PCS 使用網路檔案系統。
存取您的登入節點
一旦新的運算節點群組達到 ACTIVE 狀態,您就可以找到它已建立的 EC2 執行個體 (並登入)。如需詳細資訊,請參閱在 AWS PCS 中尋找運算節點群組執行個體。
更新登入節點的 AWS PCS 運算節點群組
您可以使用 UpdateComputeNodeGroup 更新登入節點群組。作為節點群組更新程序的一部分,執行中的執行個體將被取代。請注意,這會中斷執行個體上任何作用中的使用者工作階段或程序。執行中或佇列的 Slurm 任務不會受到影響。如需詳細資訊,請參閱更新 AWS PCS 運算節點群組。
您也可以編輯運算節點群組使用的啟動範本。您必須使用 UpdateComputeNodeGroup 將更新的啟動範本套用至運算節點群組。在運算節點群組中啟動的新 EC2 執行個體會使用更新的啟動範本。如需詳細資訊,請參閱搭配 AWS PCS 使用 Amazon EC2 啟動範本。
刪除登入節點的 AWS PCS 運算節點群組
您可以使用 AWS PCS 中的刪除運算節點群組機制來更新登入節點群組。執行中的執行個體將在節點群組刪除時終止。請注意,這會中斷執行個體上任何作用中的使用者工作階段或程序。執行中或佇列的 Slurm 任務不會受到影響。如需詳細資訊,請參閱在 AWS PCS 中刪除運算節點群組。