本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 AWS PCS 中輪換叢集秘密
使用 AWS Secrets Manager 受管輪換在 AWS PCS 中輪換叢集秘密。定期秘密輪換是維護 HPC 環境中強式安全狀態的安全最佳實務。此功能可讓您符合產業合規標準,包括 HIPAA 和 FedRAMP,這需要定期輪換登入資料。
叢集秘密提供雙重用途:驗證加入叢集的運算節點,以及做為 Slurm REST API 身分驗證的 JWT 金鑰。輪換時,兩個層面都會同時受到影響。
叢集秘密輪換的運作方式
手動準備以在秘密輪換期間維持叢集穩定性:
-
準備 – 將所有運算節點群組擴展到 0 容量,並確保沒有任務正在執行
-
輪換 – 透過 Secrets Manager 主控台或 API 啟動輪換
-
監控 – 透過 CloudTrail 事件追蹤進度
-
復原 – 將運算節點群組擴展回所需的容量
在輪換期間,您的叢集會保持 ACTIVE 狀態,且計費會繼續正常。程序通常需要幾分鐘的時間。
要求與限制
在輪換叢集秘密之前,請先完成下列要求:
-
叢集必須處於
ACTIVE或UPDATE_FAILED狀態 -
IAM 角色必須具有
secretsmanager:RotateSecret許可 -
所有運算節點群組都必須擴展至 0 容量
-
在輪換之前停止所有任務
限制:
-
每次輪換所需的手動準備
-
現有的 JWT 字符無效,需要重新發行
-
BYO 登入節點在輪換後需要手動秘密更新