本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
在 AWS PCS 中輪換叢集秘密
輪換您的叢集秘密以符合安全要求,並解決潛在的入侵。此程序需要讓您的叢集進入維護模式。
先決條件
-
具有
secretsmanager:RotateSecret許可的 IAM 角色 -
叢集處於
ACTIVE或UPDATE_FAILED狀態
程序
-
通知叢集使用者即將到來的維護時段。
-
透過將所有運算節點群組擴展到 0 容量,將叢集置於維護模式。
-
使用 UpdateComputeNodeGroup API,將所有運算節點群組的 minInstanceCount 和 maxInstanceCount 設定為 0。
-
等到所有節點停止。
-
選用:在您終止容量以進行正常任務處理之前,使用 Slurm 命令耗盡排程器佇列。
-
-
透過 Secrets Manager 啟動輪換。
-
主控台方法:
-
導覽至 Secrets Manager,選取叢集秘密,然後選擇輪換秘密。
-
-
API 方法:
-
使用 Secrets Manager
rotate-secretAPI。
-
-
-
監控輪換進度。
-
透過 CloudTrail 事件追蹤進度。
-
lastRotatedDate檢查 Secrets Manager 主控台或secretsmanager:describeSecretAPI。 -
等待
RotationSucceeded或RotationFailedCloudTrail 事件。
-
-
輪換成功後,請還原叢集容量。
-
使用 UpdateComputeNodeGroup API 將節點群組重設為所需的最小/最大容量。
-
對於 AWS PCS 受管登入節點:不需要其他動作。
-
對於 BYO 登入節點:
-
連線至登入節點。
-
/etc/slurm/slurm.key使用 Secrets Manager 的新秘密進行更新。 -
重新啟動 Slurm Auth 和 Cred Kiosk 協助程式 (已封裝)。
-
-