访问 SageMaker HyperPod 集群节点 - Amazon SageMaker AI

访问 SageMaker HyperPod 集群节点

您可以使用 AWS Systems Manager (SSM) 的 AWS CLI 命令直接访问 SageMaker HyperPod 服务集群的节点。运行 aws ssm start-session,并输入格式为 sagemaker-cluster:[cluster-id]_[instance-group-name]-[instance-id] 的节点主机名。您可以从 SageMaker HyperPod 管理控制台,或从 SageMaker HyperPod 的 AWS CLI 命令中运行 describe-cluster 和 list-cluster-nodes 来获取集群 ID、实例 ID 和实例组名称。例如,如果集群 ID 是 aa11bbbbb222,集群节点名称是 controller-group,集群节点 ID 是 i-111222333444555aa,则 SSM start-session 命令应如下所示。

注意

如果尚未设置 AWS Systems Manager,请按照 为集群用户访问控制设置 AWS Systems Manager 和以另一种身份运行 提供的说明进行操作。

$ aws ssm start-session \ --target sagemaker-cluster:aa11bbbbb222_controller-group-i-111222333444555aa \ --region us-west-2 Starting session with SessionId: s0011223344aabbccdd root@ip-111-22-333-444:/usr/bin#