本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
擷取 SageMaker HyperPod 叢集詳細資訊
了解如何使用 AWS CLI 擷取 SageMaker HyperPod 叢集詳細資訊。
描述叢集
執行 describe-cluster 檢查叢集的狀態。您可以指定叢集的名稱或 ARN。
aws sagemaker describe-cluster --cluster-nameyour-hyperpod-cluster
在叢集的狀態變為 InService 之後,請繼續下一個步驟。使用此 API,您也可以從執行其他 HyperPod API 作業擷取失敗訊息。
列出叢集節點的詳細資訊
執行 list-cluster-nodes 來檢查叢集節點的金鑰資訊。
aws sagemaker list-cluster-nodes --cluster-nameyour-hyperpod-cluster
這會傳回一個回應,而 InstanceId 是您需要使用以記錄 (使用 aws ssm) 至其中的內容。
描述叢集節點的詳細資訊
執行 describe-cluster-node 以擷取叢集節點的詳細資訊。您可以從 list-cluster-nodes 輸出取得叢集節點 ID。您可以指定叢集的名稱或 ARN。
aws sagemaker describe-cluster-node \ --cluster-nameyour-hyperpod-cluster\ --node-idi-111222333444555aa
列出叢集
執行 list-clusters 以列出您帳戶中的所有叢集。
aws sagemaker list-clusters
您也可以新增其他旗標來篩選叢集清單。若要進一步了解此命令在低層級執行的項目和其他用於篩選的旗標,請參閱 ListClusters API 參考。