SageMaker HyperPod CLI 命令 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

SageMaker HyperPod CLI 命令

下表摘要說明 SageMaker HyperPod CLI 命令。

注意

如需完整的 CLI 參考,請參閱 SageMaker HyperPod CLI GitHub 儲存庫中的 README

SageMaker HyperPod CLI 命令 實體 Description
hyperpod get-clusters 叢集/存取 列出具有 IAM 許可的使用者可將訓練工作負載提交至其中的所有叢集。提供整體可用執行個體的目前快照,以及最大容量,依運作狀態檢查狀態 (例如:BurnInPassed) 分組
hyperpod connect-cluster 叢集/存取 設定 kubectl 在指定的 HyperPod 叢集和命名空間上操作
hyperpod start-job job 將任務提交至目標叢集 - 任務名稱在命名空間層級將是唯一的 - 使用者將能夠透過將它們當作 CLI 引數傳遞來覆寫 yaml 規格
hyperpod get-job job 顯示所提交任務的中繼資料
hyperpod list-jobs job 列出已連線叢集/命名空間中使用者已新增至其中的所有任務,而此使用者具有提交訓練工作負載的 IAM 許可
hyperpod cancel-job job 停止和刪除任務,並放棄基礎運算資源。此任務無法重新繼續。如有需要,必須啟動新的任務。
hyperpod list-pods Pod 列出命名空間中給定任務中的所有 Pod
hyperpod get-log Pod 擷取指定任務中特殊 Pod 的日誌
hyperpod exec Pod 在指定 Pod 的 Shell 中執行 bash 命令並發佈輸出
hyperpod --help 公用程式 列出所有支援的命令