產生報告 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

產生報告

本指南提供step-by-step說明。 SageMaker HyperPod 依照這些程序部署基礎設施、產生自訂報告,以及在不再需要時移除資源。

設定用量報告

注意

在 SageMaker HyperPod 叢集中設定 SageMaker HyperPod 用量報告基礎設施之前,請確定您符合本 中詳述的所有先決條件README.md

HyperPod 中的用量報告需要:

  • 使用 堆疊部署 SageMaker HyperPod AWS CloudFormation 用量報告 AWS 資源

  • 透過 Helm Chart 安裝 SageMaker HyperPod 用量報告 Kubernetes Operator

您可以在 SageMaker HyperPod 用量報告 GitHub 儲存庫中找到完整的安裝說明。具體而言,請遵循設定區段中的步驟。

隨需產生用量報告

安裝用量報告基礎設施和 Kubernetes Operator 後,系統會自動收集 SageMaker HyperPod 叢集的任務資料,並存放在您在設定期間設定的 S3 儲存貯體中。運算子會持續在背景擷取詳細的用量指標,在指定的 S3 儲存貯raw體目錄中建立原始資料檔案。

若要產生隨需用量報告,您可以使用 SageMaker HyperPod 用量報告 GitHub 儲存庫中提供的run.py指令碼來擷取和匯出用量指標。具體而言,您可以在產生報告區段中找到產生報告的指令碼和完整說明。

指令碼可讓您:

  • 指定產生報告的自訂日期範圍

  • 選擇詳細和摘要報告類型

  • 以 CSV 或 PDF 格式匯出報告

  • 將報告導向特定 S3 位置

清除用量報告資源

當您不再需要 SageMaker HyperPod 用量報告基礎設施時,請遵循清除資源中的步驟來清除 Kubernetes 運算子和資源 AWS (依該順序)。適當的資源刪除有助於避免不必要的成本。