本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
產生多份報告
本指南提供為您的 SageMaker HyperPod 叢集設定和管理用量報告的逐步指示。遵循這些程序部署基礎設施、產生自訂報告,以及在不再需要資源時將其移除。
設定用量報告
注意
在 SageMaker HyperPod 叢集中設定 SageMaker HyperPod 用量報告基礎設施之前,請確定您符合此 README.md
HyperPod 中的用量報告需要:
-
使用 堆疊部署 SageMaker HyperPod CloudFormation用量報告AWS資源
-
透過 Helm Chart 安裝 SageMaker HyperPod 用量報告 Kubernetes 運算子
您可以在 SageMaker HyperPod 用量報告 GitHub 儲存庫
隨需產生用量報告
一旦安裝了用量報告基礎設施和 Kubernetes 運算子,就會自動收集 SageMaker HyperPod 叢集的任務資料,並存放在您於設定期間設定的 S3 儲存貯體中。運算子會持續在背景擷取詳細的用量指標,在您指定的 S3 儲存貯體 raw 目錄中建立原始資料檔案。
若要產生隨需用量報告,您可以使用 SageMaker HyperPod 用量報告 GitHub 儲存庫run.py 指令碼來擷取和匯出用量指標。具體而言,您可以在產生報告
指令碼可讓您:
-
指定用於產生報告的自訂日期範圍
-
在詳細報告類型與摘要報告類型之間做選擇
-
以 CSV 或 PDF 格式匯出報告
-
將報告導向至特定 S3 位置
清除用量報告資源
當您不再需要 SageMaker HyperPod 用量報告基礎設施時,請遵循清除資源