本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon SageMaker AI 如何處理訓練輸出
在容器執行演算法時,該演算法所產生的輸出會包含訓練工作、模型與輸出成品的狀態。而演算法應該將這項資訊寫入下列檔案;這些檔案位於容器的 /output 目錄中。針對此目錄所含的資訊,Amazon SageMaker AI 的處理方式如下所示:
-
/opt/ml/model- 演算法應該將所有最終模型成品寫入至此目錄。SageMaker AI 以壓縮 tar 格式將此資料作為單一物件複製到您在CreateTrainingJob請求中指定的 S3 位置。若單一訓練工作有多個容器寫入這個目錄,應確保這些容器與file/directory名稱沒有衝突。SageMaker AI 會將結果彙總成 TAR 檔案,並在訓練任務結束時上傳至 S3。 -
/opt/ml/output/data- 您的演算法應該將您想要儲存的非最終模型之成品寫入此目錄。SageMaker AI 以壓縮 tar 格式將此資料作為單一物件複製到您在CreateTrainingJob請求中指定的 S3 位置。若單一訓練工作有多個容器寫入這個目錄,應確保這些容器與file/directory名稱沒有衝突。SageMaker AI 會將結果彙總成 TAR 檔案,並在訓練任務結束時上傳至 S3。 -
/opt/ml/output/failure– 若訓練失敗,則在所有演算法完成輸出後 (如日誌),您的演算法應該將失敗說明寫入此檔案。在DescribeTrainingJob回應中,SageMaker AI 會傳回此檔案的前 1024 個字元作為FailureReason。
您可以指定 S3 一般用途或 S3 目錄儲存貯體來儲存訓練輸出。目錄儲存貯體僅使用 Amazon S3 Express One Zone 儲存類別,這是專為需要一致的個位數毫秒延遲的工作負載或效能關鍵應用程式所設計的類別。請選擇最適合您的應用程式和效能需求的儲存貯體類型。如需進一步了解 S3 目錄儲存貯體,請參閱《Amazon Simple Storage Service 使用者指南》中的目錄儲存貯體。
注意
您只能使用 Amazon S3 受管金鑰 (SSE-S3) 在伺服器端加密的 S3 目錄儲存貯體中加密 SageMaker AI 輸出資料。目前不支援使用 AWS KMS 金鑰 (SSE-KMS) 進行伺服器端加密,以將 SageMaker AI 輸出資料儲存在目錄儲存貯體中。