翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
SageMaker AI 環境変数とトレーニングストレージの場所のデフォルトパス
次の表は、SageMaker トレーニングプラットフォームによって管理されるトレーニングデータセット、チェックポイント、モデルアーティファクト、および出力の入出力パスをまとめたものです。
SageMaker トレーニングインスタンスのローカルパス | SageMaker AI 環境変数 | 目的 | 起動中に S3 から読み取る | スポット再起動中に S3 から読み取る | トレーニング中に S3 に書き込む | ジョブ終了時に S3 に書き込む |
---|---|---|---|---|---|---|
|
SM_CHANNEL_ |
SageMaker AI Python SDK 推定器 |
あり | はい | いいえ | いいえ |
|
SM_OUTPUT_DIR |
損失、正確性、中間レイヤー、重み、勾配、バイアス、TensorBoard 互換の出力などの出力を保存します。このパスを使用して、任意の変換出力を保存することもできます。これは最終的なモデルアーティファクト |
いいえ | いいえ | いいえ | はい |
|
SM_MODEL_DIR |
最終的なモデルアーティファクトを保存します。これは、SageMaker AI ホスティングでモデルアーティファクトがリアルタイム推論用にデプロイされる場所からのパスでもあります。 |
いいえ | いいえ | いいえ | はい |
|
- |
特定のポイントからトレーニングを再開し、予期しない中断またはマネージドスポットトレーニングの中断から回復できるよう、モデルチェックポイント (モデルの状態) を保存します。 |
あり | あり | はい | いいえ |
|
SAGEMAKER_SUBMIT_DIRECTORY |
トレーニングスクリプト、追加のライブラリ、および依存関係のコピー。 |
あり | はい | いいえ | いいえ |
|
- |
スクラッチスペースとして |
いいえ | いいえ | いいえ | いいえ |
1 channel_name
はトレーニングデータ入力用のユーザー定義チャネル名を指定する場所です。各トレーニングジョブには、複数のデータ入力チャネルを含めることができます。トレーニングジョブあたり、最大 20 のトレーニング入力チャネルを指定できます。データチャネルからのデータダウンロード時間は、請求対象時間にカウントされることにご注意ください。データ入力パスの詳細については、Amazon SageMakerがトレーニング情報を提供する方法」を参照してください。また、SageMaker AI がサポートするデータ入力モードには、ファイルモード、FastFile モード、パイプモードの 3 種類があります。SageMaker AI でのトレーニングのデータ入力モードの詳細については、「トレーニングデータへのアクセス」を参照してください。
2 SageMaker AI はトレーニングアーティファクトを TAR ファイル () に圧縮して書き込みますtar.gz
。圧縮時間とアップロード時間は、請求対象時間にカウントされます。詳細については、Amazon SageMakerがトレーニング出力を処理する方法」を参照してください。
3 SageMaker AI は、最終的なモデルアーティファクトを圧縮して TAR ファイル () に書き込みますtar.gz
。圧縮時間とアップロード時間は、請求対象時間にカウントされます。詳細については、Amazon SageMakerがトレーニング出力を処理する方法」を参照してください。
4 トレーニング中は Amazon S3 と同期してください。TAR ファイルに圧縮せず,そのまま書き込んでください。詳細については、Amazon SageMakerでチェックポイントを使用する」を参照してください。