翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
SageMaker トレーニングジョブの実行
SageMaker HyperPod レシピは、SageMaker トレーニングジョブの送信をサポートしています。トレーニングジョブを送信する前に、クラスター設定、sm_job.yaml を更新し、対応する環境をインストールする必要があります。
レシピを SageMaker トレーニングジョブとして使用する
クラスターをホストしていない場合は、レシピを SageMaker トレーニングジョブとして使用できます。レシピを実行するには、SageMaker トレーニングジョブ設定ファイル sm_job.yaml を変更する必要があります。
sm_jobs_config: output_path: null tensorboard_config: output_path: null container_logs_path: null wait: True inputs: s3: train: null val: null file_system: directory_path: null additional_estimator_kwargs: max_run: 1800
-
output_path: モデルを Amazon S3 URL に保存する場所を指定できます。 -
tensorboard_config: 出力パスや TensorBoard ログパスなどの TensorBoard 関連の設定を指定できます。 -
wait: トレーニングジョブの送信時にジョブの完了を待機するかどうかを指定できます。 -
inputs: トレーニングデータと検証データのパスを指定できます。データソースは、Amazon FSx や Amazon S3 URL などの共有ファイルシステムから取得できます。 -
additional_estimator_kwargs: SageMaker トレーニングジョブプラットフォームにトレーニングジョブを送信するための追加の推定ツール引数。詳細については、「アルゴリズム推定ツール」を参照してください。