AWS Batch サービスジョブのステータスを SageMaker AI ステータスにマッピングする - AWS Batch

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

AWS Batch サービスジョブのステータスを SageMaker AI ステータスにマッピングする

SubmitServiceJob を使用して SageMaker ジョブキューにジョブを送信すると、 はジョブのライフサイクル AWS Batch を管理し、 AWS Batch ジョブの状態を同等の SageMaker トレーニングジョブの状態にマッピングします。SageMaker トレーニングジョブなどのサービスジョブは、従来のコンテナジョブとは異なる状態ライフサイクルに従います。サービスジョブはほとんどの状態をコンテナジョブと共有しますが、 SCHEDULED状態を導入し、特にターゲットサービスからの容量不足エラーを処理するために、さまざまな再試行動作を示します。

次の表は、 AWS Batch ジョブの状態と対応する SageMaker Status/SecondaryStatus を示しています。

バッチステータス SageMaker AI プライマリステータス SageMaker AI セカンダリステータス 説明
SUBMITTED 該当なし 該当なし ジョブがキューに送信され、スケジューラの評価を待っています。
RUNNABLE 該当なし 該当なし ジョブはキューに入れられ、スケジューリングの準備が整います。この状態のジョブは、サービス環境で十分なリソースが利用可能になるとすぐに開始されます。十分なリソースが利用できない場合、ジョブはこの状態を無期限に維持できます。
SCHEDULED InProgress Pending サービスジョブが SageMaker AI に正常に送信されました
STARTING InProgress Downloading データとイメージのダウンロード中の SageMaker トレーニングジョブ。トレーニングジョブの容量が取得され、ジョブの初期化が開始されました。
RUNNING InProgress Training SageMaker トレーニングジョブ実行アルゴリズム
RUNNING InProgress Uploading トレーニング完了後に出力アーティファクトをアップロードする SageMaker トレーニングジョブ
SUCCEEDED Completed Completed SageMaker トレーニングジョブが正常に完了しました。出力アーティファクトのアップロードが完了しました。
FAILED Failed Failed SageMaker トレーニングジョブで回復不可能なエラーが発生しました。
FAILED Stopped Stopped SageMaker トレーニングジョブが を使用して手動で停止されましたStopTrainingJob