翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
AWS Batch キュー内のサービスジョブをモニタリングする
list-service-jobs および get-job-queue-snapshot を使用して、SageMaker トレーニングジョブキュー内のジョブのステータスをモニタリングできます。
キューで実行中のジョブを表示します:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status RUNNING
キューで待機しているジョブを表示する:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status RUNNABLE
SageMaker に送信されたものの、まだ実行されていないジョブを表示します:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status SCHEDULED
キューの前面でジョブのスナップショットを取得します:
aws batch get-job-queue-snapshot --job-queue my-sm-training-fifo-jq
このコマンドは、キュー内の今後のサービスジョブの順序を示します。
詳細なサービスジョブ情報を取得する
DescribeServiceJob オペレーションを使用して、現在のステータス、サービスリソース識別子、詳細な試行情報など、特定のサービスジョブに関する包括的な情報を取得します。
特定のジョブに関する詳細情報を表示する:
aws batch describe-service-job \ --job-ida4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d
このコマンドは、次のようなジョブに関する包括的な情報を返します。
-
ジョブ ARN と現在のステータス
-
サービスリソース識別子 (SageMaker トレーニングジョブ ARN など)
-
優先度と再試行設定のスケジューリング
-
元のサービスパラメータを含むサービスリクエストペイロード
-
開始時刻と停止時刻を含む詳細な試行情報
-
ターゲットサービスからのステータスメッセージ
SageMaker トレーニングジョブをモニタリングする
を使用して SageMaker トレーニングジョブをモニタリングする場合 AWS Batch、 AWS Batch ジョブ情報と基盤となる SageMaker トレーニングジョブの詳細の両方にアクセスできます。
ジョブ詳細のサービスリソース識別子には、SageMaker トレーニングジョブ ARN が含まれます。
{ "latestAttempt": { "serviceResourceId": { "name": "TrainingJobArn", "value": "arn:aws:sagemaker:us-east-1:123456789012:training-job/my-training-job" } } }
この ARN を使用して、SageMaker から直接追加の詳細を取得できます。
aws sagemaker describe-training-job \ --training-job-namemy-training-job
AWS Batch ステータスと SageMaker Training ジョブのステータスの両方を確認して、ジョブの進行状況をモニタリングします。 AWS Batch ジョブのステータスはジョブのライフサイクル全体を示し、SageMaker トレーニングジョブのステータスはトレーニングプロセスに関するサービス固有の詳細を提供します。