翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
ジョブキューのステータスを表示する
ジョブキューを作成してジョブを送信した後は、その進行状況をモニタリングできることが重要です。[ジョブの詳細] ページを使用すると、ジョブキューを確認、管理、モニタリングできます。
ジョブキュー情報を表示する
AWS Batch コンソールから、ナビゲーションペインでジョブキューを選択し、目的のジョブキューを選択して詳細を表示します。このページでは、ジョブキューを確認して管理したり、ジョブキューのスナップショット、ジョブの状態制限、環境の順序、タグ、ジョブキューの JSON コードなど、キューのオペレーションに関する追加情報を確認したりできます。
ジョブキューの詳細
このセクションでは、ジョブキューの概要とメンテナンスのオプションを確認できます。このセクションには Amazon リソースネーム (ARN) があります。
を通じてこの情報を検索するには AWS Command Line Interface、 DescribeJobQueuesオペレーションをジョブキュー名または対応する ARN とともに使用します。
ジョブキュースナップショット
このセクションではキューにある最初の 100 個の RUNNABLE ジョブの静的リストを表示できます。検索フィールドを使用して結果セクションの任意の列の情報を検索すると、リストを絞り込むことができます。スナップショットの結果エリアのジョブは、ジョブキューの実行戦略に従って並べ替えられます。先入れ先出し (FIFO) ジョブキューの場合、ジョブの順序は送信時間に従います。公平配分スケジューリングジョブキューの場合、ジョブの順序はジョブの優先度と共有使用状況に基づきます。
結果はジョブキューのスナップショットであり、結果リストが自動的に更新されることはありません。リストを更新するには、セクションの上部にある [更新] を選択します。ジョブ名のハイパーリンクを選択して [ジョブの詳細] に移動すると、ジョブのステータスやその他の関連情報が表示されます。
を通じてこの情報を検索するには AWS CLI、 GetJobQueueSnapshotオペレーションをジョブキュー名または対応する ARN とともに使用します。
aws batch get-job-queue-snapshot --job-queue my-sm-training-fifo-jq
ジョブの状態制限
このタブを使用すると、ジョブがキャンセルされるまでに RUNNABLE 状態を維持できる時間に関する設定情報を確認できます。
を通じてこの情報を検索するには AWS CLI、 DescribeJobQueuesオペレーションをジョブキュー名または対応する ARN とともに使用します。
環境の順序
ジョブキューが複数の環境で実行されている場合、このタブにその順序と概要を確認できます。
を通じてこの情報を検索するには AWS CLI、 DescribeJobQueuesオペレーションをジョブキュー名または対応する ARN とともに使用します。
[タグ]
このタブを使用して、このジョブキューに関連付けられているタグを確認および管理できます。
JSON
このタブを使用して、このジョブキューに関連付けられている JSON コードをコピーできます。その後、JSON を AWS CloudFormation テンプレートと AWS CLI スクリプトに再利用できます。
サービスジョブのモニタリング
複数の AWS Batch コマンドを使用して、ジョブキュー内のサービスジョブのステータスをモニタリングできます。サービスジョブは、SageMaker Training などの AWS サービスで実行されるジョブです。ターゲットサービスがジョブ実行を処理する間、 はスケジューリングとキューイング機能 AWS Batch を提供します。
ステータス別にサービスジョブを一覧表示する
ListServiceJobs オペレーションを使用して、ステータスでフィルタリングされたキュー内のサービスジョブを表示します。サービスジョブのステータスは次のとおりです。
-
SUBMITTED- ジョブは送信されましたが、まだ処理されていません -
PENDING- ジョブは保留中で、リソースを待っています -
RUNNABLE- ジョブを実行する準備が整い、キューで待機している -
STARTING- ジョブが開始されています -
RUNNING- ジョブは現在実行中です -
SCHEDULED- ジョブがターゲットサービスに送信されましたが、まだ実行されていません -
SUCCEEDED- ジョブが正常に完了しました -
FAILED- ジョブの完了に失敗しました
キューで実行中のジョブを表示します。
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status RUNNING
キューで待機しているジョブを表示します。
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status RUNNABLE
SageMaker に送信されたがまだ実行されていないジョブを表示します。
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status SCHEDULED
成功したすべてのジョブを表示します。
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status SUCCEEDED
失敗したジョブを表示してトラブルシューティングします。
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status FAILED
サービスジョブをフィルタリングする
パターンマッチングを使用して、名前でサービスジョブをフィルタリングできます。フィルター値がアスタリスク (*) で終わる場合、'*' の前の文字列で始まるジョブ名と一致します。
「トレーニング」で始まる名前のジョブを検索します。
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --filters name=JOB_NAME,values=training*
特定の名前のジョブを検索します。
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --filters name=JOB_NAME,values=my-training-job-1,my-training-job-2
ステータスフィルターと名前フィルターを組み合わせる:
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --job-status RUNNING \ --filters name=JOB_NAME,values=production*
大きな結果セットを処理する
多くのサービスジョブがある場合は、ページ分割を使用して結果を効果的に管理します。
返される結果の数を制限します。
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --max-results 10
次のトークンを使用して、追加の結果を取得します。
aws batch list-service-jobs \ --job-queuemy-sm-training-fifo-jq\ --max-results 10 \ --next-tokeneyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9...
詳細なサービスジョブ情報を取得する
DescribeServiceJob オペレーションを使用して、現在のステータス、サービスリソース識別子、詳細な試行情報など、特定のサービスジョブに関する包括的な情報を取得します。
特定のジョブに関する詳細情報を表示します。
aws batch describe-service-job \ --job-ida4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d
このコマンドは、次のようなジョブに関する包括的な情報を返します。
-
ジョブ ARN と現在のステータス
-
サービスリソース識別子 (SageMaker トレーニングジョブ ARN など)
-
優先度と再試行設定のスケジューリング
-
元のサービスパラメータを含むサービスリクエストペイロード
-
開始時刻と停止時刻を含む詳細な試行情報
-
ターゲットサービスからのステータスメッセージ
SageMaker トレーニングジョブのモニタリング
を使用して SageMaker トレーニングジョブをモニタリングする場合 AWS Batch、 AWS Batch ジョブ情報と基盤となる SageMaker トレーニングジョブの詳細の両方にアクセスできます。
ジョブ詳細のサービスリソース識別子には、SageMaker トレーニングジョブ ARN が含まれます。
{ "latestAttempt": { "serviceResourceId": { "name": "TrainingJobArn", "value": "arn:aws:sagemaker:us-east-1:123456789012:training-job/my-training-job" } } }
この ARN を使用して、SageMaker から直接追加の詳細を取得できます。
aws sagemaker describe-training-job \ --training-job-namemy-training-job
AWS Batch ステータスと SageMaker Training ジョブのステータスの両方を確認して、ジョブの進行状況をモニタリングします。 AWS Batch ジョブのステータスはジョブのライフサイクル全体を示し、SageMaker Training ジョブのステータスはトレーニングプロセスに関するサービス固有の詳細を提供します。
サービスジョブを終了する
TerminateServiceJob オペレーションを使用して、実行中のサービスジョブを停止します。
特定のサービスジョブを終了する:
aws batch terminate-service-job \ --job-ida4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d\ --reason "Job terminated by user request"
サービスジョブを終了すると、 はジョブ AWS Batch を停止し、ターゲットサービスに通知します。SageMaker トレーニングジョブの場合、これにより SageMaker AI のトレーニングジョブも停止します。