ジョブキューのステータスを表示する - AWS Batch

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

ジョブキューのステータスを表示する

ジョブキューを作成してジョブを送信した後は、その進行状況をモニタリングできることが重要です。[ジョブの詳細] ページを使用すると、ジョブキューを確認、管理、モニタリングできます。

ジョブキュー情報を表示する

AWS Batch コンソールから、ナビゲーションペインでジョブキューを選択し、目的のジョブキューを選択して詳細を表示します。このページでは、ジョブキューを確認して管理したり、ジョブキューのスナップショット、ジョブの状態制限、環境の順序、タグ、ジョブキューの JSON コードなど、キューのオペレーションに関する追加情報を確認したりできます。

ジョブキューの詳細

このセクションでは、ジョブキューの概要とメンテナンスのオプションを確認できます。このセクションには Amazon リソースネーム (ARN) があります。

を通じてこの情報を検索するには AWS Command Line Interface、 DescribeJobQueuesオペレーションをジョブキュー名または対応する ARN とともに使用します。

ジョブキュースナップショット

このセクションではキューにある最初の 100 個の RUNNABLE ジョブの静的リストを表示できます。検索フィールドを使用して結果セクションの任意の列の情報を検索すると、リストを絞り込むことができます。スナップショットの結果エリアのジョブは、ジョブキューの実行戦略に従って並べ替えられます。先入れ先出し (FIFO) ジョブキューの場合、ジョブの順序は送信時間に従います。公平配分スケジューリングジョブキューの場合、ジョブの順序はジョブの優先度と共有使用状況に基づきます。

結果はジョブキューのスナップショットであり、結果リストが自動的に更新されることはありません。リストを更新するには、セクションの上部にある [更新] を選択します。ジョブ名のハイパーリンクを選択して [ジョブの詳細] に移動すると、ジョブのステータスやその他の関連情報が表示されます。

を通じてこの情報を検索するには AWS CLI、 GetJobQueueSnapshotオペレーションをジョブキュー名または対応する ARN とともに使用します。

aws batch get-job-queue-snapshot --job-queue my-sm-training-fifo-jq

ジョブの状態制限

このタブを使用すると、ジョブがキャンセルされるまでに RUNNABLE 状態を維持できる時間に関する設定情報を確認できます。

を通じてこの情報を検索するには AWS CLI、 DescribeJobQueuesオペレーションをジョブキュー名または対応する ARN とともに使用します。

環境の順序

ジョブキューが複数の環境で実行されている場合、このタブにその順序と概要を確認できます。

を通じてこの情報を検索するには AWS CLI、 DescribeJobQueuesオペレーションをジョブキュー名または対応する ARN とともに使用します。

[タグ]

このタブを使用して、このジョブキューに関連付けられているタグを確認および管理できます。

JSON

このタブを使用して、このジョブキューに関連付けられている JSON コードをコピーできます。その後、JSON を AWS CloudFormation テンプレートと AWS CLI スクリプトに再利用できます。

サービスジョブのモニタリング

複数の AWS Batch コマンドを使用して、ジョブキュー内のサービスジョブのステータスをモニタリングできます。サービスジョブは、SageMaker Training などの AWS サービスで実行されるジョブです。ターゲットサービスがジョブ実行を処理する間、 はスケジューリングとキューイング機能 AWS Batch を提供します。

ステータス別にサービスジョブを一覧表示する

ListServiceJobs オペレーションを使用して、ステータスでフィルタリングされたキュー内のサービスジョブを表示します。サービスジョブのステータスは次のとおりです。

  • SUBMITTED - ジョブは送信されましたが、まだ処理されていません

  • PENDING - ジョブは保留中で、リソースを待っています

  • RUNNABLE - ジョブを実行する準備が整い、キューで待機している

  • STARTING - ジョブが開始されています

  • RUNNING - ジョブは現在実行中です

  • SCHEDULED - ジョブがターゲットサービスに送信されましたが、まだ実行されていません

  • SUCCEEDED - ジョブが正常に完了しました

  • FAILED - ジョブの完了に失敗しました

キューで実行中のジョブを表示します。

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNING

キューで待機しているジョブを表示します。

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNABLE

SageMaker に送信されたがまだ実行されていないジョブを表示します。

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status SCHEDULED

成功したすべてのジョブを表示します。

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status SUCCEEDED

失敗したジョブを表示してトラブルシューティングします。

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status FAILED

サービスジョブをフィルタリングする

パターンマッチングを使用して、名前でサービスジョブをフィルタリングできます。フィルター値がアスタリスク (*) で終わる場合、'*' の前の文字列で始まるジョブ名と一致します。

「トレーニング」で始まる名前のジョブを検索します。

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --filters name=JOB_NAME,values=training*

特定の名前のジョブを検索します。

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --filters name=JOB_NAME,values=my-training-job-1,my-training-job-2

ステータスフィルターと名前フィルターを組み合わせる:

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --job-status RUNNING \ --filters name=JOB_NAME,values=production*

大きな結果セットを処理する

多くのサービスジョブがある場合は、ページ分割を使用して結果を効果的に管理します。

返される結果の数を制限します。

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --max-results 10

次のトークンを使用して、追加の結果を取得します。

aws batch list-service-jobs \ --job-queue my-sm-training-fifo-jq \ --max-results 10 \ --next-token eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9...

詳細なサービスジョブ情報を取得する

DescribeServiceJob オペレーションを使用して、現在のステータス、サービスリソース識別子、詳細な試行情報など、特定のサービスジョブに関する包括的な情報を取得します。

特定のジョブに関する詳細情報を表示します。

aws batch describe-service-job \ --job-id a4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d

このコマンドは、次のようなジョブに関する包括的な情報を返します。

  • ジョブ ARN と現在のステータス

  • サービスリソース識別子 (SageMaker トレーニングジョブ ARN など)

  • 優先度と再試行設定のスケジューリング

  • 元のサービスパラメータを含むサービスリクエストペイロード

  • 開始時刻と停止時刻を含む詳細な試行情報

  • ターゲットサービスからのステータスメッセージ

SageMaker トレーニングジョブのモニタリング

を使用して SageMaker トレーニングジョブをモニタリングする場合 AWS Batch、 AWS Batch ジョブ情報と基盤となる SageMaker トレーニングジョブの詳細の両方にアクセスできます。

ジョブ詳細のサービスリソース識別子には、SageMaker トレーニングジョブ ARN が含まれます。

{ "latestAttempt": { "serviceResourceId": { "name": "TrainingJobArn", "value": "arn:aws:sagemaker:us-east-1:123456789012:training-job/my-training-job" } } }

この ARN を使用して、SageMaker から直接追加の詳細を取得できます。

aws sagemaker describe-training-job \ --training-job-name my-training-job

AWS Batch ステータスと SageMaker Training ジョブのステータスの両方を確認して、ジョブの進行状況をモニタリングします。 AWS Batch ジョブのステータスはジョブのライフサイクル全体を示し、SageMaker Training ジョブのステータスはトレーニングプロセスに関するサービス固有の詳細を提供します。

サービスジョブを終了する

TerminateServiceJob オペレーションを使用して、実行中のサービスジョブを停止します。

特定のサービスジョブを終了する:

aws batch terminate-service-job \ --job-id a4d6c728-8ee8-4c65-8e2a-9a5e8f4b7c3d \ --reason "Job terminated by user request"

サービスジョブを終了すると、 はジョブ AWS Batch を停止し、ターゲットサービスに通知します。SageMaker トレーニングジョブの場合、これにより SageMaker AI のトレーニングジョブも停止します。