で SageMaker トレーニングジョブキューを作成する AWS Batch - AWS Batch

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

で SageMaker トレーニングジョブキューを作成する AWS Batch

SageMaker Training ジョブキューは SageMaker AI サービスと直接統合され、基盤となるコンピューティングインフラストラクチャを管理することなく、サーバーレスジョブスケジューリングを提供します。

前提条件

SageMaker Training ジョブキューを作成する前に、以下を確認してください。

Create a SageMaker Training job queue (AWS Batch console)
  1. https://console.aws.amazon.com/batch/ で AWS Batch コンソールを開きます。

  2. ナビゲーションペインで、ジョブキュー作成を選択します。

  3. オーケストレーションタイプで、SageMaker Training を選択します。

  4. ジョブキュー設定の場合:

    1. Name に、ジョブキューの名前を入力します。

    2. Priority には、0~1000 の値を入力します。サービス環境では、優先度の高いジョブキューが優先されます。

    3. (オプション) スケジューリングポリシーの Amazon リソースネーム (ARN) では、既存のスケジューリングポリシーを選択します。

    4. 接続されたサービス環境の場合は、リストからサービス環境を選択してジョブキューに関連付けます。

  5. (オプション) ジョブの状態制限の場合:

    1. 設定ミスの場合は、最大実行可能時間 (秒) を選択してSERVICE_ENVIRONMENT_MAX_RESOURCE入力します。

    2. キャパシティ INSUFFICIENT_INSTANCE_CAPACITYを選択し、最大実行可能時間 (秒) を入力します。

  6. ジョブキューの作成を選択する

Create a SageMaker Training job queue (AWS CLI)

create-job-queue コマンドを使用して、SageMaker Training ジョブキューを作成します。

次の例では、サービス環境を使用する基本的な SageMaker トレーニングジョブキューを作成します。

aws batch create-job-queue \ --job-queue-name my-sm-training-fifo-jq \ --job-queue-type SAGEMAKER_TRAINING \ --priority 1 \ --service-environment-order order=1,serviceEnvironment=ExampleServiceEnvironment

ExampleServiceEnvironment をサービス環境の名前に置き換えます。

このコマンドにより、以下のような出力が返されます。

{ "jobQueueName": "my-sm-training-fifo-jq", "jobQueueArn": "arn:aws:batch:region:account:job-queue/my-sm-training-fifo-jq" }

ジョブキューを作成したら、ジョブキューが正常に作成され、有効な状態であることを確認します。

describe-job-queues コマンドを使用して、ジョブキューの詳細を表示します。

aws batch describe-job-queues --job-queues my-sm-training-fifo-jq

このコマンドにより、以下のような出力が返されます。

{ "jobQueues": [ { "jobQueueName": "my-sm-training-fifo-jq", "jobQueueArn": "arn:aws:batch:region:account:job-queue/my-sm-training-fifo-jq", "state": "ENABLED", "status": "VALID", "statusReason": "JobQueue Healthy", "priority": 1, "computeEnvironmentOrder": [], "serviceEnvironmentOrder": [ { "order": 1, "serviceEnvironment": "arn:aws:batch:region:account:service-environment/ExampleServiceEnvironment" } ], "jobQueueType": "SAGEMAKER_TRAINING", "tags": {}, "jobStateTimeLimitActions": [] } ] }

以下を確認してください。

  • stateENABLED

  • statusVALID

  • statusReasonJobQueue Healthy

  • jobQueueTypeSAGEMAKER_TRAINING

  • がサービス環境serviceEnvironmentOrderを参照する