에서 서비스 작업 제출 AWS Batch - AWS Batch

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

에서 서비스 작업 제출 AWS Batch

서비스 작업을 제출하려면 SubmitServiceJob API를 AWS Batch사용합니다. AWS CLI 또는 SDK를 사용하여 작업을 제출할 수 있습니다.

실행 역할이 아직 없는 경우 서비스 작업을 제출하기 전에 실행 역할을 생성해야 합니다. SageMaker AI 실행 역할을 생성하려면 SageMaker AI 개발자 안내서의 SageMaker AI 실행 역할을 사용하는 방법을 참조하세요. SageMaker

서비스 작업 제출 워크플로

서비스 작업을 제출하면는 다음 워크플로를 AWS Batch 따릅니다.

  1. AWS Batch 는 SubmitServiceJob 요청을 수신하고 AWS Batch특정 파라미터를 검증합니다. serviceRequestPayload는 검증 없이 전달됩니다.

  2. 작업이 SUBMITTED 상태로 전환되고 지정된 작업 대기열에 배치됩니다.

  3. AWS Batch 는 대기열 앞에 있는 RUNNABLE 작업에 대해 서비스 환경에 사용 가능한 용량이 있는지 평가합니다.

  4. 용량을 사용할 수 있는 경우 작업이 로 이동SCHEDULED하고 작업이 SageMaker AI로 전달됨

  5. 용량을 획득하고 SageMaker AI가 서비스 작업 데이터를 다운로드하면 서비스 작업이 초기화를 시작하고 작업이 로 변경됩니다STARTING.

  6. SageMaker AI가 작업을 실행하기 시작하면 상태가 로 변경됩니다RUNNING.

  7. SageMaker AI가 작업을 실행하는 동안는 진행 상황을 AWS Batch 모니터링하고 서비스 상태를 AWS Batch 작업 상태에 매핑합니다. 서비스 작업 상태가 매핑되는 방법에 대한 자세한 내용은 섹션을 참조하세요. AWS Batch 서비스 작업 상태를 SageMaker AI 상태로 매핑

  8. 서비스 작업이 완료되면 로 이동SUCCEEDED하고 출력을 다운로드할 준비가 된 것입니다.

사전 조건

서비스 작업을 제출하기 전에 다음을 갖추어야 합니다.

AWS CLI를 사용하여 서비스 작업 제출

다음은 AWS CLI를 사용하여 서비스 작업을 제출하는 방법을 보여줍니다.

aws batch submit-service-job \ --job-name "my-sagemaker-training-job" \ --job-queue "my-sagemaker-job-queue" \ --service-job-type "SAGEMAKER_TRAINING" \ --service-request-payload '{\"TrainingJobName\": \"sagemaker-training-job-example\", \"AlgorithmSpecification\": {\"TrainingImage\": \"123456789012.dkr.ecr.us-east-1.amazonaws.com/pytorch-inference:1.8.0-cpu-py3\", \"TrainingInputMode\": \"File\", \"ContainerEntrypoint\": [\"sleep\", \"1\"]}, \"RoleArn\":\"arn:aws:iam::123456789012:role/SageMakerExecutionRole\", \"OutputDataConfig\": {\"S3OutputPath\": \"s3://example-bucket/model-output/\"}, \"ResourceConfig\": {\"InstanceType\": \"ml.m5.large\", \"InstanceCount\": 1, \"VolumeSizeInGB\": 1}}' --client-token "unique-token-12345"

serviceRequestPayload 파라미터에 대한 자세한 내용은 의 서비스 작업 페이로드 AWS Batch을 참조하세요.