기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
에서 서비스 작업 제출 AWS Batch
서비스 작업을 제출하려면 SubmitServiceJob API를 AWS Batch사용합니다. AWS CLI 또는 SDK를 사용하여 작업을 제출할 수 있습니다.
실행 역할이 아직 없는 경우 서비스 작업을 제출하기 전에 실행 역할을 생성해야 합니다. SageMaker AI 실행 역할을 생성하려면 SageMaker AI 개발자 안내서의 SageMaker AI 실행 역할을 사용하는 방법을 참조하세요. SageMaker
서비스 작업 제출 워크플로
서비스 작업을 제출하면는 다음 워크플로를 AWS Batch 따릅니다.
-
AWS Batch 는
SubmitServiceJob
요청을 수신하고 AWS Batch특정 파라미터를 검증합니다.serviceRequestPayload
는 검증 없이 전달됩니다. -
작업이
SUBMITTED
상태로 전환되고 지정된 작업 대기열에 배치됩니다. -
AWS Batch 는 대기열 앞에 있는
RUNNABLE
작업에 대해 서비스 환경에 사용 가능한 용량이 있는지 평가합니다. -
용량을 사용할 수 있는 경우 작업이 로 이동
SCHEDULED
하고 작업이 SageMaker AI로 전달됨 -
용량을 획득하고 SageMaker AI가 서비스 작업 데이터를 다운로드하면 서비스 작업이 초기화를 시작하고 작업이 로 변경됩니다
STARTING
. -
SageMaker AI가 작업을 실행하기 시작하면 상태가 로 변경됩니다
RUNNING
. -
SageMaker AI가 작업을 실행하는 동안는 진행 상황을 AWS Batch 모니터링하고 서비스 상태를 AWS Batch 작업 상태에 매핑합니다. 서비스 작업 상태가 매핑되는 방법에 대한 자세한 내용은 섹션을 참조하세요. AWS Batch 서비스 작업 상태를 SageMaker AI 상태로 매핑
서비스 작업이 완료되면 로 이동
SUCCEEDED
하고 출력을 다운로드할 준비가 된 것입니다.
사전 조건
서비스 작업을 제출하기 전에 다음을 갖추어야 합니다.
-
서비스 환경 - 용량 제한을 정의하는 서비스 환경입니다. 자세한 내용은 에서 서비스 환경 생성 AWS Batch 단원을 참조하십시오.
-
SageMaker 작업 대기열 - 작업 일정을 제공하는 SageMaker 작업 대기열입니다. 자세한 내용은 에서 SageMaker 훈련 작업 대기열 생성 AWS Batch 단원을 참조하십시오.
-
IAM 권한 - 작업 대기열 및 서비스 환경을 생성하고 관리할 AWS Batch 수 있는 권한입니다. 자세한 내용은 AWS Batch IAM 정책, 역할 및 권한 단원을 참조하십시오.
AWS CLI를 사용하여 서비스 작업 제출
다음은 AWS CLI를 사용하여 서비스 작업을 제출하는 방법을 보여줍니다.
aws batch submit-service-job \ --job-name "my-sagemaker-training-job" \ --job-queue "my-sagemaker-job-queue" \ --service-job-type "SAGEMAKER_TRAINING" \ --service-request-payload '{\"TrainingJobName\": \"sagemaker-training-job-example\", \"AlgorithmSpecification\": {\"TrainingImage\": \"123456789012.dkr.ecr.us-east-1.amazonaws.com/pytorch-inference:1.8.0-cpu-py3\", \"TrainingInputMode\": \"File\", \"ContainerEntrypoint\": [\"sleep\", \"1\"]}, \"RoleArn\":\"arn:aws:iam::123456789012:role/SageMakerExecutionRole\", \"OutputDataConfig\": {\"S3OutputPath\": \"s3://example-bucket/model-output/\"}, \"ResourceConfig\": {\"InstanceType\": \"ml.m5.large\", \"InstanceCount\": 1, \"VolumeSizeInGB\": 1}}' --client-token "unique-token-12345"
serviceRequestPayload
파라미터에 대한 자세한 내용은 의 서비스 작업 페이로드 AWS Batch을 참조하세요.