JumpStart 모델 배포 - Amazon SageMaker AI

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

JumpStart 모델 배포

CLI 또는 SDK를 사용하여 추론을 위해 사전 훈련된 JumpStart 모델을 배포할 수 있습니다.

CLI 사용

다음 명령을 실행하여 JumpStart 모델을 배포합니다.

hyp create hyp-jumpstart-endpoint \ --version 1.0 \ --model-id deepseek-llm-r1-distill-qwen-1-5b \ --model-version 2.0.4 \ --instance-type ml.g5.8xlarge \ --endpoint-name endpoint-jumpstart \ --tls-output-s3-uri s3://tls-bucket-inf1-beta2

SDK 사용

다음 콘텐츠로 Python 스크립트를 생성합니다.

from sagemaker.hyperpod.inference.config.hp_jumpstart_endpoint_config import Model, Server, SageMakerEndpoint, TlsConfig from sagemaker.hyperpod.inference.hp_jumpstart_endpoint import HPJumpStartEndpoint model = Model( model_id="deepseek-llm-r1-distill-qwen-1-5b", model_version="2.0.4" ) server = Server( instance_type="ml.g5.8xlarge" ) endpoint_name = SageMakerEndpoint(name="endpoint-jumpstart") tls_config = TlsConfig(tls_certificate_output_s3_uri="s3://tls-bucket-inf1-beta2") js_endpoint = HPJumpStartEndpoint( model=model, server=server, sage_maker_endpoint=endpoint_name, tls_config=tls_config ) js_endpoint.create()

API 엔드포인트 호출

CLI 사용

샘플 입력을 사용하여 엔드포인트를 테스트합니다.

hyp invoke hyp-jumpstart-endpoint \ --endpoint-name endpoint-jumpstart \ --body '{"inputs":"What is the capital of USA?"}'

SDK 사용

Python 스크립트에 다음 코드를 추가합니다.

data = '{"inputs":"What is the capital of USA?"}' response = js_endpoint.invoke(body=data).body.read() print(response)

엔드포인트 관리

CLI 사용

엔드포인트를 나열하고 검사합니다.

hyp list hyp-jumpstart-endpoint hyp get hyp-jumpstart-endpoint --name endpoint-jumpstart

SDK 사용

Python 스크립트에 다음 코드를 추가합니다.

endpoint_iterator = HPJumpStartEndpoint.list() for endpoint in endpoint_iterator: print(endpoint.name, endpoint.status) logs = js_endpoint.get_logs() print(logs)

리소스 정리

완료되면 엔드포인트를 삭제하여 불필요한 비용을 방지합니다.

CLI 사용

hyp delete hyp-jumpstart-endpoint --name endpoint-jumpstart

SDK 사용

js_endpoint.delete()

다음 단계

PyTorch 모델을 훈련하고, 사용자 지정 엔드포인트로 배포하고, HyperPod의 CLI 및 SDK를 사용하여 JumpStart 모델을 배포했으므로 고급 기능을 살펴보세요.

  • 다중 노드 훈련: 여러 인스턴스에서 훈련 확장

  • 사용자 지정 컨테이너: 특수 훈련 환경 구축

  • SageMaker Pipelines과의 통합: ML 워크플로 자동화

  • 고급 모니터링: 사용자 지정 지표 및 알림 설정

추가 예제 및 고급 구성은 SageMaker HyperPod GitHub 리포지토리를 참조하세요.