CLI 사용 SDK 사용 API 엔드포인트 호출 엔드포인트 관리 리소스 정리 다음 단계

JumpStart 모델 배포

CLI 또는 SDK를 사용하여 추론을 위해 사전 훈련된 JumpStart 모델을 배포할 수 있습니다.

CLI 사용

다음 명령을 실행하여 JumpStart 모델을 배포합니다.


hyp create hyp-jumpstart-endpoint \
    --version 1.0 \
    --model-id deepseek-llm-r1-distill-qwen-1-5b \
    --model-version 2.0.4 \
    --instance-type ml.g5.8xlarge \
    --endpoint-name endpoint-jumpstart \
    --tls-output-s3-uri s3://tls-bucket-inf1-beta2

SDK 사용

다음 콘텐츠로 Python 스크립트를 생성합니다.


from sagemaker.hyperpod.inference.config.hp_jumpstart_endpoint_config import Model, Server, SageMakerEndpoint, TlsConfig
from sagemaker.hyperpod.inference.hp_jumpstart_endpoint import HPJumpStartEndpoint

model = Model(
    model_id="deepseek-llm-r1-distill-qwen-1-5b",
    model_version="2.0.4"
)

server = Server(
    instance_type="ml.g5.8xlarge"
)

endpoint_name = SageMakerEndpoint(name="endpoint-jumpstart")

tls_config = TlsConfig(tls_certificate_output_s3_uri="s3://tls-bucket-inf1-beta2")

js_endpoint = HPJumpStartEndpoint(
    model=model,
    server=server,
    sage_maker_endpoint=endpoint_name,
    tls_config=tls_config
)

js_endpoint.create()

API 엔드포인트 호출

CLI 사용

샘플 입력을 사용하여 엔드포인트를 테스트합니다.


hyp invoke hyp-jumpstart-endpoint \
    --endpoint-name endpoint-jumpstart \
    --body '{"inputs":"What is the capital of USA?"}'

SDK 사용

Python 스크립트에 다음 코드를 추가합니다.


data = '{"inputs":"What is the capital of USA?"}'
response = js_endpoint.invoke(body=data).body.read()
print(response)

엔드포인트 관리

CLI 사용

엔드포인트를 나열하고 검사합니다.


hyp list hyp-jumpstart-endpoint
hyp get hyp-jumpstart-endpoint --name endpoint-jumpstart

SDK 사용

Python 스크립트에 다음 코드를 추가합니다.


endpoint_iterator = HPJumpStartEndpoint.list()
for endpoint in endpoint_iterator:
    print(endpoint.name, endpoint.status)

logs = js_endpoint.get_logs()
print(logs)

리소스 정리

완료되면 엔드포인트를 삭제하여 불필요한 비용을 방지합니다.

CLI 사용


hyp delete hyp-jumpstart-endpoint --name endpoint-jumpstart

SDK 사용


js_endpoint.delete()

다음 단계

PyTorch 모델을 훈련하고, 사용자 지정 엔드포인트로 배포하고, HyperPod의 CLI 및 SDK를 사용하여 JumpStart 모델을 배포했으므로 고급 기능을 살펴보세요.

다중 노드 훈련: 여러 인스턴스에서 훈련 확장
사용자 지정 컨테이너: 특수 훈련 환경 구축
SageMaker Pipelines과의 통합: ML 워크플로 자동화
고급 모니터링: 사용자 지정 지표 및 알림 설정

추가 예제 및 고급 구성은 SageMaker HyperPod GitHub 리포지토리를 참조하세요.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

사용자 지정 모델 배포

클러스터에서 작업 실행