Uso de la CLI Uso del SDK Invocar al punto de conexión Administre el punto final Eliminar recursos Pasos a seguir a continuación

Implemente un modelo JumpStart

Puede implementar un JumpStart modelo previamente entrenado para la inferencia mediante la CLI o el SDK.

Uso de la CLI

Ejecute el siguiente comando para implementar un JumpStart modelo:


hyp create hyp-jumpstart-endpoint \
    --version 1.0 \
    --model-id deepseek-llm-r1-distill-qwen-1-5b \
    --model-version 2.0.4 \
    --instance-type ml.g5.8xlarge \
    --endpoint-name endpoint-jumpstart \
    --tls-output-s3-uri s3://tls-bucket-inf1-beta2

Uso del SDK

Cree un script de Python con el siguiente contenido:


from sagemaker.hyperpod.inference.config.hp_jumpstart_endpoint_config import Model, Server, SageMakerEndpoint, TlsConfig
from sagemaker.hyperpod.inference.hp_jumpstart_endpoint import HPJumpStartEndpoint

model = Model(
    model_id="deepseek-llm-r1-distill-qwen-1-5b",
    model_version="2.0.4"
)

server = Server(
    instance_type="ml.g5.8xlarge"
)

endpoint_name = SageMakerEndpoint(name="endpoint-jumpstart")

tls_config = TlsConfig(tls_certificate_output_s3_uri="s3://tls-bucket-inf1-beta2")

js_endpoint = HPJumpStartEndpoint(
    model=model,
    server=server,
    sage_maker_endpoint=endpoint_name,
    tls_config=tls_config
)

js_endpoint.create()

Invocar al punto de conexión

Uso de la CLI

Pruebe el punto final con una entrada de muestra:


hyp invoke hyp-jumpstart-endpoint \
    --endpoint-name endpoint-jumpstart \
    --body '{"inputs":"What is the capital of USA?"}'

Uso del SDK

Agrega el siguiente código a tu secuencia de comandos de Python:


data = '{"inputs":"What is the capital of USA?"}'
response = js_endpoint.invoke(body=data).body.read()
print(response)

Administre el punto final

Uso de la CLI

Enumere e inspeccione el punto final:


hyp list hyp-jumpstart-endpoint
hyp get hyp-jumpstart-endpoint --name endpoint-jumpstart

Uso del SDK

Agrega el siguiente código a tu secuencia de comandos de Python:


endpoint_iterator = HPJumpStartEndpoint.list()
for endpoint in endpoint_iterator:
    print(endpoint.name, endpoint.status)

logs = js_endpoint.get_logs()
print(logs)

Eliminar recursos

Cuando haya terminado, elimine el punto final para evitar costes innecesarios.

Uso de la CLI


hyp delete hyp-jumpstart-endpoint --name endpoint-jumpstart

Uso del SDK


js_endpoint.delete()

Pasos a seguir a continuación

Ahora que ha entrenado un PyTorch modelo, lo ha implementado como un punto final personalizado y ha implementado un JumpStart modelo mediante HyperPod la CLI y el SDK, explore las funciones avanzadas:

Capacitación en varios nodos: escale la capacitación en varias instancias
Contenedores personalizados: cree entornos de formación especializados
Integración con SageMaker Pipelines: automatice sus flujos de trabajo de aprendizaje automático
Supervisión avanzada: configure métricas y alertas personalizadas

Para ver más ejemplos y configuraciones avanzadas, visita el SageMaker HyperPod GitHub repositorio.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Implementar un modelo personalizado

Ejecutar trabajos en clústeres