Individuazione degli artefatti del modello Implementazione con la CLI Implementazione con Python SDK Richiamare l'endpoint Gestione dell’endpoint Eseguire la pulizia delle risorse Fasi successive

Implementazione di un modello personalizzato

Al termine dell’addestramento, implementa il modello per l’inferenza. Puoi implementare un modello personalizzato utilizzando la CLI o l’SDK.

Individuazione degli artefatti del modello

Controlla il tuo bucket S3: verifica che gli artefatti del modello siano salvati in s3://my-bucket/model-artifacts/
Annota il percorso esatto: ti servirà il percorso completo (ad esempio s3://my-bucket/model-artifacts/test-pytorch-job/model.tar.gz)

Implementazione con la CLI

Per implementare il modello personalizzato, utilizza il comando seguente:


hyp create hyp-custom-endpoint \
    --version 1.0 \
    --env '{"HF_MODEL_ID":"/opt/ml/model", "SAGEMAKER_PROGRAM":"inference.py", }' \
    --model-source-type s3 \
    --model-location test-pytorch-job \
    --s3-bucket-name my-bucket \
    --s3-region us-east-2 \
    --prefetch-enabled true \ 
    --image-uri 763104351884.dkr.ecr.us-east-1.amazonaws.com/pytorch-inference:latest \
    --model-volume-mount-name model-weights \
    --container-port 8080 \
    --resources-requests '{"cpu": "30000m", "nvidia.com/gpu": 1, "memory": "100Gi"}' \
    --resources-limits '{"nvidia.com/gpu": 1}' \
    --tls-output-s3-uri s3://<bucket_name> \
    --instance-type ml.g5.8xlarge \
    --endpoint-name endpoint-custom-pytorch \
    --model-name pytorch-custom-model

Questo comando distribuisce il modello addestrato come endpoint denominato endpoint-custom-pytorch. --model-location fa riferimento al percorso dell’artefatto specificato nel job di addestramento.

Implementazione con Python SDK

Crea uno script Python con il seguente contenuto:


from sagemaker.hyperpod.inference.config.hp_custom_endpoint_config import Model, Server, SageMakerEndpoint, TlsConfig, EnvironmentVariables
from sagemaker.hyperpod.inference.hp_custom_endpoint import HPCustomEndpoint

model = Model(
    model_source_type="s3",
    model_location="test-pytorch-job",
    s3_bucket_name="my-bucket",
    s3_region="us-east-2",
    prefetch_enabled=True
)

server = Server(
    instance_type="ml.g5.8xlarge",
    image_uri="763104351884.dkr.ecr.us-east-2.amazonaws.com/huggingface-pytorch-tgi-inference:2.4.0-tgi2.3.1-gpu-py311-cu124-ubuntu22.04-v2.0",
    container_port=8080,
    model_volume_mount_name="model-weights"
)

resources = {
    "requests": {"cpu": "30000m", "nvidia.com/gpu": 1, "memory": "100Gi"},
    "limits": {"nvidia.com/gpu": 1}
}

env = EnvironmentVariables(
    HF_MODEL_ID="/opt/ml/model",
    SAGEMAKER_PROGRAM="inference.py",
    SAGEMAKER_SUBMIT_DIRECTORY="/opt/ml/model/code",
    MODEL_CACHE_ROOT="/opt/ml/model",
    SAGEMAKER_ENV="1"
)

endpoint_name = SageMakerEndpoint(name="endpoint-custom-pytorch")

tls_config = TlsConfig(tls_certificate_output_s3_uri="s3://<bucket_name>")

custom_endpoint = HPCustomEndpoint(
    model=model,
    server=server,
    resources=resources,
    environment=env,
    sage_maker_endpoint=endpoint_name,
    tls_config=tls_config
)

custom_endpoint.create()

Richiamare l'endpoint

Utilizzo della CLI

Testa l’endpoint con un input di esempio:


hyp invoke hyp-custom-endpoint \
    --endpoint-name endpoint-custom-pytorch \
    --body '{"inputs":"What is the capital of USA?"}'

Ciò restituisce la risposta del modello, ad esempio «La capitale degli Stati Uniti è Washington». D.C

Utilizzo di SDK

Aggiungi il codice seguente allo script Python:


data = '{"inputs":"What is the capital of USA?"}'
response = custom_endpoint.invoke(body=data).body.read()
print(response)

Gestione dell’endpoint

Utilizzo della CLI

Elenca e ispeziona l’endpoint:


hyp list hyp-custom-endpoint
hyp get hyp-custom-endpoint --name endpoint-custom-pytorch

Utilizzo di SDK

Aggiungi il codice seguente allo script Python:


logs = custom_endpoint.get_logs()
print(logs)

Eseguire la pulizia delle risorse

Al termine, elimina l’endpoint per evitare costi inutili.

Utilizzo della CLI


hyp delete hyp-custom-endpoint --name endpoint-custom-pytorch

Utilizzo di SDK


custom_endpoint.delete()

Fasi successive

Hai distribuito e testato con successo un modello personalizzato utilizzando SageMaker HyperPod. Ora puoi utilizzare questo endpoint per l’inferenza nelle tue applicazioni.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Addestra un modello PyTorch

Implementa un modello JumpStart