Menggunakan CLI Menggunakan SDK Invokasi titik akhir Kelola titik akhir Pembersihan sumber daya Langkah selanjutnya

Menyebarkan model JumpStart

Anda dapat menerapkan JumpStart model pra-terlatih untuk inferensi menggunakan CLI atau SDK.

Menggunakan CLI

Jalankan perintah berikut untuk men-deploy JumpStart model:


hyp create hyp-jumpstart-endpoint \
    --version 1.0 \
    --model-id deepseek-llm-r1-distill-qwen-1-5b \
    --model-version 2.0.4 \
    --instance-type ml.g5.8xlarge \
    --endpoint-name endpoint-jumpstart \
    --tls-output-s3-uri s3://tls-bucket-inf1-beta2

Menggunakan SDK

Membuat skrip Python yang disebut dengan konten berikut.


from sagemaker.hyperpod.inference.config.hp_jumpstart_endpoint_config import Model, Server, SageMakerEndpoint, TlsConfig
from sagemaker.hyperpod.inference.hp_jumpstart_endpoint import HPJumpStartEndpoint

model = Model(
    model_id="deepseek-llm-r1-distill-qwen-1-5b",
    model_version="2.0.4"
)

server = Server(
    instance_type="ml.g5.8xlarge"
)

endpoint_name = SageMakerEndpoint(name="endpoint-jumpstart")

tls_config = TlsConfig(tls_certificate_output_s3_uri="s3://tls-bucket-inf1-beta2")

js_endpoint = HPJumpStartEndpoint(
    model=model,
    server=server,
    sage_maker_endpoint=endpoint_name,
    tls_config=tls_config
)

js_endpoint.create()

Invokasi titik akhir

Menggunakan CLI

Uji titik akhir dengan masukan sampel:


hyp invoke hyp-jumpstart-endpoint \
    --endpoint-name endpoint-jumpstart \
    --body '{"inputs":"What is the capital of USA?"}'

Menggunakan SDK

Sertakan kode berikut dalam skrip Python Anda.


data = '{"inputs":"What is the capital of USA?"}'
response = js_endpoint.invoke(body=data).body.read()
print(response)

Kelola titik akhir

Menggunakan CLI

Daftar dan periksa titik akhir:


hyp list hyp-jumpstart-endpoint
hyp get hyp-jumpstart-endpoint --name endpoint-jumpstart

Menggunakan SDK

Sertakan kode berikut dalam skrip Python Anda.


endpoint_iterator = HPJumpStartEndpoint.list()
for endpoint in endpoint_iterator:
    print(endpoint.name, endpoint.status)

logs = js_endpoint.get_logs()
print(logs)

Pembersihan sumber daya

Setelah selesai, hapus titik akhir untuk menghindari biaya yang tidak perlu.

Menggunakan CLI


hyp delete hyp-jumpstart-endpoint --name endpoint-jumpstart

Menggunakan SDK


js_endpoint.delete()

Langkah selanjutnya

Sekarang setelah Anda melatih PyTorch model, menerapkannya sebagai titik akhir khusus, dan menerapkan JumpStart model menggunakan HyperPod CLI dan SDK, jelajahi fitur-fitur lanjutan:

Pelatihan multi-node: Pelatihan skala di beberapa instance
Wadah khusus: Bangun lingkungan pelatihan khusus
Integrasi dengan SageMaker Pipelines: Otomatiskan alur kerja ML Anda
Pemantauan lanjutan: Siapkan metrik dan peringatan khusus

Untuk lebih banyak contoh dan konfigurasi lanjutan, kunjungi SageMaker HyperPod GitHub repositori.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Menerapkan model kustom

Menjalankan pekerjaan di cluster