

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

# Terapkan model dari JumpStart menggunakan Amazon Studio SageMaker
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui"></a>

Langkah-langkah berikut menunjukkan kepada Anda cara menerapkan model dari JumpStart menggunakan Amazon SageMaker Studio.

## Prasyarat
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-prereqs"></a>

Verifikasi bahwa Anda telah menyiapkan kemampuan inferensi di SageMaker HyperPod kluster Amazon Anda. Untuk informasi selengkapnya, lihat [Menyiapkan HyperPod cluster Anda untuk penerapan model](sagemaker-hyperpod-model-deployment-setup.md). 

## Buat HyperPod penerapan
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-create"></a>

1. Di Amazon SageMaker Studio, buka halaman **JumpStart**arahan dari panel navigasi kiri. 

1. Di bawah **Semua model publik**, pilih model yang ingin Anda terapkan.
**catatan**  
Jika Anda telah memilih model yang terjaga keamanannya, Anda harus menerima Perjanjian Lisensi Pengguna Akhir (EULA).

1. Pilih **SageMaker HyperPod**.

1. Di bawah **pengaturan Deployment**, JumpStart akan merekomendasikan instance untuk penerapan. Anda dapat mengubah pengaturan ini jika perlu.

   1. Jika Anda mengubah **jenis Instance**, pastikan itu kompatibel dengan **HyperPod cluster** yang dipilih. Jika tidak ada instance yang kompatibel, Anda harus memilih **HyperPod klaster baru atau menghubungi admin Anda untuk menambahkan instance yang kompatibel ke cluster**.

   1. Untuk memprioritaskan penerapan model, instal addon tata kelola tugas, buat alokasi komputasi, dan siapkan peringkat tugas untuk kebijakan klaster. Setelah ini selesai, Anda akan melihat opsi untuk memilih prioritas untuk penerapan model yang dapat digunakan untuk pencegahan penerapan dan tugas lain di cluster. 

   1. Masukkan namespace yang admin Anda telah berikan akses kepada Anda. Anda mungkin harus langsung menghubungi admin Anda untuk mendapatkan namespace yang tepat. Setelah namespace yang valid disediakan, tombol **Deploy** harus diaktifkan untuk menyebarkan model.

   1. Jika jenis instans Anda dipartisi (MIG diaktifkan), pilih jenis partisi **GPU**.

   1. Jika Anda ingin mengaktifkan perutean L2 KVCache atau Cerdas untuk mempercepat inferensi LLM, aktifkan mereka. Secara default, hanya L1 KV Cache yang diaktifkan. Untuk detail selengkapnya tentang KVCache dan Perutean cerdas, lihat [penerapan SageMaker HyperPod model](sagemaker-hyperpod-model-deployment.md).

1. Pilih **Deploy** dan tunggu **Endpoint** dibuat.

1. Setelah **Endpoint** dibuat, pilih **Test inferensi**.

## Mengedit HyperPod penerapan
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-edit"></a>

1. Di Amazon SageMaker Studio, pilih **Compute** dan kemudian **HyperPodcluster** dari panel navigasi kiri. 

1. Di bawah **Deployment**, pilih penerapan HyperPod klaster yang ingin Anda modifikasi.

1. **Dari ikon elipsis vertikal (), pilih Edit.**

1. **Di bawah **Pengaturan Deployment**, Anda dapat mengaktifkan atau menonaktifkan **Penskalaan otomatis**, dan mengubah jumlah replika Maks.**

1. Pilih **Simpan**.

1. **Status** akan berubah menjadi **Update**. Setelah berubah kembali ke **layanan In**, perubahan Anda selesai dan Anda akan melihat pesan yang mengonfirmasinya.

## Hapus HyperPod penerapan
<a name="sagemaker-hyperpod-model-deployment-deploy-js-ui-delete"></a>

1. Di Amazon SageMaker Studio, pilih **Compute** dan kemudian **HyperPodcluster** dari panel navigasi kiri. 

1. Di bawah **Deployment**, pilih penerapan HyperPod klaster yang ingin Anda modifikasi.

1. **Dari ikon elipsis vertikal (), pilih Hapus.**

1. Di **jendela Hapus HyperPod penyebaran**, pilih kotak centang.

1. Pilih **Hapus**.

1. **Status** akan berubah menjadi **Menghapus.** Setelah HyperPod penyebaran telah dihapus, Anda akan melihat pesan yang mengonfirmasinya.