Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Terapkan model dari JumpStart menggunakan Amazon Studio SageMaker
Langkah-langkah berikut menunjukkan kepada Anda cara menerapkan model dari JumpStart menggunakan Amazon SageMaker Studio.
Prasyarat
Verifikasi bahwa Anda telah menyiapkan kemampuan inferensi di SageMaker HyperPod kluster Amazon Anda. Untuk informasi selengkapnya, lihat Menyiapkan HyperPod cluster Anda untuk penerapan model.
Buat HyperPod penerapan
-
Di Amazon SageMaker Studio, buka halaman JumpStartarahan dari panel navigasi kiri.
-
Di bawah Semua model publik, pilih model yang ingin Anda terapkan.
catatan
Jika Anda telah memilih model yang terjaga keamanannya, Anda harus menerima Perjanjian Lisensi Pengguna Akhir (EULA).
-
Pilih SageMaker HyperPod.
-
Di bawah pengaturan Deployment, JumpStart akan merekomendasikan instance untuk penerapan. Anda dapat mengubah pengaturan ini jika perlu.
-
Jika Anda mengubah jenis Instance, pastikan itu kompatibel dengan HyperPod cluster yang dipilih. Jika tidak ada instance yang kompatibel, Anda harus memilih HyperPod klaster baru atau menghubungi admin Anda untuk menambahkan instance yang kompatibel ke cluster.
-
Untuk memprioritaskan penerapan model, instal addon tata kelola tugas, buat alokasi komputasi, dan siapkan peringkat tugas untuk kebijakan klaster. Setelah ini selesai, Anda akan melihat opsi untuk memilih prioritas untuk penerapan model yang dapat digunakan untuk pencegahan penerapan dan tugas lain di cluster.
-
Masukkan namespace yang admin Anda telah berikan akses kepada Anda. Anda mungkin harus langsung menghubungi admin Anda untuk mendapatkan namespace yang tepat. Setelah namespace yang valid disediakan, tombol Deploy harus diaktifkan untuk menyebarkan model.
-
-
Pilih Deploy dan tunggu Endpoint dibuat.
-
Setelah Endpoint dibuat, pilih Test inferensi.
Mengedit HyperPod penerapan
-
Di Amazon SageMaker Studio, pilih Compute dan kemudian HyperPodcluster dari panel navigasi kiri.
-
Di bawah Deployment, pilih penerapan HyperPod cluster yang ingin Anda modifikasi.
-
Dari ikon elipsis vertikal (), pilih Edit.
-
Di bawah Pengaturan Deployment, Anda dapat mengaktifkan atau menonaktifkan Penskalaan otomatis, dan mengubah jumlah replika Maks.
-
Pilih Simpan.
-
Status akan berubah menjadi Update. Setelah berubah kembali ke layanan In, perubahan Anda selesai dan Anda akan melihat pesan yang mengonfirmasinya.
Hapus HyperPod penerapan
-
Di Amazon SageMaker Studio, pilih Compute dan kemudian HyperPodcluster dari panel navigasi kiri.
-
Di bawah Deployment, pilih penerapan HyperPod cluster yang ingin Anda modifikasi.
-
Dari ikon elipsis vertikal (), pilih Hapus.
-
Di jendela Delete HyperPod deployment, pilih kotak centang.
-
Pilih Hapus.
-
Status akan berubah menjadi Menghapus. Setelah HyperPod penyebaran telah dihapus, Anda akan melihat pesan yang mengonfirmasinya.