View a markdown version of this page

Menyebarkan model di Studio - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menyebarkan model di Studio

Untuk menerapkan model JumpStart foundation, navigasikan ke kartu detail model di UI Studio. Untuk informasi selengkapnya tentang cara membuka JumpStart di Studio, lihatBuka JumpStart di Studio. Setelah menavigasi ke halaman detail model pilihan Anda, pilih Deploy di sudut kanan atas UI Studio. Kemudian, ikuti langkah-langkah di Deploy model dengan SageMaker Studio.

Amazon SageMaker JumpStart juga menawarkan penerapan yang dioptimalkan, yang menyediakan konfigurasi penerapan yang telah ditentukan sebelumnya yang dirancang untuk kasus penggunaan tertentu seperti pembuatan konten, ringkasan, atau interaksi gaya obrolan. Saat menerapkan model yang didukung, Anda dapat memilih kasus penggunaan target dan memilih pengoptimalan batasan — Dioptimalkan biaya, Throughput dioptimalkan, dioptimalkan Latensi, atau Seimbang — dan Amazon SageMaker JumpStart secara otomatis mengonfigurasi titik akhir untuk skenario tersebut. Ini memberi Anda visibilitas ke metrik kinerja utama seperti latensi P50, time-to-first-token (TTFT), dan throughput, sambil memastikan penerapan disetel untuk beban kerja Anda. Untuk memulai, buka halaman detail model yang didukung di Studio, pilih Deploy, dan gunakan panel Performance untuk mengonfigurasi penerapan yang dioptimalkan.

penting

Beberapa model dasar memerlukan penerimaan eksplisit dari perjanjian lisensi pengguna akhir (EULA) sebelum penerapan. Untuk informasi selengkapnya, lihat Penerimaan EULA di Amazon Studio SageMaker.