Menyebarkan model pondasi dan model yang disesuaikan khusus - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Menyebarkan model pondasi dan model yang disesuaikan khusus

Baik Anda menerapkan bobot terbuka atau model terjaga keamanannya yang telah dilatih sebelumnya dari Amazon atau model kustom SageMaker JumpStart atau penyesuaian Anda sendiri yang disimpan di Amazon S3 atau FSx Amazon SageMaker HyperPod , menyediakan infrastruktur fleksibel dan skalabel yang Anda perlukan untuk beban kerja inferensi produksi.

Menyebarkan model pondasi berbobot terbuka dan terjaga keamanannya dari JumpStart Terapkan model kustom dan fine-tuned dari Amazon S3 dan Amazon FSx
Deskripsi

Terapkan dari katalog komprehensif model pondasi pra-terlatih dengan kebijakan pengoptimalan dan penskalaan otomatis yang disesuaikan dengan setiap keluarga model.

Bawa model Anda sendiri yang disesuaikan dan disesuaikan serta manfaatkan infrastruktur SageMaker HyperPod perusahaan untuk inferensi skala produksi. Pilih antara penyimpanan hemat biaya dengan Amazon S3 atau sistem file berkinerja tinggi dengan Amazon. FSx
Manfaat utama
  • Penerapan satu klik melalui Amazon Studio UI SageMaker

  • Penskalaan otomatis berdasarkan permintaan masuk diaktifkan secara otomatis

  • Kontainer dan konfigurasi yang telah dioptimalkan sebelumnya untuk setiap keluarga model

  • Penanganan EULA untuk model terjaga keamanannya

  • Dukungan untuk beberapa backend penyimpanan: Amazon S3, Amazon FSx

  • Kontainer fleksibel dan dukungan kerangka kerja

  • Kebijakan penskalaan khusus berdasarkan karakteristik model Anda

Opsi penyebaran
  • Amazon SageMaker Studio untuk penyebaran visual

  • kubectl untuk operasi asli Kubernetes

  • Python SDK untuk integrasi terprogram

  • HyperPod CLI untuk otomatisasi baris perintah

  • kubectl untuk operasi asli Kubernetes

  • Python SDK untuk integrasi terprogram

  • HyperPod CLI untuk otomatisasi baris perintah

Bagian berikut mengarahkan Anda melalui penerapan model dari Amazon SageMaker JumpStart dan dari Amazon S3 dan Amazon. FSx