View a markdown version of this page

Algoritma, kerangka kerja, dan instance yang didukung untuk titik akhir multi-model - Amazon SageMaker AI

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Algoritma, kerangka kerja, dan instance yang didukung untuk titik akhir multi-model

Untuk informasi tentang algoritme, kerangka kerja, dan jenis instance yang dapat Anda gunakan dengan titik akhir multi-model, lihat bagian berikut.

Algoritme, kerangka kerja, dan instance yang didukung untuk titik akhir multi-model menggunakan instance yang didukung CPU

Wadah inferensi untuk algoritme dan kerangka kerja berikut mendukung titik akhir multi-model:

Untuk menggunakan kerangka kerja atau algoritme lain, gunakan toolkit inferensi SageMaker AI untuk membangun wadah yang mendukung titik akhir multi-model. Untuk informasi, lihat Bangun Container Anda Sendiri untuk SageMaker Titik Multi-Model Akhir AI.

Multi-model endpoint mendukung semua jenis instance CPU.

Algoritme, kerangka kerja, dan instance yang didukung untuk titik akhir multi-model menggunakan instans yang didukung GPU

Hosting beberapa model yang didukung GPU pada titik akhir multi-model didukung melalui server SageMaker AI Triton Inference. Ini mendukung semua kerangka inferensi utama seperti NVIDIA® TensorRT™,, PyTorch MXNet, Python, ONNX, XGBoost, scikit-learn,, OpenVINO, kustom C++, dan banyak lagi. RandomForest

Untuk menggunakan kerangka kerja atau algoritma lain, Anda dapat menggunakan backend Triton untuk Python atau C ++ untuk menulis logika model Anda dan melayani model kustom apa pun. Setelah server siap, Anda dapat mulai menerapkan 100-an model Deep Learning di belakang satu titik akhir.

Multi-model endpoint mendukung jenis instans GPU berikut:

Keluarga instans Tipe instans vCPUs GiB memori per vCPU GPU Memori GPU

p2

ml.p2.xlarge

4

15.25

1

12

p3

ml.p3.2xlarge

8

7.62

1

16

g5

ml.g5.xlarge

4

4

1

24

g5

ml.g5.2xbesar

8

4

1

24

g5

ml.g5.4xbesar

16

4

1

24

g5

ml.g5.8xbesar

32

4

1

24

g5

ml.g5.16xbesar

64

4

1

24

g4dn

ml.g4dn.xlarge

4

4

1

16

g4dn

ml.g4dn.2xbesar

8

4

1

16

g4dn

ml.g4dn.4xbesar

16

4

1

16

g4dn

ml.g4dn.8xlarge

32

4

1

16

g4dn

ml.g4dn.16xlarge

64

4

1

16