Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Siapkan inferensi untuk model khusus
Setelah membuat model kustom, Anda dapat mengatur inferensi menggunakan salah satu opsi berikut:
-
Purchase Provisioned Throughput — Beli Throughput yang Disediakan untuk model Anda guna menyiapkan kapasitas komputasi khusus dengan throughput terjamin untuk kinerja yang konsisten dan latensi yang lebih rendah.
Untuk informasi selengkapnya tentang Provisioned Throughput, lihat. Tingkatkan kapasitas pemanggilan model dengan Provisioned Throughput di Amazon Bedrock Untuk informasi selengkapnya tentang penggunaan model kustom dengan Provisioned Throughput, lihat. Beli Throughput yang Disediakan untuk model kustom
-
Menerapkan model kustom untuk inferensi sesuai permintaan (hanya Amazon Nova model) — Untuk menyiapkan inferensi sesuai permintaan, Anda menerapkan model dengan penerapan model kustom. Setelah Anda menerapkan model, Anda memanggilnya menggunakan ARN untuk penerapan model kustom. Dengan inferensi sesuai permintaan, Anda hanya membayar untuk apa yang Anda gunakan dan Anda tidak perlu menyiapkan sumber daya komputasi yang disediakan.
Untuk informasi selengkapnya tentang penerapan model kustom untuk inferensi sesuai permintaan, lihat. Menerapkan model khusus untuk inferensi sesuai permintaan