View a markdown version of this page

Kompatibilitas API - Amazon Bedrock

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Kompatibilitas API

Amazon Bedrock mendukung tiga keluarga runtime APIs, masing-masing dirancang untuk pola integrasi dan kasus penggunaan yang berbeda.

Keluarga panggilan: InvokeModel menangani panggilan respons tunggal yang sinkron. InvokeModelWithResponseStreammengembalikan respons sebagai aliran waktu nyata. InvokeModelWithBidirectionalStreammemungkinkan streaming dupleks penuh untuk aplikasi interaktif. AsyncInvokemengirimkan permintaan yang berjalan lama secara asinkron, menyimpan output ke Amazon S3.

Keluarga Converse: Converse menyediakan antarmuka model-agnostik terpadu untuk percakapan multi-putaran sinkron. ConverseStreammemberikan pengalaman yang sama dengan output streaming.

Keluarga yang kompatibel dengan OpenAI: ChatCompletions mengimplementasikan antarmuka Penyelesaian Obrolan OpenAI, memungkinkan integrasi berbasis OpenAI yang ada berjalan di Bedrock dengan sedikit perubahan. Responses API mengimplementasikan antarmuka OpenAI Responses, mendukung interaksi stateful dan agentic dengan penggunaan alat bawaan dan manajemen riwayat percakapan.

Kita sekarang akan melihat daftar yang APIs didukung oleh masing-masing model.

AI21

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons
Jamba 1.5 Besar* Yes Yes No No
Jamba 1.5 Mini* Yes Yes No No

Amazon

Antropik

Cohere

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons
Perintah R* Yes Yes No No
Perintah R +* Yes Yes No No
Sematkan Bahasa Inggris Yes No No No
Sematkan Multilingual Yes No No No
Sematkan v4 Yes No No No
Rerank 3.5 Yes No No No

DeepSeek

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons
DeepSeek V3.2* Yes Yes Yes No
DeepSeek-R1* Yes Yes No No
DeepSeek-V3.1* Yes Yes Yes No

Google

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons
Gemma 3 12B IT* Yes Yes Yes No
Gemma 3 27B PT* Yes Yes Yes No
Gemma 3 4B IT* Yes Yes Yes No

Meta

MiniMax

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons
MiniMax M2* Yes Yes Yes No
MiniMax M2.1* Yes Yes Yes No
MiniMax M2.5* Yes Yes Yes No

Mistral

Moonshot

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons
Kimi K2 Berpikir* Yes Yes No No
Kimi K2.5* Yes Yes Yes No

NVIDIA

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons
NVIDIA Nemotron Nano 9B v2* Yes Yes Yes No
NVIDIA Nemotron Nano 12B v2 VL BF16* Yes Yes Yes No
Nemotron Nano 3 30B* Yes Yes Yes No
NVIDIA Nemotron 3 Super 120B* Yes Yes Yes No

OpenAI

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons
GPT OSS Safeguard 120B* Yes Yes Yes Yes
GPT OSS Safeguard 20B* Yes Yes Yes Yes
gpt-oss-120b* Yes Yes Yes Yes
gpt-oss-20b* Yes Yes Yes Yes

Qwen

Stabilitas

TwelveLabs

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons
Marengo Sematkan 3.0 Yes No No No
Marengo Sematkan v2.7 No No No No
Pegasus v1.2 Yes No No No

Penulis

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons
Visi Palmyra 7B Yes Yes Yes No
Palmyra X4* Yes Yes No No
Palmyra X5* Yes Yes No No

Z.AI

Nama model Panggil Bercakap-cakap Penyelesaian Obrolan Respons
GLM 4,7* Yes Yes Yes No
GLM 4.7 Flash* Yes Yes Yes No
GLM 5* Yes Yes Yes No
catatan

* Dukungan Streaming: Model yang ditandai dengan tanda bintang (*) juga mendukungInvokeModelWithResponseStream, yang mengembalikan respons sebagai aliran waktu nyata.

Model yang mendukung StartAsyncInvoke

StartAsyncInvoke adalah Amazon Bedrock Runtime API yang memungkinkan penelepon mengirimkan permintaan pemanggilan model dan segera menerima kembali InvocationARN tanpa menunggu model selesai diproses. Pekerjaan berjalan di latar belakang, dan output ditulis ke bucket S3 yang ditentukan pemanggil setelah selesai. Penelepon kemudian dapat polling status pekerjaan menggunakan pendamping GetAsyncInvoke dan ListAsyncInvokes APIs. Pola ini dibuat khusus untuk beban kerja yang melibatkan input besar atau tidak sensitif latensi, terutama pembuatan video, audio, dan penyematan massal, di mana memegang koneksi sinkron terbuka tidak akan praktis.

Dalam hal model mana yang mendukungnya, model berikut mendukung StartAsyncInvoke:

  • TwelveLabs Marengo Embed 2.7 (twelvelabs.marengo-embed-2-7-v 1:0) - diperlukan untuk input video dan audio; hanya menangani teks dan gambar InvokeModel

  • TwelveLabs Marengo Embed 3.0 (twelvelabs.marengo-embed-3-0-v 1:0) - pola yang sama; async diperlukan untuk skala video/audio

  • Amazon Nova Reel (amazon. nova-reel-v1:0 dan v 1:1) - pembuatan video secara eksklusif asinkron; output mendarat di S3

  • Amazon Nova Multimodal Embeddings (amazon.nova-2- multimodal-embeddings-v 1:0) - async diperlukan untuk input video yang lebih besar dari 25MB base64 yang dikodekan; sinkronisasi tersedia untuk input teks, gambar, dan dokumen

InvokeModelWithBidirectionalStream

InvokeModelWithBidirectionalStreamadalah Amazon Bedrock Runtime API yang membuat saluran dupleks penuh persisten antara pemanggil dan model, memungkinkan data audio mengalir di kedua arah secara bersamaan dan terus menerus. Berbeda dengan standar InvokeModel atau bahkan InvokeModelWithResponseStream APIs, yang mengikuti request-then-response pola, API ini membuat koneksi tetap terbuka selama sesi sehingga model dapat memproses audio yang masuk saat tiba dan mengalirkan ucapan yang dihasilkan kembali dalam waktu dekat, tanpa menunggu ucapan lengkap selesai. Interaksi disusun sekitar tiga fase: inisialisasi sesi (di mana klien mengirim peristiwa konfigurasi untuk mengatur aliran), streaming audio (di mana audio yang diambil dikodekan dan dikirim sebagai aliran peristiwa berkelanjutan), dan streaming respons (di mana model secara bersamaan mengembalikan transkripsi teks ucapan pengguna dan output audio yang disintesis). InvokeModelWithBidirectionalStreamtidak dapat digunakan dengan kunci Amazon Bedrock API dan memerlukan otentikasi berbasis kredensil AWS standar, yang mencerminkan siklus hidup sesi yang lebih kompleks dibandingkan dengan operasi Runtime Bedrock lainnya.

Model berikut mendukung API ini:

  • Keluarga Amazon Nova Sonic: Keduanya amazon. nova-sonic-v1:0 dan amazon.nova-2-sonic-v 1:0 menggunakannya sebagai satu-satunya jalur pemanggilan mereka, karena speech-to-speech arsitektur pada dasarnya memerlukan saluran dua arah langsung yang tidak dapat disediakan oleh Converse atau Converse. InvokeModel