Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Compatibilidad de API
Amazon Bedrock admite tres familias de entornos de ejecución APIs, cada una diseñada para distintos patrones de integración y casos de uso.
Familia Invoke: InvokeModel gestiona llamadas sincrónicas de respuesta única. InvokeModelWithResponseStreamdevuelve las respuestas como una transmisión en tiempo real. InvokeModelWithBidirectionalStreampermite la transmisión dúplex completa para aplicaciones interactivas. AsyncInvokeenvía las solicitudes de larga duración de forma asíncrona y almacena los resultados en Amazon S3.
Familia Converse: Converse proporciona una interfaz unificada e independiente del modelo para conversaciones sincrónicas en varios turnos. ConverseStreamofrece la misma experiencia con la salida de streaming.
Familia compatible con OpenAI: implementa ChatCompletions la interfaz OpenAI Chat Completions, lo que permite que las integraciones existentes basadas en OpenAI se ejecuten en Bedrock con cambios mínimos. Responses La API implementa la interfaz de respuestas de OpenAI, que admite interacciones de agentes con estado con el uso de herramientas integradas y la administración del historial de conversaciones.
Ahora veremos la lista de los APIs compatibles con cada modelo.
AI21
| Nombre de modelo | Invocación | Converse | Finalización del chat | Respuestas |
|---|---|---|---|---|
| Jamba 1.5 Large* |
|
|
|
|
| Jamba 1.5 Mini* |
|
|
|
|
Amazon
| Nombre de modelo | Invocación | Converse | Finalizaciones del chat | Respuestas |
|---|---|---|---|---|
| Incrustaciones multimodales de Amazon Nova |
|
|
|
|
| Nova 2 Lite* |
|
|
|
|
| Nova 2 Sonic |
|
|
|
|
| Nova Canvas |
|
|
|
|
| Nova Lite* |
|
|
|
|
| Nova Micro* |
|
|
|
|
| Nova Premier* |
|
|
|
|
| Nova Pro* |
|
|
|
|
| Nova Reel |
|
|
|
|
| Nova Sonic* |
|
|
|
|
| Titan Embeddings G1 - Text |
|
|
|
|
| Titan Image Generator G1 v2 |
|
|
|
|
| Titan Multimodal Embeddings G1 |
|
|
|
|
| Titan Text Embeddings V2 |
|
|
|
|
| Titan Text Large |
|
|
|
|
Anthropic
| Nombre de modelo | Invocación | Converse | Finalizaciones del chat | Respuestas |
|---|---|---|---|---|
| Claude 3 Haiku* |
|
|
|
|
| Claude 3.5 Haiku* |
|
|
|
|
| Claude Haiku 4.5* |
|
|
|
|
| Claude Opus 4.1* |
|
|
|
|
| Claude Opus 4.5* |
|
|
|
|
| Claude Opus 4.6* |
|
|
|
|
| Claude Sonnet 4* |
|
|
|
|
| Soneto Claude 4.5* |
|
|
|
|
| Soneto Claude 4.6* |
|
|
|
|
Cohere
| Nombre de modelo | Invocación | Converse | Finalizaciones del chat | Respuestas |
|---|---|---|---|---|
| Command R* |
|
|
|
|
| Command R+* |
|
|
|
|
| Embed English |
|
|
|
|
| Embed Multilingual |
|
|
|
|
| Incrustar v4 |
|
|
|
|
| Rerank 3.5 |
|
|
|
|
DeepSeek
| Nombre de modelo | Invocación | Converse | Finalizaciones del chat | Respuestas |
|---|---|---|---|---|
| DeepSeek V3.2* |
|
|
|
|
| DeepSeek-R1* |
|
|
|
|
| DeepSeek-V3.1* |
|
|
|
|
| Nombre de modelo | Invocación | Converse | Finalizaciones del chat | Respuestas |
|---|---|---|---|---|
| Gemma 3 12B IT* |
|
|
|
|
| Gemma 3 27B PT* |
|
|
|
|
| Gemma 3 4B IT* |
|
|
|
|
Meta
| Nombre de modelo | Invocación | Converse | Finalizaciones del chat | Respuestas |
|---|---|---|---|---|
| Llama 3 70B Instruct* |
|
|
|
|
| Llama 3 8B Instruct* |
|
|
|
|
| Llama 3.1 405B Instruct |
|
|
|
|
| Llama 3.1 70B Instruct* |
|
|
|
|
| Llama 3.1 8B Instruct* |
|
|
|
|
| Llama 3.2 11B Instruct* |
|
|
|
|
| Llama 3.2 1B Instruct* |
|
|
|
|
| Llama 3.2 3B Instruct* |
|
|
|
|
| Llama 3.2 90B Instruct* |
|
|
|
|
| Llama 3.3 70B Instruct* |
|
|
|
|
| Llama 4 Maverick 17B Instruct* |
|
|
|
|
| Llama 4 Scout 17B Instruct* |
|
|
|
|
MiniMax
| Nombre de modelo | Invocación | Converse | Finalizaciones del chat | Respuestas |
|---|---|---|---|---|
| MiniMax M2* |
|
|
|
|
| MiniMax M2.1* |
|
|
|
|
| MiniMax M2.5* |
|
|
|
|
Mistral
| Nombre de modelo | Invocación | Converse | Finalizaciones del chat | Respuestas |
|---|---|---|---|---|
| Devstral 2 123 GB* |
|
|
|
|
| Magistral Small 2509* |
|
|
|
|
| Ministral 14B 3.0* |
|
|
|
|
| Ministral 3 8B* |
|
|
|
|
| Ministerial 3B* |
|
|
|
|
| Mistral 7B Instruct* |
|
|
|
|
| Mistral Grande* |
|
|
|
|
| Mistral Large 3* |
|
|
|
|
| Mistral Pequeño* |
|
|
|
|
| Mixtral 8x7B Instruct* |
|
|
|
|
| Pixtral Large* |
|
|
|
|
| Voxtral Mini 3B 2507* |
|
|
|
|
| Voxtral Pequeño 24B 2507* |
|
|
|
|
Moonshot
| Nombre de modelo | Invocación | Converse | Finalización del chat | Respuestas |
|---|---|---|---|---|
| Pensamiento de Kimi K2* |
|
|
|
|
| Kimi K2.5* |
|
|
|
|
NVIDIA
| Nombre de modelo | Invocación | Converse | Finalizaciones del chat | Respuestas |
|---|---|---|---|---|
| NVIDIA Nemotron Nano 9B v2* |
|
|
|
|
| NVIDIA Nemotron Nano 12B v2 VL BF16* |
|
|
|
|
| Nemotron Nano 3 30B* |
|
|
|
|
| NVIDIA Nemotron 3 Súper 120B* |
|
|
|
|
OpenAI
| Nombre de modelo | Invocación | Converse | Finalizaciones del chat | Respuestas |
|---|---|---|---|---|
| GPT OSS Safeguard 120B* |
|
|
|
|
| GPT OSS Safeguard 20B* |
|
|
|
|
| gpt-oss-120b* |
|
|
|
|
| gpt-oss-20b* |
|
|
|
|
Qwen
| Nombre de modelo | Invocación | Converse | Finalización del chat | Respuestas |
|---|---|---|---|---|
| Qwen3 235 B A2 B 2507* |
|
|
|
|
| Qwen3 32B* |
|
|
|
|
| Codificador Qwen3 480B A35B Instruct* |
|
|
|
|
| Qwen3 Coder Next* |
|
|
|
|
| Qwen3 Next 80B A3B* |
|
|
|
|
| Qwen3 VL 235B A22B* |
|
|
|
|
| Codificador Qwen3-30B-A3B-Instruct* |
|
|
|
|
Stability
TwelveLabs
| Nombre de modelo | Invocación | Converse | Finalizaciones del chat | Respuestas |
|---|---|---|---|---|
| Marengo Embedd 3.0 |
|
|
|
|
| Marengo Embed v2.7 |
|
|
|
|
| Pegasus v1.2 |
|
|
|
|
Escritor
| Nombre de modelo | Invocación | Converse | Finalizaciones del chat | Respuestas |
|---|---|---|---|---|
| Palmyra Vision 7B |
|
|
|
|
| Palmyra X4* |
|
|
|
|
| Palmyra X5* |
|
|
|
|
Z.AI
| Nombre de modelo | Invocación | Converse | Finalizaciones del chat | Respuestas |
|---|---|---|---|---|
| GLM 4.7* |
|
|
|
|
| Flash GLM 4.7* |
|
|
|
|
| GLM 5* |
|
|
|
|
nota
* Streaming Support: los modelos marcados con un asterisco (*) también son compatiblesInvokeModelWithResponseStream, lo que devuelve las respuestas como una transmisión en tiempo real.
Modelos compatibles StartAsyncInvoke
StartAsyncInvoke es una API de Amazon Bedrock Runtime que permite a las personas que llaman enviar una solicitud de invocación de modelo y recibir inmediatamente un InvocationARN sin esperar a que el modelo termine de procesarse. El trabajo se ejecuta en segundo plano y, una vez completado, el resultado se escribe en un bucket S3 especificado por la persona que llama. Luego, las personas que llamen pueden sondear el estado del trabajo utilizando el complemento y. GetAsyncInvoke ListAsyncInvokes APIs El patrón está diseñado específicamente para cargas de trabajo que implican entradas grandes o insensibles a la latencia, especialmente la generación de vídeo, audio e incrustaciones masivas, en las que no sería práctico mantener una conexión sincrónica abierta.
En cuanto a los modelos compatibles, son compatibles con los siguientes modelos: StartAsyncInvoke
-
TwelveLabs Marengo Embed 2.7 (twelvelabs.marengo-embed-2-7-v 1:0): necesario para la entrada de vídeo y audio; solo admite texto e imagen InvokeModel
-
TwelveLabs Marengo Embed 3.0 (twelvelabs.marengo-embed-3-0-v 1:0): mismo patrón; se requiere asincronización a escala video/audio
-
Amazon Nova Reel (amazon). nova-reel-v1:0 y v: 1:1): la generación de vídeo es exclusivamente asíncrona; la salida aterriza en S3
-
Incrustaciones multimodales de Amazon Nova (amazon.nova-2- multimodal-embeddings-v 1:0): se requiere asíncrona para entradas de vídeo de más de 25 MB codificadas en base64; la sincronización está disponible para entradas de texto, imágenes y documentos
InvokeModelWithBidirectionalStream
InvokeModelWithBidirectionalStreames una API de Amazon Bedrock Runtime que establece un canal dúplex completo y persistente entre la persona que llama y el modelo, lo que permite que los datos de audio fluyan en ambas direcciones de forma simultánea y continua. A diferencia de la InvokeModel versión estándar o incluso InvokeModelWithResponseStream APIs, que siguen un request-then-response patrón, esta API mantiene la conexión abierta durante toda la sesión para que el modelo pueda procesar el audio entrante a medida que llega y transmitir la voz generada prácticamente en tiempo real, sin esperar a que termine la expresión completa. La interacción se estructura en torno a tres fases: inicialización de la sesión (en la que el cliente envía eventos de configuración para configurar la transmisión), transmisión de audio (en la que el audio capturado se codifica y se envía como una transmisión de eventos continua) y transmisión de respuesta (en la que el modelo devuelve simultáneamente transcripciones textuales del discurso del usuario y la salida de audio sintetizada). InvokeModelWithBidirectionalStreamno se puede usar con las claves de API de Amazon Bedrock y requiere una autenticación estándar basada en credenciales de AWS, lo que refleja su ciclo de vida de sesión más complejo en comparación con otras operaciones de Bedrock Runtime.
Los siguientes modelos son compatibles con esta API:
-
Familia Amazon Nova Sonic: Ambas amazonas. nova-sonic-v1:0 y amazon.nova-2-sonic-v 1:0 la utilizan como única ruta de invocación, ya que la speech-to-speech arquitectura requiere fundamentalmente un canal bidireccional activo que ni Converse ni Converse pueden ofrecer. InvokeModel