View a markdown version of this page

Compatibilidad de API - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Compatibilidad de API

Amazon Bedrock admite tres familias de entornos de ejecución APIs, cada una diseñada para distintos patrones de integración y casos de uso.

Familia Invoke: InvokeModel gestiona llamadas sincrónicas de respuesta única. InvokeModelWithResponseStreamdevuelve las respuestas como una transmisión en tiempo real. InvokeModelWithBidirectionalStreampermite la transmisión dúplex completa para aplicaciones interactivas. AsyncInvokeenvía las solicitudes de larga duración de forma asíncrona y almacena los resultados en Amazon S3.

Familia Converse: Converse proporciona una interfaz unificada e independiente del modelo para conversaciones sincrónicas en varios turnos. ConverseStreamofrece la misma experiencia con la salida de streaming.

Familia compatible con OpenAI: implementa ChatCompletions la interfaz OpenAI Chat Completions, lo que permite que las integraciones existentes basadas en OpenAI se ejecuten en Bedrock con cambios mínimos. Responses La API implementa la interfaz de respuestas de OpenAI, que admite interacciones de agentes con estado con el uso de herramientas integradas y la administración del historial de conversaciones.

Ahora veremos la lista de los APIs compatibles con cada modelo.

AI21

Nombre de modelo Invocación Converse Finalización del chat Respuestas
Jamba 1.5 Large* Yes Yes No No
Jamba 1.5 Mini* Yes Yes No No

Amazon

Anthropic

Cohere

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas
Command R* Yes Yes No No
Command R+* Yes Yes No No
Embed English Yes No No No
Embed Multilingual Yes No No No
Incrustar v4 Yes No No No
Rerank 3.5 Yes No No No

DeepSeek

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas
DeepSeek V3.2* Yes Yes Yes No
DeepSeek-R1* Yes Yes No No
DeepSeek-V3.1* Yes Yes Yes No

Google

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas
Gemma 3 12B IT* Yes Yes Yes No
Gemma 3 27B PT* Yes Yes Yes No
Gemma 3 4B IT* Yes Yes Yes No

Meta

MiniMax

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas
MiniMax M2* Yes Yes Yes No
MiniMax M2.1* Yes Yes Yes No
MiniMax M2.5* Yes Yes Yes No

Mistral

Moonshot

Nombre de modelo Invocación Converse Finalización del chat Respuestas
Pensamiento de Kimi K2* Yes Yes No No
Kimi K2.5* Yes Yes Yes No

NVIDIA

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas
NVIDIA Nemotron Nano 9B v2* Yes Yes Yes No
NVIDIA Nemotron Nano 12B v2 VL BF16* Yes Yes Yes No
Nemotron Nano 3 30B* Yes Yes Yes No
NVIDIA Nemotron 3 Súper 120B* Yes Yes Yes No

OpenAI

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas
GPT OSS Safeguard 120B* Yes Yes Yes Yes
GPT OSS Safeguard 20B* Yes Yes Yes Yes
gpt-oss-120b* Yes Yes Yes Yes
gpt-oss-20b* Yes Yes Yes Yes

Qwen

Stability

TwelveLabs

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas
Marengo Embedd 3.0 Yes No No No
Marengo Embed v2.7 No No No No
Pegasus v1.2 Yes No No No

Escritor

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas
Palmyra Vision 7B Yes Yes Yes No
Palmyra X4* Yes Yes No No
Palmyra X5* Yes Yes No No

Z.AI

Nombre de modelo Invocación Converse Finalizaciones del chat Respuestas
GLM 4.7* Yes Yes Yes No
Flash GLM 4.7* Yes Yes Yes No
GLM 5* Yes Yes Yes No
nota

* Streaming Support: los modelos marcados con un asterisco (*) también son compatiblesInvokeModelWithResponseStream, lo que devuelve las respuestas como una transmisión en tiempo real.

Modelos compatibles StartAsyncInvoke

StartAsyncInvoke es una API de Amazon Bedrock Runtime que permite a las personas que llaman enviar una solicitud de invocación de modelo y recibir inmediatamente un InvocationARN sin esperar a que el modelo termine de procesarse. El trabajo se ejecuta en segundo plano y, una vez completado, el resultado se escribe en un bucket S3 especificado por la persona que llama. Luego, las personas que llamen pueden sondear el estado del trabajo utilizando el complemento y. GetAsyncInvoke ListAsyncInvokes APIs El patrón está diseñado específicamente para cargas de trabajo que implican entradas grandes o insensibles a la latencia, especialmente la generación de vídeo, audio e incrustaciones masivas, en las que no sería práctico mantener una conexión sincrónica abierta.

En cuanto a los modelos compatibles, son compatibles con los siguientes modelos: StartAsyncInvoke

  • TwelveLabs Marengo Embed 2.7 (twelvelabs.marengo-embed-2-7-v 1:0): necesario para la entrada de vídeo y audio; solo admite texto e imagen InvokeModel

  • TwelveLabs Marengo Embed 3.0 (twelvelabs.marengo-embed-3-0-v 1:0): mismo patrón; se requiere asincronización a escala video/audio

  • Amazon Nova Reel (amazon). nova-reel-v1:0 y v: 1:1): la generación de vídeo es exclusivamente asíncrona; la salida aterriza en S3

  • Incrustaciones multimodales de Amazon Nova (amazon.nova-2- multimodal-embeddings-v 1:0): se requiere asíncrona para entradas de vídeo de más de 25 MB codificadas en base64; la sincronización está disponible para entradas de texto, imágenes y documentos

InvokeModelWithBidirectionalStream

InvokeModelWithBidirectionalStreames una API de Amazon Bedrock Runtime que establece un canal dúplex completo y persistente entre la persona que llama y el modelo, lo que permite que los datos de audio fluyan en ambas direcciones de forma simultánea y continua. A diferencia de la InvokeModel versión estándar o incluso InvokeModelWithResponseStream APIs, que siguen un request-then-response patrón, esta API mantiene la conexión abierta durante toda la sesión para que el modelo pueda procesar el audio entrante a medida que llega y transmitir la voz generada prácticamente en tiempo real, sin esperar a que termine la expresión completa. La interacción se estructura en torno a tres fases: inicialización de la sesión (en la que el cliente envía eventos de configuración para configurar la transmisión), transmisión de audio (en la que el audio capturado se codifica y se envía como una transmisión de eventos continua) y transmisión de respuesta (en la que el modelo devuelve simultáneamente transcripciones textuales del discurso del usuario y la salida de audio sintetizada). InvokeModelWithBidirectionalStreamno se puede usar con las claves de API de Amazon Bedrock y requiere una autenticación estándar basada en credenciales de AWS, lo que refleja su ciclo de vida de sesión más complejo en comparación con otras operaciones de Bedrock Runtime.

Los siguientes modelos son compatibles con esta API:

  • Familia Amazon Nova Sonic: Ambas amazonas. nova-sonic-v1:0 y amazon.nova-2-sonic-v 1:0 la utilizan como única ruta de invocación, ya que la speech-to-speech arquitectura requiere fundamentalmente un canal bidireccional activo que ni Converse ni Converse pueden ofrecer. InvokeModel