Regiones y puntos finales compatibles Requisitos previos API de modelos API de respuestas API de finalización de chat

Genere respuestas utilizando OpenAI APIs

Amazon Bedrock proporciona puntos de enlace de API OpenAI compatibles para la inferencia de modelos, con la tecnología de Mantle, un motor de inferencia distribuido para el servicio de modelos de aprendizaje automático a gran escala. Estos puntos de enlace le permiten utilizar los modelos OpenAI SDKs y herramientas familiares de Amazon Bedrock, lo que le permite migrar las aplicaciones existentes con cambios de código mínimos; basta con actualizar la URL base y la clave de API.

También ofrece otras ventajas como las siguientes:

Inferencia asíncrona: Support para cargas de trabajo de inferencia de larga duración a través de la API de respuestas
Gestión de conversaciones avanzada: reconstruye automáticamente el contexto sin pasar manualmente el historial de conversaciones con cada solicitud
Uso simplificado de herramientas: integración optimizada para los flujos de trabajo de los agentes
Modos de respuesta flexibles: Support para respuestas de streaming y no streaming
Migración sencilla: compatible con las bases de código OpenAI del SDK existentes

Regiones y puntos finales compatibles

Amazon Bedrock está disponible en las siguientes AWS regiones:

Nombre de la región	Región	Punto de conexión
Este de EE. UU. (Ohio)	us-east-2	bedrock-mantle.us-east-2.api.aws
Este de EE. UU. (Norte de Virginia)	us-east-1	bedrock-mantle.us-east-1.api.aws
Oeste de EE. UU. (Oregón)	us-west-2	bedrock-mantle.us-west-2.api.aws
Asia-Pacífico (Yakarta)	ap-southeast-3	bedrock-mantle.ap-southeast-3.api.aws
Asia-Pacífico (Mumbai)	ap-south-1	bedrock-mantle.ap-south-1.api.aws
Asia-Pacífico (Tokio)	ap-northeast-1	bedrock-mantle.ap-northeast-1.api.aws
Europa (Fráncfort)	eu-central-1	bedrock-mantle.eu-central-1.api.aws
Europa (Irlanda)	eu-west-1	bedrock-mantle.eu-west-1.api.aws
Europa (Londres)	eu-west-2	bedrock-mantle.eu-west-2.api.aws
Europa (Milán)	eu-south-1	bedrock-mantle.eu-south-1.api.aws
Europa (Estocolmo)	eu-north-1	bedrock-mantle.eu-north-1.api.aws
América del Sur (São Paulo)	sa-east-1	bedrock-mantle.sa-east-1.api.aws

Requisitos previos

Antes de usarlo, asegúrese de tener lo siguiente: OpenAI APIs

Autenticación: puede autenticarse mediante:
- Clave de API de Amazon Bedrock (necesaria para el OpenAI SDK)
- AWScredenciales (compatibles con las solicitudes HTTP)
OpenAISDK (opcional): instala el SDK de OpenAI Python si utilizas solicitudes basadas en el SDK.
Variables de entorno: establece las siguientes variables de entorno:
- OPENAI_API_KEY— Configure su clave de API de Amazon Bedrock
- OPENAI_BASE_URL— Configúrelo en el punto final de Amazon Bedrock de su región (por ejemplo,https://bedrock-mantle.us-east-1.api.aws/v1)

API de modelos

La API de modelos te permite descubrir los modelos disponibles en Amazon Bedrock con tecnología Mantle. Use esta API para recuperar una lista de modelos que puede usar con la API de respuestas y la API de finalización de chats. Para obtener información completa sobre la API, consulta la documentación de OpenAI los modelos.

Enumere los modelos disponibles

Para ver una lista de los modelos disponibles, selecciona la pestaña del método que prefieras y, a continuación, sigue los pasos:

API de respuestas

La API de respuestas proporciona una gestión de conversaciones con estado y admite la transmisión, el procesamiento en segundo plano y las interacciones en varios turnos. Para obtener información completa sobre la API, consulta la documentación de OpenAIRespuestas.

Solicitud básica

Para crear una respuesta, selecciona la pestaña del método que prefieras y, a continuación, sigue estos pasos:

Transmita las respuestas

Para recibir los eventos de respuesta de forma incremental, elige la pestaña del método que prefieras y, a continuación, sigue estos pasos:

API de finalización de chat

La API Chat Completions genera respuestas conversacionales. Para obtener información completa sobre la API, consulta la documentación de OpenAIChat Completions.

Creación de una finalización de chat

Para crear un chat completo, elige la pestaña del método que prefieras y, a continuación, sigue estos pasos:

Habilitar la transmisión

Para recibir respuestas de forma incremental, selecciona la pestaña del método que prefieras y sigue los pasos:

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Almacenamiento en caché de peticiones

Inferencia en lotes: procesar varias peticiones