Régions et points de terminaison pris en charge Conditions préalables API de modèles API de réponses API de complétion des discussions

Générez des réponses en utilisant OpenAI APIs

Amazon Bedrock fournit des points de terminaison d'API OpenAI compatibles pour l'inférence de modèles, alimentés par Mantle, un moteur d'inférence distribué destiné à la diffusion de modèles d'apprentissage automatique à grande échelle. Ces points de terminaison vous permettent d'utiliser les outils que vous connaissez déjà avec OpenAI SDKs les modèles Amazon Bedrock, ce qui vous permet de migrer des applications existantes avec un minimum de modifications de code. Il vous suffit de mettre à jour votre URL de base et votre clé d'API.

Les principaux avantages sont les suivants :

Inférence asynchrone — Support pour les charges de travail d'inférence de longue durée via l'API Responses
Gestion dynamique des conversations : reconstruisez automatiquement le contexte sans transmettre manuellement l'historique des conversations à chaque demande
Utilisation simplifiée des outils — Intégration rationalisée pour les flux de travail agentiques
Modes de réponse flexibles — Support pour les réponses en streaming et hors streaming
Migration facile — Compatible avec les bases de OpenAI code SDK existantes

Régions et points de terminaison pris en charge

Amazon Bedrock est disponible dans les AWS régions suivantes :

Nom de la région	Région	Endpoint
USA Est (Ohio)	us-east-2	bedrock-mantle.us-east-2.api.aws
USA Est (Virginie du Nord)	us-east-1	bedrock-mantle.us-east-1.api.aws
USA Ouest (Oregon)	us-west-2	bedrock-mantle.us-west-2.api.aws
Asie-Pacifique (Jakarta)	ap-southeast-3	bedrock-mantle.ap-southeast-3.api.aws
Asie-Pacifique (Mumbai)	ap-south-1	bedrock-mantle.ap-south-1.api.aws
Asie-Pacifique (Tokyo)	ap-northeast-1	bedrock-mantle.ap-northeast-1.api.aws
Europe (Francfort)	eu-central-1	bedrock-mantle.eu-central-1.api.aws
Europe (Irlande)	eu-west-1	bedrock-mantle.eu-west-1.api.aws
Europe (Londres)	eu-west-2	bedrock-mantle.eu-west-2.api.aws
Europe (Milan)	eu-south-1	bedrock-mantle.eu-south-1.api.aws
Europe (Stockholm)	eu-north-1	bedrock-mantle.eu-north-1.api.aws
Amérique du Sud (São Paulo)	sa-east-1	bedrock-mantle.sa-east-1.api.aws

Conditions préalables

Avant de l'utiliser OpenAI APIs, assurez-vous de disposer des éléments suivants :

Authentification — Vous pouvez vous authentifier en utilisant :
- Clé d'API Amazon Bedrock (requise pour le OpenAI SDK)
- AWSinformations d'identification (prises en charge pour les requêtes HTTP)
OpenAISDK (facultatif) — Installez le SDK OpenAI Python si vous utilisez des requêtes basées sur le SDK.
Variables d'environnement : définissez les variables d'environnement suivantes :
- OPENAI_API_KEY— Réglé sur votre clé d'API Amazon Bedrock
- OPENAI_BASE_URL— Définissez le point de terminaison Amazon Bedrock de votre région (par exemple,https://bedrock-mantle.us-east-1.api.aws/v1)

API de modèles

L'API Models vous permet de découvrir les modèles disponibles dans Amazon Bedrock propulsé par Mantle. Utilisez cette API pour récupérer une liste de modèles que vous pouvez utiliser avec l'API Responses et l'API Chat Completions. Pour obtenir des informations complètes sur l'API, consultez la documentation sur OpenAI les modèles.

Liste des modèles disponibles

Pour répertorier les modèles disponibles, choisissez l'onglet correspondant à votre méthode préférée, puis suivez les étapes suivantes :

API de réponses

L'API Responses fournit une gestion dynamique des conversations avec prise en charge du streaming, du traitement en arrière-plan et des interactions à plusieurs tours. Pour obtenir des informations complètes sur l'API, consultez la documentation sur OpenAI les réponses.

Demande de base

Pour créer une réponse, choisissez l'onglet correspondant à votre méthode préférée, puis suivez les étapes suivantes :

Diffusez les réponses

Pour recevoir les événements de réponse de manière incrémentielle, choisissez l'onglet correspondant à votre méthode préférée, puis suivez les étapes suivantes :

API de complétion des discussions

L'API Chat Completions génère des réponses conversationnelles. Pour obtenir des informations complètes sur l'API, consultez la documentation OpenAI Chat Completions.

Create a chat completion

Pour terminer une discussion, choisissez l'onglet correspondant à votre méthode préférée, puis suivez les étapes suivantes :

Activer le streaming

Pour recevoir des réponses de manière incrémentielle, choisissez l'onglet correspondant à votre méthode préférée, puis suivez les étapes suivantes :

Avertissement JavaScript est désactivé ou n'est pas disponible dans votre navigateur.

Pour que vous puissiez utiliser la documentation AWS, Javascript doit être activé. Vous trouverez des instructions sur les pages d'aide de votre navigateur.

Conventions de rédaction

Mise en cache des invites

Inférence par lots : traitement de plusieurs invites