Regioni ed endpoint supportati Prerequisiti Modelli (API)API di risposta API per il completamento della chat

Genera risposte utilizzando OpenAI APIs

Amazon Bedrock fornisce endpoint API OpenAI compatibili per l'inferenza dei modelli, con tecnologia Mantle, un motore di inferenza distribuito per la creazione di modelli di machine learning su larga scala. Questi endpoint ti consentono di utilizzare strumenti familiari con i modelli Amazon Bedrock, consentendoti di migrare le applicazioni esistenti con modifiche OpenAI SDKs minime al codice: è sufficiente aggiornare l'URL di base e la chiave API.

I vantaggi principali includono:

Inferenza asincrona: supporto per carichi di lavoro di inferenza a lunga durata tramite l'API Responses
Gestione delle conversazioni con stato: ricostruisci automaticamente il contesto senza passare manualmente la cronologia delle conversazioni ad ogni richiesta
Utilizzo semplificato degli strumenti: integrazione semplificata per flussi di lavoro agentici
Modalità di risposta flessibili: supporto per risposte in streaming e non in streaming
Migrazione semplice: compatibile con le basi di codice OpenAI SDK esistenti

Regioni ed endpoint supportati

Amazon Bedrock è disponibile nelle seguenti AWS regioni:

Nome della regione	Regione	Endpoint
Stati Uniti orientali (Ohio)	us-east-2	bedrock-mantle.us-east-2.api.aws
Stati Uniti orientali (Virginia settentrionale)	us-east-1	bedrock-mantle.us-east-1.api.aws
Stati Uniti occidentali (Oregon)	us-west-2	bedrock-mantle.us-west-2.api.aws
Asia Pacifico (Giacarta)	ap-southeast-3	bedrock-mantle.ap-southeast-3.api.aws
Asia Pacifico (Mumbai)	ap-south-1	bedrock-mantle.ap-south-1.api.aws
Asia Pacifico (Tokyo)	ap-northeast-1	bedrock-mantle.ap-northeast-1.api.aws
Europa (Francoforte)	eu-central-1	bedrock-mantle.eu-central-1.api.aws
Europa (Irlanda)	eu-west-1	bedrock-mantle.eu-west-1.api.aws
Europe (London)	eu-west-2	bedrock-mantle.eu-west-2.api.aws
Europe (Milan)	eu-south-1	bedrock-mantle.eu-south-1.api.aws
Europa (Stoccolma)	eu-north-1	bedrock-mantle.eu-north-1.api.aws
Sud America (San Paolo)	sa-east-1	bedrock-mantle.sa-east-1.api.aws

Prerequisiti

Prima dell'uso, assicurati di avere quanto segue: OpenAI APIs

Autenticazione: puoi autenticarti utilizzando:
- Chiave API Amazon Bedrock (richiesta per OpenAI SDK)
- AWS credenziali (supportate per le richieste HTTP)
OpenAISDK (opzionale): installa l'SDK OpenAI Python se utilizzi richieste basate su SDK.
Variabili di ambiente: imposta le seguenti variabili di ambiente:
- OPENAI_API_KEY— Imposta sulla tua chiave API Amazon Bedrock
- OPENAI_BASE_URL— Impostato sull'endpoint Amazon Bedrock per la tua regione (ad esempio,) https://bedrock-mantle.us-east-1.api.aws/v1

Modelli (API)

L'API Models ti consente di scoprire i modelli disponibili in Amazon Bedrock con tecnologia Mantle. Usa questa API per recuperare un elenco di modelli che puoi utilizzare con l'API Responses e l'API Chat Completions. Per i dettagli completi sull'API, consulta la documentazione dei OpenAImodelli.

Elenca i modelli disponibili

Per elencare i modelli disponibili, scegli la scheda corrispondente al metodo che preferisci, quindi segui i passaggi:

API di risposta

L'API Responses fornisce una gestione statica delle conversazioni con supporto per lo streaming, l'elaborazione in background e le interazioni a turni multipli. Per i dettagli completi sull'API, consulta la documentazione di ResponsesOpenAI.

Richiesta di base

Per creare una risposta, scegli la scheda corrispondente al metodo che preferisci, quindi segui i passaggi:

Risposte in streaming

Per ricevere gli eventi di risposta in modo incrementale, scegli la scheda corrispondente al tuo metodo preferito, quindi segui i passaggi:

API per il completamento della chat

L'API Chat Completions genera risposte conversazionali. Per i dettagli completi sull'API, consulta la documentazione OpenAIChat Completions.

Creare un completamento di chat

Per creare il completamento di una chat, scegli la scheda corrispondente al metodo che preferisci, quindi segui i passaggi:

Abilita lo streaming

Per ricevere le risposte in modo incrementale, scegli la scheda corrispondente al metodo che preferisci, quindi segui i passaggi:

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Inferenza ottimizzata per la latenza

Inferenza utilizzando Bedrock APIs