Conclusões de bate-papo com o endpoint Bedrock-mantle Conclusões de bate-papo com o endpoint de tempo de execução básico Inclua uma grade de proteção

Inferência usando a API de conclusão de bate-papo

A API OpenAI Chat Completions gera respostas conversacionais usando os modelos Amazon Bedrock. Você pode usar a API Chat Completions nos bedrock-runtime endpoints bedrock-mantle e nos endpoints. Recomendamos usar o bedrock-mantle endpoint sempre que possível. Para obter detalhes completos da API, consulte a documentação de conclusão de OpenAI bate-papo.

Endpoint	URL base	Autenticação
`bedrock-mantle` (recomendado)	`https://bedrock-mantle.{region}.api.aws/v1/chat/completions`	Chave ou AWS credenciais da API Amazon Bedrock
`bedrock-runtime`	`https://bedrock-runtime.{region}.amazonaws.com/v1/chat/completions`	AWS credenciais (SigV4) ou chave de API Amazon Bedrock

Cada endpoint tem suas próprias cotas de token por modelo. Para obter detalhes sobre as cotas aplicadas ao tráfego em cada endpoint, consulte e. Cotas para o endpoint rocho-mantle Cotas para o endpoint de tempo de execução básico

Conclusões de bate-papo com o endpoint Bedrock-mantle

O bedrock-mantle endpoint oferece suporte à autenticação de chave da API Amazon Bedrock e ao OpenAI SDK.

Listar modelos disponíveis

Para listar os modelos disponíveis no bedrock-mantle endpoint, escolha a guia do seu método preferido e siga as etapas:

Criar um preenchimento de chat

Escolha a guia correspondente ao método de sua preferência e siga as etapas:

Streaming

Para receber respostas incrementalmente, escolha a guia do seu método preferido e siga as etapas:

Conclusões de bate-papo com o endpoint de tempo de execução básico

O bedrock-runtime endpoint oferece suporte à autenticação AWS SigV4 e à autenticação de chave de API Amazon Bedrock.

Listar modelos disponíveis

Para listar os modelos disponíveis no bedrock-runtime endpoint, escolha a guia do seu método preferido e siga as etapas:

Criar um preenchimento de chat

Escolha a guia correspondente ao método de sua preferência e siga as etapas:

Para obter mais detalhes sobre modelos, regiões e recursos avançados compatíveis com o bedrock-runtime endpoint, consulteAPI de conclusão de bate-papo (referência antiga).

Incluir uma barreira de proteção em um preenchimento de chat

Para incluir proteções na entrada e nas respostas do modelo, aplique uma barreira de proteção ao executar a invocação do modelo incluindo os seguintes parâmetros extras como campos no corpo da solicitação:

extra_headers: está associado a um objeto que conte´m os seguintes campos, que especificam cabeçalhos extras na solicitação:
- X-Amzn-Bedrock-GuardrailIdentifier: (obrigatório) o ID da barreira de proteção.
- X-Amzn-Bedrock-GuardrailVersion: (obrigatório) a versão da barreira de proteção.
- X-Amzn-Bedrock-Trace: (opcional) se é necessário ou não habilitar o rastreamento da barreira de proteção.
extra_body: está associado a um objeto. Nesse objeto, você pode incluir o campo amazon-bedrock-guardrailConfig, que está associado a um objeto que contém os seguintes campos:
- tagSuffix: (opcional) inclua esse campo para marcação de entrada.

Para ter mais informações sobre esses parâmetros nas Barreiras de Proteção do Amazon Bedrock, consulte Testar uma barreira de proteção.

Para ver exemplos de uso de barreiras de proteção com preenchimentos de chat da OpenAI, escolha a guia correspondente ao método de sua preferência e siga as etapas:

OpenAI SDK (Python)


import openai
from openai import OpenAIError

# Endpoint for Amazon Bedrock Runtime
bedrock_endpoint = "https://bedrock-runtime.us-west-2.amazonaws.com/openai/v1"

# Model ID
model_id = "openai.gpt-oss-20b-1:0"

# Replace with actual values
bedrock_api_key = "$AWS_BEARER_TOKEN_BEDROCK"
guardrail_id = "GR12345"
guardrail_version = "DRAFT"

client = openai.OpenAI(
    api_key=bedrock_api_key,
    base_url=bedrock_endpoint,
)

try:
    response = client.chat.completions.create(
        model=model_id,
        # Specify guardrail information in the header
        extra_headers={
            "X-Amzn-Bedrock-GuardrailIdentifier": guardrail_id,
            "X-Amzn-Bedrock-GuardrailVersion": guardrail_version,
            "X-Amzn-Bedrock-Trace": "ENABLED",
        },
        # Additional guardrail information can be specified in the body
        extra_body={
            "amazon-bedrock-guardrailConfig": {
                "tagSuffix": "xyz"  # Used for input tagging
            }
        },
        messages=[
            {
                "role": "system",
                "content": "You are a helpful assistant."
            },
            {
                "role": "assistant", 
                "content": "Hello! How can I help you today?"
            },
            {
                "role": "user",
                "content": "What is the weather like today?"
            }
        ]
    )

    request_id = response._request_id
    print(f"Request ID: {request_id}")
    print(response)
    
except OpenAIError as e:
    print(f"An error occurred: {e}")
    if hasattr(e, 'response') and e.response is not None:
        request_id = e.response.headers.get("x-request-id")
        print(f"Request ID: {request_id}")

OpenAI SDK (Java)


import com.openai.client.OpenAIClient;
import com.openai.client.okhttp.OpenAIOkHttpClient;
import com.openai.core.http.HttpResponseFor;
import com.openai.models.chat.completions.ChatCompletion;
import com.openai.models.chat.completions.ChatCompletionCreateParams;

// Endpoint for Amazon Bedrock Runtime
String bedrockEndpoint = "http://bedrock-runtime.us-west-2.amazonaws.com/openai/v1"

// Model ID
String modelId = "openai.gpt-oss-20b-1:0"

// Replace with actual values
String bedrockApiKey = "$AWS_BEARER_TOKEN_BEDROCK"
String guardrailId = "GR12345"
String guardrailVersion = "DRAFT"

OpenAIClient client = OpenAIOkHttpClient.builder()
        .apiKey(bedrockApiKey)
        .baseUrl(bedrockEndpoint)
        .build()

ChatCompletionCreateParams request = ChatCompletionCreateParams.builder()
        .addUserMessage("What is the temperature in Seattle?")
        .model(modelId)
        // Specify additional headers for the guardrail
        .putAdditionalHeader("X-Amzn-Bedrock-GuardrailIdentifier", guardrailId)
        .putAdditionalHeader("X-Amzn-Bedrock-GuardrailVersion", guardrailVersion)
        // Specify additional body parameters for the guardrail
        .putAdditionalBodyProperty(
                "amazon-bedrock-guardrailConfig",
                JsonValue.from(Map.of("tagSuffix", JsonValue.of("xyz"))) // Allows input tagging
        )
        .build();
        
HttpResponseFor<ChatCompletion> rawChatCompletionResponse =
        client.chat().completions().withRawResponse().create(request);

final ChatCompletion chatCompletion = rawChatCompletionResponse.parse();

System.out.println(chatCompletion);

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

API de respostas

API Messages do da