OpenAI 模型

OpenAI提供以下开放式重量型号：

gpt-oss-20b— 针对较低的延迟和本地或特殊用例进行了优化的小型模型。
gpt-oss-120b— 针对生产和通用或高推理用例进行了优化的更大模型。

下表汇总了有关模型的信息：

信息	gpt-oss-20b	gpt-oss-120b
发行日期	2025年8月5日	2025年8月5日
模型 ID	openai.gpt-oss-20b-1:0	openai.gpt-oss-120b-1:0
产品 ID	不适用	不适用
支持的输入模式	文本	文本
支持的输出模式	文本	文本
上下文窗口	128,000	128,000

这些OpenAI型号支持以下功能：

主题

OpenAI请求正文
OpenAI响应正文
OpenAI模型的用法示例

OpenAI请求正文

有关请求正文中的参数及其描述的信息，请参阅OpenAI文档中的创建聊天完成。

按以下方式使用请求正文字段：

在InvokeModel或OpenAI聊天完成请求中，请在请求正文中添加字段。

在 Converse 请求中，执行以下操作：

按messages如下方式映射：
- 对于角色为的每条消息developer，在system数组SystemContentBlock中添加 content a。
- 对于角色为user或的每条消息assistant，将添加到content字段ContentBlock中的，并在messages数组role中消息的role字段中指定。content

将以下字段的值映射到inferenceConfig对象中的相应字段：

OpenAI 字段	匡威字段
最大完成令牌	maxTokens
stop	stopSequences
温度	温度
top_p	topP

在additionalModelRequestFields对象中包含任何其他字段。

构造请求正文时的注意事项

这些OpenAI模型仅支持文本输入和文本输出。
model字段中的值必须与标题中的值相匹配。您可以省略此字段，使其自动填充与标题相同的值。
该stream字段中的值必须与您使用的 API 操作相匹配。您可以省略此字段，让它自动填充正确的值。
- 如果使用 InvokeModel，则该stream值必须为false。

OpenAI响应正文

OpenAI模型的响应正文符合返回的聊天完成对象。OpenAI有关响应字段的更多信息，请参阅OpenAI文档中的聊天完成对象。

注意

如果使用InvokeModel，则模型推理（周围环绕着<reasoning>标签）将位于响应的文本内容之前。

OpenAI模型的用法示例

本节提供了一些如何使用OpenAI模型的示例。

在尝试这些示例之前，请检查您是否满足了先决条件：

身份验证 — 您可以使用您的 AWS 证书或 Amazon Bedrock API 密钥进行身份验证。

设置您的 AWS 凭证或生成 Amazon Bedrock API 密钥来验证您的请求。
- 要了解如何设置 AWS 证书，请参阅使用AWS 安全凭证进行编程访问。
- 要了解有关 Amazon Bedrock API 密钥以及如何生成密钥的信息，请参阅生成 Amazon Bedrock API 密钥以轻松通过亚马逊 Bedrock API 进行身份验证。
注意
如果您使用OpenAI聊天完成 API，则只能使用 Amazon Bedrock API 密钥进行身份验证。
终端节点 — 找到与要在 Amazon Bedrock 运行时终端节点和配额中使用的 AWS 区域相对应的终端节点。如果您使用 S AWS DK，则在设置客户端时可能只需要指定区域代码，而无需指定整个终端节点。您必须使用与示例中使用的模型所支持的区域关联的终端节点。
模型访问权限-请求访问OpenAI模型。有关更多信息，请参阅访问 AWS GovCloud （美国）中的 Amazon Bedrock 基础模型。
（如果示例使用 SDK）安装 SDK-安装完成后，设置默认凭据和默认 AWS 区域。如果您未设置默认凭证或区域，则必须在相关代码示例中明确指定它们。有关标准化凭证提供商的更多信息，请参阅AWS SDKs 和工具标准化凭证提供商。

注意
如果您使用OpenAI软件开发工具包，则只能使用亚马逊 Bedrock API 密钥进行身份验证，并且必须明确设置亚马逊 Bedrock 终端节点。

展开要查看的示例的部分：

要查看使用OpenAI创建聊天完成 API 的示例，请选择首选方法的选项卡，然后按照以下步骤操作：

选择您首选方法的选项卡，然后按照以下步骤操作：

使用统一的 Converse API 时，需要将 “OpenAI创建聊天完成” 字段映射到 Converse 请求正文中的相应字段。

例如，将以下聊天完成请求正文与其相应的 Converse 请求正文进行比较：

选择您首选方法的选项卡，然后按照以下步骤操作：

通过在模型调用请求的标题中指定护栏 ID、版本以及是否启用护栏跟踪，在运行模型调用时设置防护栏。

选择您首选方法的选项卡，然后按照以下步骤操作：

要查看在OpenAI聊天完成时使用护栏的示例，请选择首选方法的选项卡，然后按照以下步骤操作：

OpenAI SDK (Python)


import openai
from openai import OpenAIError

# Endpoint for Amazon Bedrock Runtime
bedrock_endpoint = "https://bedrock-runtime.us-west-2.amazonaws.com/openai/v1"

# Model ID
model_id = "openai.gpt-oss-20b-1:0"

# Replace with actual values
bedrock_api_key = "$AWS_BEARER_TOKEN_BEDROCK"
guardrail_id = "GR12345"
guardrail_version = "DRAFT"

client = openai.OpenAI(
    api_key=bedrock_api_key,
    base_url=bedrock_endpoint,
)

try:
    response = client.chat.completions.create(
        model=model_id,
        # Specify guardrail information in the header
        extra_headers={
            "X-Amzn-Bedrock-GuardrailIdentifier": guardrail_id,
            "X-Amzn-Bedrock-GuardrailVersion": guardrail_version,
            "X-Amzn-Bedrock-Trace": "ENABLED",
        },
        # Additional guardrail information can be specified in the body
        extra_body={
            "amazon-bedrock-guardrailConfig": {
                "tagSuffix": "xyz"  # Used for input tagging
            }
        },
        messages=[
            {
                "role": "system",
                "content": "You are a helpful assistant."
            },
            {
                "role": "assistant", 
                "content": "Hello! How can I help you today?"
            },
            {
                "role": "user",
                "content": "What is the weather like today?"
            }
        ]
    )

    request_id = response._request_id
    print(f"Request ID: {request_id}")
    print(response)
    
except OpenAIError as e:
    print(f"An error occurred: {e}")
    if hasattr(e, 'response') and e.response is not None:
        request_id = e.response.headers.get("x-request-id")
        print(f"Request ID: {request_id}")

OpenAI SDK (Java)


import com.openai.client.OpenAIClient;
import com.openai.client.okhttp.OpenAIOkHttpClient;
import com.openai.core.http.HttpResponseFor;
import com.openai.models.chat.completions.ChatCompletion;
import com.openai.models.chat.completions.ChatCompletionCreateParams;

// Endpoint for Amazon Bedrock Runtime
String bedrockEndpoint = "http://bedrock-runtime.us-west-2.amazonaws.com/openai/v1"

// Model ID
String modelId = "openai.gpt-oss-20b-1:0"

// Replace with actual values
String bedrockApiKey = "$AWS_BEARER_TOKEN_BEDROCK"
String guardrailId = "GR12345"
String guardrailVersion = "DRAFT"

OpenAIClient client = OpenAIOkHttpClient.builder()
        .apiKey(bedrockApiKey)
        .baseUrl(bedrockEndpoint)
        .build()

ChatCompletionCreateParams request = ChatCompletionCreateParams.builder()
        .addUserMessage("What is the temperature in Seattle?")
        .model(modelId)
        // Specify additional headers for the guardrail
        .putAdditionalHeader("X-Amzn-Bedrock-GuardrailIdentifier", guardrailId)
        .putAdditionalHeader("X-Amzn-Bedrock-GuardrailVersion", guardrailVersion)
        // Specify additional body parameters for the guardrail
        .putAdditionalBodyProperty(
                "amazon-bedrock-guardrailConfig",
                JsonValue.from(Map.of("tagSuffix", JsonValue.of("xyz"))) // Allows input tagging
        )
        .build();
        
HttpResponseFor<ChatCompletion> rawChatCompletionResponse =
        client.chat().completions().withRawResponse().create(request);

final ChatCompletion chatCompletion = rawChatCompletionResponse.parse();

System.out.println(chatCompletion);

Batch 推理允许您使用多个提示异步运行模型推理。要使用OpenAI模型运行批量推理，请执行以下操作：

创建一个 JSONL 文件，并在其中填充至少最少数量的 JSON 对象，每个对象之间用换行符分隔。每个modelInput对象都必须符合OpenAI创建聊天完成请求正文的格式。以下是包含请求正文的 JSONL 文件前两行的示例。OpenAI


{
    "recordId": "RECORD1", 
    "modelInput": {
        "messages": [
            {
                "role": "system", 
                "content": "You are a helpful assistant."
            }, 
            {
                "role": "user", 
                "content": "Can you generate a question with a factual answer?"
            }
        ], 
        "max_completion_tokens": 1000
    }
}
{
    "recordId": "RECORD2", 
    "modelInput": {
        "messages": [
            {
                "role": "system", 
                "content": "You are a helpful assistant."
            }, 
            {
                "role": "user", 
                "content": "What is the weather like today?"
            }
        ], 
        "max_completion_tokens": 1000
    }
}
...

注意

该model字段是可选的，因为如果您省略标题，批量推理服务将根据标题为您插入该字段。

检查您的 JSONL 文件是否符合中概述的批量推理配额。设置格式并上传批量推理数据

将该文件上传到 Amazon S3 存储桶。
使用 Amazon Bedrock 控制平面终端节点发送CreateModelInvocationJob请求，字段中指定了上一步中的 S3 存储桶，并在inputDataConfig字段中指定了OpenAImodelId模型。

有关 end-to-end代码示例，请参阅批量推理的代码示例。替换为OpenAI模型的正确配置。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

文档惯例

Pixtral Large (25.02) 参数和推断

Stability AI 模型