

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# Gemma 4 E2B
<a name="model-card-google-gemma-4-e2b"></a>

## ![带有五彩 G 字母图标的 Google 徽标。](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/models/google.png) 谷歌 — Gemma 4 E2B
<a name="model-card-google-gemma-4-e2b-header"></a>

## 模型详细信息
<a name="model-card-google-gemma-4-e2b-details"></a>

Gemma 4 E2B 是 Google 的紧凑型模型，总共有 51 亿个参数和 23 亿个有效参数，使用 Emb Per-Layer eddings (PLE)，专为低延迟工作负载而设计，具有内置推理、原生函数调用以及跨文本和图像的多模态输入，支持 12.8 万个令牌上下文窗口。有关模型开发和性能的更多信息，请参阅[model/service 卡片](https://huggingface.co/google/gemma-4-E2B-it)。
+ **车型发布日期：**2025年6月10日
+ **型号停产日期：** N/A
+ **最终用户许可协议和使用条款：**[查看](https://ai.google.dev/gemma/apache_2)
+ **模型生命周期：**活跃
+ **上下文窗口：**12.8 万个代币


| **输入模式** | **输出模式** | **[支持的 API](https://docs.aws.amazon.com/bedrock/latest/userguide/apis.html)** | **[支持的终端节点](https://docs.aws.amazon.com/bedrock/latest/userguide/endpoints.html)** | 
| --- | --- | --- | --- | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-yes.png)音频 | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png)嵌入 | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-yes.png) Responses | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png) bedrock-runtime | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-yes.png)图片 | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png)图片 | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-yes.png) Chat Completions | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-yes.png) bedrock-mantle | 
| ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png)演讲 | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png)演讲 | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png) Invoke |  | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-yes.png)文本 | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-yes.png)文本 | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png) Converse |  | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-yes.png)视频 | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png)视频 | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png) Messages |  | 

**注意**  
Gemma 4 模型仅在`bedrock-mantle`端点上可用。  
此模型可在`bedrock-mantle`端点上的`openai/v1/responses`路径上使用。这与其他模型在响应端点上使用的`v1/responses`路径不同。

## 功能和特点
<a name="model-card-google-gemma-4-e2b-capabilities"></a>

***基岩特征***

**使用`bedrock-mantle`端点支持的功能**


| **支持的** | **不支持** | 
| --- | --- | 
|  [See the AWS documentation website for more details](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/model-card-google-gemma-4-e2b.html)  | — | 

## 定价
<a name="model-card-google-gemma-4-e2b-pricing"></a>

有关定价，请参阅 [Amazon Bedrock 定价](https://aws.amazon.com/bedrock/pricing/)页面。

## 以编程方式访问
<a name="model-card-google-gemma-4-e2b-programmatic-access"></a>

使用以下模型 ID 和端点 URL 以编程方式访问此模型。有关可用 API 和终端节点的更多信息，请参阅[支持的 API 和支持的](https://docs.aws.amazon.com/bedrock/latest/userguide/apis.html)[终端节点](https://docs.aws.amazon.com/bedrock/latest/userguide/endpoints.html)。


| **Endpoint** | **型号标识** | **In-Region 端点网址** | **地理推理 ID** | **全局推理 ID** | 
| --- | --- | --- | --- | --- | 
| bedrock-mantle | google.gemma-4-e2b | https://bedrock-mantle.{region}.api.aws/openai/v1 | 不支持 | 不支持 | 

*例如，如果区域为 us-east-1（弗吉尼亚北部），则基岩地幔端点 URL 将是 “”。https://bedrock-mantle.us-east-1.api.aws/openai/v1*

## 服务等级
<a name="model-card-google-gemma-4-e2b-tiers"></a>

Amazon Bedrock 提供多个服务等级，以满足您的工作负载要求。**标准版**提供按令牌付费的访问权限，无需任何承诺。P@@ **ri** ority 通过基于时间的承诺提供更高的吞吐量。**Flex** 为灵活、非时间敏感型工作负载提供更低成本的访问权限。Reserved 为可预测的工作负载提供@@ **专用**吞吐量和定期承诺。有关更多信息，请参阅[服务等级](https://docs.aws.amazon.com/bedrock/latest/userguide/service-tiers-inference.html)。


| **Standard** | **优先级** | **Flex** | **已保留** | 
| --- | --- | --- | --- | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png) | 

## 区域可用性
<a name="model-card-google-gemma-4-e2b-regional-availability"></a>

***地区供应情况一览***

**Bedrock 提供三种推断选项：**In-Region**将请求保留在单个区域内以实现严格合规；在尊重数据驻留的情况下跨地理区域（美国、欧盟等）进行地理 Cross-Region路由，以提高吞吐量；以及**全球任何地方的全球 Cross-Region**路由，以便在没有驻留限制的情况下实现最大吞吐量。**有关更多详细信息，请参阅该[区域可用性](models-region-compatibility.md)页面。


| **区域** | **In-Region** | **Geo** | **Global** | 
| --- | --- | --- | --- | 
| us-east-1（弗吉尼亚北部） | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png) | 
| us-east-2（俄亥俄州） | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png) | 
| us-west-2（俄勒冈州） | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png) | 
| eu-central-1（法兰克福） | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/zh_cn/bedrock/latest/userguide/images/icons/icon-no.png) | 

## 配额和限制
<a name="model-card-google-gemma-4-e2b-quotas"></a>

您的 AWS 账户具有默认配额，用于维持服务性能并确保适当使用 Amazon Bedrock。分配给账户的默认配额可能会根据地区因素、付款历史记录、欺诈性使用情况、[增加配额请求](https://docs.aws.amazon.com/bedrock/latest/userguide/quotas-increase.html)的 and/or 批准而更新。有关更多详细信息，请参阅[Amazon Bedrock 的配额](quotas.md)文档并查看该模型的[限制](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock)。

在`bedrock-mantle`终端上使用按需吞吐量时，[可用吞吐量会随着时间的推移而扩展](https://docs.aws.amazon.com/bedrock/latest/userguide/scaling-throughput-best-practices.html#scaling-ramp-up)。在需求旺盛时期，并非所有在配额内的请求都能保证成功，因此逐步增加请求非常重要。对于此模型，默认限制不会直接通过 Service Quotas 浮出水面，因此我们建议您以此为指导。

## 示例代码
<a name="model-card-google-gemma-4-e2b-sample-code"></a>

**第 1 步-AWS 账户：**如果您已经拥有 AWS 账户，请跳过此步骤。如果您不熟悉 AWS，请注册一个 A [WS 账户](https://portal.aws.amazon.com/billing/signup)。

**第 2 步-API 密钥：**前往 [Amazon Bedrock 控制台](https://console.aws.amazon.com/bedrock/home#/api-keys/long-term/create)生成长期 API 密钥。

**第 3 步-获取 SDK：**要使用本入门指南，必须已安装 Python。然后根据您使用的 API 安装相关软件。

```
pip install openai
```

**步骤 4-设置环境变量：**将您的环境配置为使用 API 密钥进行身份验证。

```
OPENAI_API_KEY="<provide your Bedrock API key>"
OPENAI_BASE_URL="https://bedrock-mantle.<your-region>.api.aws/openai/v1"
```

**第 5 步-运行您的第一个推理请求：**将文件另存为 `bedrock-first-request.py`

------
#### [ Chat Completions API ]

```
from openai import OpenAI

client = OpenAI()

response = client.chat.completions.create(
    model="google.gemma-4-e2b",
    messages=[{"role": "user", "content": "Can you explain the features of Amazon Bedrock?"}]
    )
print(response)
```

------
#### [ Responses API ]

```
from openai import OpenAI

client = OpenAI()

response = client.responses.create(
    model="google.gemma-4-e2b",
    input="Explain the benefits of mixture-of-experts architectures for production inference.",
    max_output_tokens=512,
)
print(response.output_text)
```

------

## 使用注意事项和限制
<a name="model-card-google-gemma-4-e2b-considerations"></a>
+ **推理模式** — 聊天完成和回复 API 都支持推理工作，并且模型在这两种情况下都执行扩展推理。但是，推理内容只能由响应 API 返回。聊天完成 API 不返回推理令牌，因为 OpenAI 聊天完成规范不支持返回推理标记。
+ **推理工作** — 对于 Gemma 4 E2B，我们建议`reasoning_effort`将设置为`high`，这将启用思维模式。默认情况下，这种变体往往会广泛推理，而高推理力度会将推理保留在专用的推理通道中，从而提高输出质量并防止推理文本出现在最终响应中。
+ **并行工具调用** — 目前不支持在一个回合中请求多个工具调用。请求工具一次调用一个。
+ **请求有效载荷大小** — Gemma 4 E2B 的请求正文总有效负载（包括图像和视频）支持的最大大小为 3.5 MB。