

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Gemma 4 E2B
<a name="model-card-google-gemma-4-e2b"></a>

## ![Logo Google avec icône en forme de lettre G multicolore.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/models/google.png) Google — Gemma 4 E2B
<a name="model-card-google-gemma-4-e2b-header"></a>

## Détails du modèle
<a name="model-card-google-gemma-4-e2b-details"></a>

Gemma 4 E2B est le modèle compact de Google avec 5,1 milliards de paramètres au total et 2,3 milliards de paramètres effectifs utilisant des Per-Layer intégrations (PLE), conçu pour les charges de travail à faible latence avec raisonnement intégré, appel de fonctions natif et saisie multimodale de texte et d'image, prenant en charge une fenêtre contextuelle de 128 000 jetons. Pour plus d'informations sur le développement et les performances des modèles, consultez la [model/service fiche](https://huggingface.co/google/gemma-4-E2B-it).
+ **Date de lancement du modèle :** 10 juin 2025
+ **Date EOL du modèle :** N/A
+ **Contrats de licence utilisateur final et conditions d'utilisation :** [Afficher](https://ai.google.dev/gemma/apache_2)
+ **Cycle de vie du modèle :** actif
+ **Fenêtre contextuelle :** 128 000 jetons


| **Modalités de saisie** | **Modalités de sortie** | **[API prises en charge](https://docs.aws.amazon.com/bedrock/latest/userguide/apis.html)** | **[Endpoints pris en charge](https://docs.aws.amazon.com/bedrock/latest/userguide/endpoints.html)** | 
| --- | --- | --- | --- | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-yes.png)Audio | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png)Intégration | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-yes.png) Responses | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png) bedrock-runtime | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-yes.png)Image | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png)Image | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-yes.png) Chat Completions | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-yes.png) bedrock-mantle | 
| ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png)Discours | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png)Discours | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png) Invoke |  | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-yes.png)Texte | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-yes.png)Texte | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png) Converse |  | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-yes.png)Vidéo | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png)Vidéo | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png) Messages |  | 

**Note**  
Les modèles Gemma 4 ne sont disponibles que sur le `bedrock-mantle` terminal.  
Ce modèle est disponible sur le `openai/v1/responses` chemin du `bedrock-mantle` point de terminaison. Ce chemin est différent du `v1/responses` chemin utilisé par les autres modèles sur le point de terminaison des réponses.

## Capacités et fonctionnalités
<a name="model-card-google-gemma-4-e2b-capabilities"></a>

***Caractéristiques de Bedrock***

**Fonctionnalités prises en charge avec `bedrock-mantle` Endpoint**


| **Soutenu** | **Non pris en charge** | 
| --- | --- | 
|  [See the AWS documentation website for more details](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/model-card-google-gemma-4-e2b.html)  | — | 

## Tarification
<a name="model-card-google-gemma-4-e2b-pricing"></a>

Pour connaître les tarifs, consultez la page de [tarification d'Amazon Bedrock](https://aws.amazon.com/bedrock/pricing/).

## Accès programmatique
<a name="model-card-google-gemma-4-e2b-programmatic-access"></a>

Utilisez les ID de modèle et les URL de point de terminaison suivants pour accéder à ce modèle par programmation. Pour plus d'informations sur les API et les points de terminaison disponibles, consultez les sections [API prises en charge](https://docs.aws.amazon.com/bedrock/latest/userguide/apis.html) et Points de [terminaison](https://docs.aws.amazon.com/bedrock/latest/userguide/endpoints.html) pris en charge.


| **Point de terminaison** | **ID du modèle** | **In-Region URL du terminal** | **Identifiant d'inférence géographique** | **ID d'inférence global** | 
| --- | --- | --- | --- | --- | 
| bedrock-mantle | google.gemma-4-e2b | https://bedrock-mantle.{region}.api.aws/openai/v1 | Non pris en charge | Non pris en charge | 

*Par exemple, si la région est us-east-1 (Virginie du Nord), l'URL du point de terminaison bedrock-mantle sera « ». https://bedrock-mantle.us-east-1.api.aws/openai/v1*

## Niveaux de service
<a name="model-card-google-gemma-4-e2b-tiers"></a>

Amazon Bedrock propose plusieurs niveaux de service pour répondre à vos exigences en matière de charge de travail. **Standard** fournit un accès au paiement par jeton sans engagement. **Priority** offre un débit plus élevé avec un engagement basé sur le temps. **Flex** fournit un accès à moindre coût pour les charges de travail flexibles et non urgentes. **Reserved** fournit un débit dédié avec un engagement à terme pour des charges de travail prévisibles. Pour plus d'informations, consultez la section [niveaux de service](https://docs.aws.amazon.com/bedrock/latest/userguide/service-tiers-inference.html).


| **Standard** | **Priorité** | **Flex** | **Réservé** | 
| --- | --- | --- | --- | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png) | 

## Disponibilité par région
<a name="model-card-google-gemma-4-e2b-regional-availability"></a>

***La disponibilité régionale en un coup d'œil***

Bedrock propose trois options d'inférence : **In-Region**conserver les demandes dans une seule région pour une conformité stricte, ** Cross-Regiongéo-itinéraires** entre les régions d'une même zone géographique (États-Unis, UE, etc.) pour un débit plus élevé tout en respectant la résidence des données, et Cross-Region itinéraires **mondiaux** partout dans le monde pour un débit maximal en l'absence de contraintes de résidence. Reportez-vous à la [Disponibilité par région](models-region-compatibility.md) page pour plus de détails.


| **Région** | **In-Region** | **Géo** | **Solution internationale** | 
| --- | --- | --- | --- | 
| us-east-1(Virginie du Nord) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png) | 
| us-east-2(Ohio) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png) | 
| us-west-2(Oregon) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png) | 
| eu-central-1(Francfort) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/fr_fr/bedrock/latest/userguide/images/icons/icon-no.png) | 

## Quotas et limites
<a name="model-card-google-gemma-4-e2b-quotas"></a>

Votre compte AWS dispose de quotas par défaut pour maintenir les performances du service et garantir une utilisation appropriée d'Amazon Bedrock. Les quotas par défaut attribués à un compte peuvent être mis à jour en fonction de facteurs régionaux, de l'historique des paiements, de l'utilisation frauduleuse ou de and/or l'approbation d'une [demande d'augmentation](https://docs.aws.amazon.com/bedrock/latest/userguide/quotas-increase.html) de quota. Pour plus de détails, reportez-vous à [Quotas pour Amazon Bedrock](quotas.md) la documentation et aux [limites](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock) du modèle.

Lorsque vous consommez du débit à la demande sur le `bedrock-mantle` terminal, le [débit disponible évolue au fil du](https://docs.aws.amazon.com/bedrock/latest/userguide/scaling-throughput-best-practices.html#scaling-ramp-up) temps. Le succès de toutes les demandes dans les limites de votre quota n'est pas garanti pendant les périodes de forte demande. Il est donc important de les accélérer progressivement. Pour ce modèle, les limites par défaut ne sont pas directement définies par le biais des Quotas de Service. Nous vous recommandons donc de suivre la rampe comme guide.

## Exemple de code
<a name="model-card-google-gemma-4-e2b-sample-code"></a>

**Étape 1 - Compte AWS :** si vous possédez déjà un compte AWS, ignorez cette étape. Si vous utilisez AWS pour la première fois, créez un [compte AWS](https://portal.aws.amazon.com/billing/signup).

**Étape 2 - Clé d'API :** accédez à la [console Amazon Bedrock](https://console.aws.amazon.com/bedrock/home#/api-keys/long-term/create) et générez une clé d'API à long terme.

**Étape 3 - Téléchargez le SDK :** pour utiliser ce guide de démarrage, Python doit déjà être installé. Installez ensuite le logiciel approprié en fonction des API que vous utilisez.

```
pip install openai
```

**Étape 4 - Définissez les variables d'environnement :** configurez votre environnement pour utiliser la clé API pour l'authentification.

```
OPENAI_API_KEY="<provide your Bedrock API key>"
OPENAI_BASE_URL="https://bedrock-mantle.<your-region>.api.aws/openai/v1"
```

**Étape 5 - Exécutez votre première demande d'inférence :** enregistrez le fichier sous `bedrock-first-request.py`

------
#### [ Chat Completions API ]

```
from openai import OpenAI

client = OpenAI()

response = client.chat.completions.create(
    model="google.gemma-4-e2b",
    messages=[{"role": "user", "content": "Can you explain the features of Amazon Bedrock?"}]
    )
print(response)
```

------
#### [ Responses API ]

```
from openai import OpenAI

client = OpenAI()

response = client.responses.create(
    model="google.gemma-4-e2b",
    input="Explain the benefits of mixture-of-experts architectures for production inference.",
    max_output_tokens=512,
)
print(response.output_text)
```

------

## Considérations et limites d'utilisation
<a name="model-card-google-gemma-4-e2b-considerations"></a>
+ **Mode de raisonnement** — L'effort de raisonnement est respecté à la fois sur les API Chat Completions et Responses, et le modèle exécute le raisonnement étendu dans les deux cas. Cependant, le contenu du raisonnement est renvoyé uniquement par l'API Responses. L'API Chat Completions ne renvoie pas les jetons de raisonnement, car la spécification OpenAI Chat Completions ne permet pas de les renvoyer.
+ **Effort de raisonnement** — Pour Gemma 4 E2B, nous recommandons de `reasoning_effort` régler sur`high`, ce qui active le mode réflexion. Cette variante a tendance à raisonner de manière extensive par défaut, et un effort de raisonnement élevé permet de maintenir ce raisonnement dans le canal de raisonnement dédié, ce qui améliore la qualité de sortie et empêche le texte de raisonnement d'apparaître dans la réponse finale.
+ Appels d'**outils parallèles : la demande de plusieurs appels** d'outils en un seul tour n'est actuellement pas prise en charge. L'outil de demande appelle un par un.
+ **Taille de la charge utile de la demande** — La charge utile totale du corps de la requête pour Gemma 4 E2B, y compris les images et les vidéos, prend en charge une taille maximale de 3,5 Mo.