

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

# Gemma 4 E2 B
<a name="model-card-google-gemma-4-e2b"></a>

## ![Google-Logo mit mehrfarbigem G-Buchstabensymbol.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/models/google.png) Google — Gemma 4 E2B
<a name="model-card-google-gemma-4-e2b-header"></a>

## Modelldetails
<a name="model-card-google-gemma-4-e2b-details"></a>

Gemma 4 E2B ist Googles kompaktes Modell mit 5,1 Milliarden Gesamtparametern und 2,3 Milliarden effektiven Parametern unter Verwendung von Per-Layer Embeddings (PLE). Es wurde für Workloads mit niedriger Latenz konzipiert und verfügt über integrierte Argumentation, native Funktionsaufrufe und multimodale Eingabe in Text und Bild. Es unterstützt ein 128-K-Token-Kontextfenster. [Weitere Informationen zur Modellentwicklung und Leistung finden Sie auf der Karte. model/service ](https://huggingface.co/google/gemma-4-E2B-it)
+ **Datum der Markteinführung des Modells:** 10. Juni 2025
+ **EOL-Datum des Modells:** N/A
+ **[Endbenutzer-Lizenzvereinbarungen und Nutzungsbedingungen: Ansicht](https://ai.google.dev/gemma/apache_2)**
+ **Modelllebenszyklus:** Aktiv
+ **Kontextfenster:** 128.000 Token


| **Eingabemodalitäten** | **Ausgabemodalitäten** | **[Unterstützte APIs](https://docs.aws.amazon.com/bedrock/latest/userguide/apis.html)** | **[Unterstützte Endpunkte](https://docs.aws.amazon.com/bedrock/latest/userguide/endpoints.html)** | 
| --- | --- | --- | --- | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-yes.png)Audio | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png)Einbetten | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-yes.png) Responses | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png) bedrock-runtime | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-yes.png)Bild | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png)Bild | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-yes.png) Chat Completions | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-yes.png) bedrock-mantle | 
| ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png)Rede | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png)Rede | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png) Invoke |  | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-yes.png)Text | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-yes.png)Text | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png) Converse |  | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-yes.png)-Video | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png)-Video | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png) Messages |  | 

**Anmerkung**  
Gemma 4-Modelle sind nur auf dem `bedrock-mantle` Endpunkt verfügbar.  
Dieses Modell ist auf dem `openai/v1/responses` Pfad am `bedrock-mantle` Endpunkt verfügbar. Dies unterscheidet sich von dem `v1/responses` Pfad, der von anderen Modellen auf dem Antwortendpunkt verwendet wird.

## Fähigkeiten und Funktionen
<a name="model-card-google-gemma-4-e2b-capabilities"></a>

***Eigenschaften von Bedrock***

**Funktionen, die mithilfe `bedrock-mantle` von Endpoint unterstützt werden**


| **Unterstützt** | **Nicht unterstützt** | 
| --- | --- | 
|  [See the AWS documentation website for more details](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/model-card-google-gemma-4-e2b.html)  | — | 

## Preisgestaltung
<a name="model-card-google-gemma-4-e2b-pricing"></a>

Die Preise finden Sie auf der Seite mit den [Preisen von Amazon Bedrock](https://aws.amazon.com/bedrock/pricing/).

## Programmatischer Zugriff
<a name="model-card-google-gemma-4-e2b-programmatic-access"></a>

Verwenden Sie die folgenden Modell-IDs und Endpunkt-URLs, um programmgesteuert auf dieses Modell zuzugreifen. [Weitere Informationen zu den verfügbaren APIs und Endpunkten finden Sie unter [Unterstützte APIs und Unterstützte](https://docs.aws.amazon.com/bedrock/latest/userguide/apis.html) Endpunkte.](https://docs.aws.amazon.com/bedrock/latest/userguide/endpoints.html)


| **Endpunkt** | **Modell-ID** | **In-Region Endpunkt-URL** | **Geoinferenz-ID** | **Globale Inferenz-ID** | 
| --- | --- | --- | --- | --- | 
| bedrock-mantle | google.gemma-4-e2b | https://bedrock-mantle.{region}.api.aws/openai/v1 | Nicht unterstützt | Nicht unterstützt | 

*Wenn die Region beispielsweise us-east-1 (Nord-Virginia) lautet, dann lautet die URL des Bedrock-Mantel-Endpunkts "„. https://bedrock-mantle.us-east-1.api.aws/openai/v1*

## Dienststufen
<a name="model-card-google-gemma-4-e2b-tiers"></a>

Amazon Bedrock bietet mehrere Servicestufen, um Ihren Workload-Anforderungen gerecht zu werden. **Standard** bietet unverbindlichen Pay-per-Token-Zugriff. **Priority** bietet einen höheren Durchsatz mit einer zeitbasierten Verpflichtung. **Flex** bietet kostengünstigeren Zugriff für flexible, nicht zeitkritische Workloads. **Reserved** bietet einen dedizierten Durchsatz mit einer festen Laufzeit für vorhersehbare Workloads. Weitere Informationen finden Sie unter [Servicestufen.](https://docs.aws.amazon.com/bedrock/latest/userguide/service-tiers-inference.html)


| **Standard** | **Priorität** | **Flex** | **Reserviert** | 
| --- | --- | --- | --- | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png) | 

## Regionale Verfügbarkeit
<a name="model-card-google-gemma-4-e2b-regional-availability"></a>

***Die regionale Verfügbarkeit auf einen Blick***

Bedrock bietet drei Inferenzoptionen: Anfragen werden innerhalb einer einzigen Region **In-Region**aufbewahrt, um die strikte Einhaltung der Vorschriften zu gewährleisten, **geografische Cross-Region** Routen zwischen Regionen innerhalb einer Region (USA, EU usw.) für einen höheren Durchsatz bei gleichzeitiger Wahrung der Datenresidenz und **globale Cross-Region** Routen überall auf der Welt für maximalen Durchsatz, wenn es keine lokalen Beschränkungen gibt. Weitere Informationen finden Sie auf der [Regionale Verfügbarkeit](models-region-compatibility.md) Seite.


| **Region** | **In-Region** | **Geo** | **Global** | 
| --- | --- | --- | --- | 
| us-east-1(Nord-Virginia) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png) | 
| us-east-2(Ohio) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png) | 
| us-west-2(Oregon) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png) | 
| eu-central-1(Frankfurt) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/de_de/bedrock/latest/userguide/images/icons/icon-no.png) | 

## Kontingente und Einschränkungen
<a name="model-card-google-gemma-4-e2b-quotas"></a>

Ihr AWS-Konto verfügt über Standardkontingente, um die Leistung des Service aufrechtzuerhalten und eine angemessene Nutzung von Amazon Bedrock sicherzustellen. Die einem Konto zugewiesenen Standardkontingente können je nach regionalen Faktoren, Zahlungsverlauf, betrügerischer Nutzung und and/or Genehmigung einer [Anfrage zur Erhöhung](https://docs.aws.amazon.com/bedrock/latest/userguide/quotas-increase.html) des Kontingents aktualisiert werden. Weitere Informationen finden Sie in der [Kontingente für Amazon Bedrock](quotas.md) Dokumentation und in den [Grenzwerten](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock) für das Modell.

Wenn der On-Demand-Durchsatz auf dem `bedrock-mantle` Endpunkt genutzt wird, [skaliert der verfügbare Durchsatz mit der Zeit](https://docs.aws.amazon.com/bedrock/latest/userguide/scaling-throughput-best-practices.html#scaling-ramp-up). Es ist nicht garantiert, dass alle Anfragen innerhalb Ihres Kontingents in Zeiten hoher Nachfrage erfolgreich sind. Daher ist eine schrittweise Erhöhung wichtig. Bei diesem Modell werden Standardlimits nicht direkt über Servicekontingente angezeigt. Wir empfehlen daher, sich an die Rampe zu halten.

## Beispiel-Code
<a name="model-card-google-gemma-4-e2b-sample-code"></a>

**Schritt 1 — AWS-Konto:** Wenn Sie bereits ein AWS-Konto haben, überspringen Sie diesen Schritt. Wenn Sie neu bei AWS sind, registrieren Sie sich für ein [AWS-Konto](https://portal.aws.amazon.com/billing/signup).

**Schritt 2 — API-Schlüssel:** Rufen Sie die [Amazon Bedrock-Konsole](https://console.aws.amazon.com/bedrock/home#/api-keys/long-term/create) auf und generieren Sie einen langfristigen API-Schlüssel.

**Schritt 3 — Holen Sie sich das SDK:** Um dieses Handbuch für die ersten Schritte verwenden zu können, muss Python bereits installiert sein. Installieren Sie dann die entsprechende Software, je nachdem, welche APIs Sie verwenden.

```
pip install openai
```

**Schritt 4 — Umgebungsvariablen festlegen:** Konfigurieren Sie Ihre Umgebung so, dass der API-Schlüssel für die Authentifizierung verwendet wird.

```
OPENAI_API_KEY="<provide your Bedrock API key>"
OPENAI_BASE_URL="https://bedrock-mantle.<your-region>.api.aws/openai/v1"
```

**Schritt 5 — Führen Sie Ihre erste Inferenzanfrage aus:** Speichern Sie die Datei unter `bedrock-first-request.py`

------
#### [ Chat Completions API ]

```
from openai import OpenAI

client = OpenAI()

response = client.chat.completions.create(
    model="google.gemma-4-e2b",
    messages=[{"role": "user", "content": "Can you explain the features of Amazon Bedrock?"}]
    )
print(response)
```

------
#### [ Responses API ]

```
from openai import OpenAI

client = OpenAI()

response = client.responses.create(
    model="google.gemma-4-e2b",
    input="Explain the benefits of mixture-of-experts architectures for production inference.",
    max_output_tokens=512,
)
print(response.output_text)
```

------

## Überlegungen zur Verwendung und Einschränkungen
<a name="model-card-google-gemma-4-e2b-considerations"></a>
+ **Argumentationsmodus — Der** Argumentationsaufwand wird sowohl bei den APIs für den Abschluss von Chats als auch bei den APIs für Antworten berücksichtigt, und das Modell führt in beiden Fällen die erweiterte Argumentation durch. Der Inhalt der Argumentation wird jedoch nur von der Responses API zurückgegeben. Die Chat Completions API gibt die Argumentationstoken nicht zurück, da die OpenAI Chat Completions-Spezifikation ihre Rückgabe nicht unterstützt.
+ **Argumentationsaufwand** — Für Gemma 4 E2B empfehlen wir die Einstellung `reasoning_effort` auf, wodurch der Denkmodus aktiviert wird. `high` Diese Variante tendiert dazu, standardmäßig ausführlich zu argumentieren, und ein hoher Argumentationsaufwand sorgt dafür, dass diese Argumentation im dafür vorgesehenen Argumentationskanal bleibt, was die Qualität der Ausgabe verbessert und verhindert, dass in der endgültigen Antwort Argumentationstext erscheint.
+ **Parallele Werkzeugabrufe** — Das Anfordern von mehr als einem Werkzeugabruf in einem Zug wird derzeit nicht unterstützt. Fordere Tool-Calls nacheinander an.
+ **Größe der Anforderungsnutzlast** — Die gesamte Nutzlast des Anforderungstexts für Gemma 4 E2B, einschließlich Bilder und Videos, unterstützt eine maximale Größe von 3,5 MB.