Logo Google dengan ikon huruf G warna-warni. Google — Gemma 4 E2B Detail Model Kemampuan dan Fitur Harga Akses Terprogram Tingkatan Layanan Ketersediaan Wilayah Kuota dan Batas Kode Sampel Pertimbangan dan Batasan Penggunaan

Gemma 4 E2B

Google — Gemma 4 E2B

Detail Model

Gemma 4 E2B adalah model ringkas Google dengan 5,1 miliar parameter total dan 2,3 miliar parameter efektif menggunakan Per-Layer Embeddings (PLE), dirancang untuk beban kerja latensi rendah dengan penalaran bawaan, panggilan fungsi asli, dan input multimodal di seluruh teks dan gambar, mendukung jendela konteks token 128K. Untuk informasi lebih lanjut tentang pengembangan dan kinerja model, lihat model/service kartu.

Tanggal peluncuran model: 10 Jun 2025
Tanggal model EOL: N/A
Perjanjian Lisensi Pengguna Akhir dan Ketentuan Penggunaan: Lihat
Siklus hidup model: Aktif
Jendela konteks: 128K token

Modalitas Masukan	Modalitas Keluaran	API didukung	Endpoint didukung
Audio	Menyematkan	`Responses`	`bedrock-runtime`
Gambar	Gambar	`Chat Completions`	`bedrock-mantle`
Pidato	Pidato	`Invoke`
Teks	Teks	`Converse`
Video	Video	`Messages`

catatan

Model Gemma 4 hanya tersedia di titik bedrock-mantle akhir.

Model ini tersedia di openai/v1/responses jalur di bedrock-mantle titik akhir. Ini berbeda dari v1/responses jalur yang digunakan oleh model lain pada titik akhir respons.

Kemampuan dan Fitur

Fitur Batuan Dasar

Fitur yang didukung menggunakan bedrock-mantle endpoint

Didukung	Tidak Didukung
Client-side alat panggilan Penalaran Proyek	—

Harga

Untuk harga, silakan merujuk ke halaman Harga Amazon Bedrock.

Akses Terprogram

Gunakan ID model dan URL titik akhir berikut untuk mengakses model ini secara terprogram. Untuk informasi selengkapnya tentang API dan titik akhir yang tersedia, lihat API yang didukung dan Endpoint didukung.

Titik akhir	ID Model	In-Region URL titik akhir	ID inferensi geo	ID inferensi global
`bedrock-mantle`	`google.gemma-4-e2b`	`https://bedrock-mantle.{region}.api.aws/openai/v1`	Tidak didukung	Tidak didukung

Misalnya, jika wilayah adalah us-east-1 (Virginia N.), maka URL titik akhir mantel dasar akan menjadi "”. https://bedrock-mantle.us-east-1.api.aws/openai/v1

Tingkatan Layanan

Amazon Bedrock menawarkan beberapa tingkatan layanan agar sesuai dengan persyaratan beban kerja Anda. Standar menyediakan akses bayar per token tanpa komitmen. Prioritas menawarkan throughput yang lebih tinggi dengan komitmen berbasis waktu. Flex menyediakan akses berbiaya lebih rendah untuk beban kerja yang fleksibel dan tidak sensitif terhadap waktu. Reserved menyediakan throughput khusus dengan komitmen jangka untuk beban kerja yang dapat diprediksi. Untuk informasi selengkapnya, lihat tingkatan layanan.

Standar	Prioritas	Flex	Dilindungi

Ketersediaan Wilayah

Sekilas tentang ketersediaan regional

Bedrock menawarkan tiga opsi inferensi: In-Regionmenyimpan permintaan dalam satu Wilayah untuk kepatuhan yang ketat, Cross-Region rute Geo lintas Wilayah dalam geografi (AS, UE, dll.) untuk throughput yang lebih tinggi sambil menghormati residensi data, dan Cross-Region rute Global di mana saja di seluruh dunia untuk throughput maksimum ketika tidak ada kendala residensi. Lihat Ketersediaan wilayah halaman untuk lebih jelasnya.

Wilayah	In-Region	Geo	Global
`us-east-1`(Virginia Utara)
`us-east-2`(Ohio)
`us-west-2`(Oregon)
`eu-central-1`(Frankfurt am Main)

Kuota dan Batas

Akun AWS Anda memiliki kuota default untuk mempertahankan kinerja layanan dan untuk memastikan penggunaan Amazon Bedrock yang tepat. Kuota default yang ditetapkan ke akun dapat diperbarui tergantung pada faktor regional, riwayat pembayaran, penggunaan penipuan, and/or persetujuan permintaan peningkatan kuota. Untuk lebih jelasnya, silakan merujuk ke Kuota untuk Amazon Bedrock dokumentasi dan lihat batas untuk model.

Saat mengkonsumsi throughput sesuai permintaan pada bedrock-mantle titik akhir, skala throughput yang tersedia dari waktu ke waktu. Tidak semua permintaan dalam kuota Anda dijamin berhasil selama periode permintaan tinggi, jadi ramping secara bertahap adalah penting. Untuk model ini, batas default tidak muncul secara langsung melalui Service Quotas, jadi sebaiknya ikuti ramp sebagai panduan Anda.

Kode Sampel

Langkah 1 - Akun AWS: Jika Anda sudah memiliki akun AWS, lewati langkah ini. Jika Anda baru mengenal AWS, daftar akun AWS.

Langkah 2 - Kunci API: Buka konsol Amazon Bedrock dan buat kunci API jangka panjang.

Langkah 3 - Dapatkan SDK: Untuk menggunakan panduan memulai ini, Anda harus memiliki Python yang sudah diinstal. Kemudian instal perangkat lunak yang relevan tergantung pada API yang Anda gunakan.


pip install openai

Langkah 4 - Tetapkan variabel lingkungan: Konfigurasikan lingkungan Anda untuk menggunakan kunci API untuk otentikasi.


OPENAI_API_KEY="<provide your Bedrock API key>"
OPENAI_BASE_URL="https://bedrock-mantle.<your-region>.api.aws/openai/v1"

Langkah 5 - Jalankan permintaan inferensi pertama Anda: Simpan file sebagai bedrock-first-request.py

Pertimbangan dan Batasan Penggunaan

Mode penalaran — Upaya penalaran dihormati pada API Penyelesaian Obrolan dan Respons, dan model melakukan penalaran yang diperluas dalam kedua kasus. Namun, konten penalaran hanya dikembalikan oleh API Responses. API Penyelesaian Obrolan tidak mengembalikan token penalaran, karena spesifikasi Penyelesaian Obrolan OpenAI tidak mendukung pengembaliannya.
Upaya penalaran — Untuk Gemma 4 E2B, kami merekomendasikan pengaturan reasoning_effort kehigh, yang memungkinkan mode berpikir. Varian ini cenderung bernalar secara ekstensif secara default, dan upaya penalaran yang tinggi membuat penalaran itu berada di saluran penalaran khusus, yang meningkatkan kualitas keluaran dan mencegah teks penalaran muncul dalam respons akhir.
Panggilan alat paralel — Meminta lebih dari satu panggilan alat dalam satu putaran saat ini tidak didukung. Alat permintaan panggilan satu per satu.
Minta ukuran payload - Total payload badan permintaan untuk Gemma 4 E2B, termasuk gambar dan video, mendukung ukuran maksimum 3,5 MB.

Awas Javascript dinonaktifkan atau tidak tersedia di browser Anda.

Untuk menggunakan Dokumentasi AWS, Javascript harus diaktifkan. Lihat halaman Bantuan browser Anda untuk petunjuk.

Konvensi Dokumen

Gemma 4 26 B-A4B

Gemma 3 12B IT