

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# Gemma 4 E2B
<a name="model-card-google-gemma-4-e2b"></a>

## ![Google logo with multicolored G letter icon.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/models/google.png) Google - Gemma 4 E2B
<a name="model-card-google-gemma-4-e2b-header"></a>

## 모델 세부 정보
<a name="model-card-google-gemma-4-e2b-details"></a>

Gemma 4 E2B는 51억 개의 총 파라미터와 계층별 임베딩(PLE)을 사용하는 23억 개의 유효 파라미터를 포함하는 Google의 소형 모델로, 텍스트 및 이미지 전반에 걸쳐 내장 추론, 네이티브 함수 호출 및 멀티모달 입력을 통해 지연 시간이 짧은 워크로드를 위해 설계되었으며 128K 토큰 컨텍스트 창을 지원합니다. 모델 개발 및 성능에 대한 자세한 내용은 [모델/서비스 카드를](https://huggingface.co/google/gemma-4-E2B-it) 참조하세요.
+ **모델 출시 날짜:** 2025년 6월 10일
+ **모델 EOL 날짜:** 해당 사항 없음
+ **최종 사용자 라이선스 계약 및 이용 약관:** [보기](https://ai.google.dev/gemma/apache_2)
+ **모델 수명 주기:** 활성
+ **컨텍스트 창:** 128K 토큰


| **입력 모달리티** | **출력 모달리티** | **[지원되는 APIs ](https://docs.aws.amazon.com/bedrock/latest/userguide/apis.html)** | **[지원되는 엔드포인트](https://docs.aws.amazon.com/bedrock/latest/userguide/endpoints.html)** | 
| --- | --- | --- | --- | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-yes.png) 오디오 | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) 임베딩 | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-yes.png) Responses | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) bedrock-runtime | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-yes.png) 이미지 | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) 이미지 | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-yes.png) Chat Completions | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-yes.png) bedrock-mantle | 
| ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) 음성 | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) 음성 | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) Invoke |  | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-yes.png) 텍스트 | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-yes.png) 텍스트 | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) Converse |  | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-yes.png) 비디오 | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) 비디오 | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) Messages |  | 

**참고**  
Gemma 4 모델은 `bedrock-mantle` 엔드포인트에서만 사용할 수 있습니다.  
이 모델은 `bedrock-mantle` 엔드포인트의 `openai/v1/responses` 경로에서 사용할 수 있습니다. 이는 응답 엔드포인트에서 다른 모델이 사용하는 `v1/responses` 경로와 다릅니다.

## 기능 및 기능
<a name="model-card-google-gemma-4-e2b-capabilities"></a>

***Bedrock 기능***

**`bedrock-mantle` 엔드포인트를 사용하여 지원되는 기능**


| **지원됨** | **지원되지 않음** | 
| --- | --- | 
|  [See the AWS documentation website for more details](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/model-card-google-gemma-4-e2b.html)  | — | 

## 가격 책정
<a name="model-card-google-gemma-4-e2b-pricing"></a>

요금은 [Amazon Bedrock 요금](https://aws.amazon.com/bedrock/pricing/) 페이지를 참조하세요.

## 프로그래밍 방식 액세스
<a name="model-card-google-gemma-4-e2b-programmatic-access"></a>

다음 모델 IDs 및 엔드포인트 URLs 사용하여이 모델에 프로그래밍 방식으로 액세스합니다. 사용 가능한 APIs 및 엔드포인트에 대한 자세한 내용은 [APIs ](https://docs.aws.amazon.com/bedrock/latest/userguide/apis.html) 및 [지원되는 엔드포인트를 참조하세요](https://docs.aws.amazon.com/bedrock/latest/userguide/endpoints.html).


| **Endpoint** | **모델 ID** | **리전 내 엔드포인트 URL** | **지리 추론 ID** | **글로벌 추론 ID** | 
| --- | --- | --- | --- | --- | 
| bedrock-mantle | google.gemma-4-e2b | https://bedrock-mantle.{region}.api.aws/openai/v1 | 지원되지 않음 | 지원되지 않음 | 

*예를 들어 리전이 us-east-1(버지니아 북부)인 경우 bedrock-mantle 엔드포인트 URL은 "https://bedrock-mantle.us-east-1.api.aws/openai/v1"이 됩니다.*

## 서비스 티어
<a name="model-card-google-gemma-4-e2b-tiers"></a>

Amazon Bedrock은 워크로드 요구 사항에 맞는 여러 서비스 티어를 제공합니다. **표준**은 약정 없이 pay-per-token 액세스를 제공합니다. **Priority**는 시간 기반 약정으로 더 높은 처리량을 제공합니다. **Flex**는 유연하고 non-time-sensitive 워크로드에 대해 저렴한 액세스를 제공합니다. **예약은** 예측 가능한 워크로드에 대한 기간 약정과 함께 전용 처리량을 제공합니다. 자세한 내용은 [서비스 계층을 참조하세요](https://docs.aws.amazon.com/bedrock/latest/userguide/service-tiers-inference.html).


| **표준** | **우선 순위** | **Flex** | **예약됨** | 
| --- | --- | --- | --- | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) | 

## 리전별 가용성
<a name="model-card-google-gemma-4-e2b-regional-availability"></a>

***리전별 가용성 개요***

Bedrock은 세 가지 추론 옵션을 제공합니다. **리전 내**는 엄격한 규정 준수를 위해 단일 리전 내에 요청을 유지하고, 리전(미국, EU 등) 내 리전 간 **지리적 교차 리전** 경로는 데이터 레지던시를 준수하면서 더 높은 처리량을 제공하며, **글로벌 교차 리전** 경로는 레지던시 제약이 없는 경우 최대 처리량을 위해 전 세계 어디서나 라우팅됩니다. 자세한 내용은 [리전별 가용성](models-region-compatibility.md) 페이지를 참조하세요.


| **리전** | **리전 내** | **지리** | [**Global**] | 
| --- | --- | --- | --- | 
| us-east-1 (버지니아 북부) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) | 
| us-east-2 (오하이오) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) | 
| us-west-2 (오레곤) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) | 
| eu-central-1 (프랑크푸르트) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/ko_kr/bedrock/latest/userguide/images/icons/icon-no.png) | 

## 할당량과 제한
<a name="model-card-google-gemma-4-e2b-quotas"></a>

AWS 계정에는 서비스 성능을 유지하고 Amazon Bedrock을 적절하게 사용할 수 있는 기본 할당량이 있습니다. 계정에 할당된 기본 할당량은 리전 요인, 결제 기록, 사기 사용 및/또는 할당량 [증가 요청](https://docs.aws.amazon.com/bedrock/latest/userguide/quotas-increase.html) 승인에 따라 업데이트될 수 있습니다. 자세한 내용은 [Amazon Bedrock의 할당량](quotas.md) 설명서를 참조하고 모델의 [제한을](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock) 참조하세요.

`bedrock-mantle` 엔드포인트에서 온디맨드 처리량을 사용하는 경우 [사용 가능한 처리량은 시간이 지남에 따라 확장됩니다](https://docs.aws.amazon.com/bedrock/latest/userguide/scaling-throughput-best-practices.html#scaling-ramp-up). 할당량 내의 모든 요청이 수요가 많은 기간 동안 성공한다는 보장은 없으므로 점진적으로 확장하는 것이 중요합니다. 이 모델의 경우 기본 제한은 Service Quotas를 통해 직접 표시되지 않으므로 가이드로 램프를 따르는 것이 좋습니다.

## 샘플 코드
<a name="model-card-google-gemma-4-e2b-sample-code"></a>

**1단계 - AWS 계정:** AWS 계정이 이미 있는 경우이 단계를 건너뜁니다. AWS를 처음 사용하는 경우 [AWS 계정에](https://portal.aws.amazon.com/billing/signup) 가입합니다.

**2단계 - API 키:** [Amazon Bedrock 콘솔](https://console.aws.amazon.com/bedrock/home#/api-keys/long-term/create)로 이동하여 장기 API 키를 생성합니다.

**3단계 - SDK 가져오기:이 시작 안내서를** 사용하려면 Python이 이미 설치되어 있어야 합니다. 그런 다음 사용 중인 APIs에 따라 관련 소프트웨어를 설치합니다.

```
pip install openai
```

**4단계 - 환경 변수 설정:** 인증에 API 키를 사용하도록 환경을 구성합니다.

```
OPENAI_API_KEY="<provide your Bedrock API key>"
OPENAI_BASE_URL="https://bedrock-mantle.<your-region>.api.aws/openai/v1"
```

**5단계 - 첫 번째 추론 요청 실행:** 파일을 로 저장 `bedrock-first-request.py`

------
#### [ Chat Completions API ]

```
from openai import OpenAI

client = OpenAI()

response = client.chat.completions.create(
    model="google.gemma-4-e2b",
    messages=[{"role": "user", "content": "Can you explain the features of Amazon Bedrock?"}]
    )
print(response)
```

------
#### [ Responses API ]

```
from openai import OpenAI

client = OpenAI()

response = client.responses.create(
    model="google.gemma-4-e2b",
    input="Explain the benefits of mixture-of-experts architectures for production inference.",
    max_output_tokens=512,
)
print(response.output_text)
```

------

## 사용 고려 사항 및 제한 사항
<a name="model-card-google-gemma-4-e2b-considerations"></a>
+ **추론 모드** - 채팅 완료 및 응답 APIs 모두에 대해 추론 노력을 기울이며, 모델은 두 경우 모두 확장된 추론을 수행합니다. 그러나 추론 콘텐츠는 응답 API에서만 반환됩니다. OpenAI Chat Completions 사양은 토큰 반환을 지원하지 않으므로 Chat Completions API는 추론 토큰을 반환하지 않습니다.
+ **합리적인 노력** - Gemma 4 E2B의 경우를 `reasoning_effort`로 설정하여 사고 모드를 활성화`high`하는 것이 좋습니다. 이 변형은 기본적으로 광범위하게 추론하는 경향이 있으며, 추론 노력이 높으면 전용 추론 채널에서 추론이 유지되므로 출력 품질이 향상되고 추론 텍스트가 최종 응답에 나타나지 않습니다.
+ **병렬 도구 호출** - 한 번에 둘 이상의 도구 호출을 요청하는 것은 현재 지원되지 않습니다. 요청 도구는 한 번에 하나씩 호출합니다.
+ **요청 페이로드 크기** - 이미지 및 비디오를 포함한 Gemma 4 E2B의 총 요청 본문 페이로드는 최대 3.5MB를 지원합니다.