

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Gemma 4 31B
<a name="model-card-google-gemma-4-31b"></a>

## ![Logotipo do Google com ícone de letra G multicolorido.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/models/google.png) Google — Gemma 4 31B
<a name="model-card-google-gemma-4-31b-header"></a>

## Detalhes do modelo
<a name="model-card-google-gemma-4-31b-details"></a>

O Gemma 4 31B é o modelo denso de 30,7 bilhões de parâmetros do Google com raciocínio integrado, chamada de função nativa e entrada multimodal em texto e imagem, suportando uma janela de contexto de token de 256K. Para obter mais informações sobre desenvolvimento e desempenho de modelos, consulte o [model/service cartão](https://huggingface.co/google/gemma-4-31B-it).
+ **Data de lançamento do modelo:** 10 de junho de 2025
+ **Data de EOL do modelo:** N/A
+ **Contratos de licença de usuário final e termos de uso:** [Exibir](https://ai.google.dev/gemma/apache_2)
+ **Ciclo de vida do modelo**: Ativo
+ **Janela de contexto:** 256 mil tokens


| **Modalidades de entrada** | **Modalidades de saída** | **[APIs suportadas](https://docs.aws.amazon.com/bedrock/latest/userguide/apis.html)** | **[Endpoints suportados](https://docs.aws.amazon.com/bedrock/latest/userguide/endpoints.html)** | 
| --- | --- | --- | --- | 
| ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png)Áudio | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png)Incorporação | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-yes.png) Responses | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png) bedrock-runtime | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-yes.png)Imagem | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png)Imagem | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-yes.png) Chat Completions | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-yes.png) bedrock-mantle | 
| ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png)Discurso | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png)Discurso | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png) Invoke |  | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-yes.png)Texto | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-yes.png)Texto | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png) Converse |  | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-yes.png)Vídeo | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png)Vídeo | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png) Messages |  | 

**nota**  
Os modelos Gemma 4 estão disponíveis somente no `bedrock-mantle` endpoint.  
Esse modelo está disponível no `openai/v1/responses` caminho do `bedrock-mantle` endpoint. Isso é diferente do `v1/responses` caminho usado por outros modelos no endpoint de respostas.

## Capacidades e recursos
<a name="model-card-google-gemma-4-31b-capabilities"></a>

***Características do Bedrock***

**Recursos compatíveis com o `bedrock-mantle` endpoint**


| **Suportado** | **Não suportado** | 
| --- | --- | 
|  [See the AWS documentation website for more details](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/model-card-google-gemma-4-31b.html)  | — | 

## Preços
<a name="model-card-google-gemma-4-31b-pricing"></a>

Para obter os preços, consulte a página de [preços do Amazon Bedrock](https://aws.amazon.com/bedrock/pricing/).

## Acesso programático
<a name="model-card-google-gemma-4-31b-programmatic-access"></a>

Use os seguintes IDs de modelo e URLs de endpoint para acessar esse modelo programaticamente. [Para obter mais informações sobre as APIs e os endpoints disponíveis, consulte [APIs suportadas e Endpoints suportados](https://docs.aws.amazon.com/bedrock/latest/userguide/apis.html).](https://docs.aws.amazon.com/bedrock/latest/userguide/endpoints.html)


| **Endpoint** | **ID do modelo** | **In-Region URL do endpoint** | **ID de inferência geográfica** | **ID de inferência global** | 
| --- | --- | --- | --- | --- | 
| bedrock-mantle | google.gemma-4-31b | https://bedrock-mantle.{region}.api.aws/openai/v1 | Sem compatibilidade | Sem compatibilidade | 

*Por exemplo, se a região for us-east-1 (Norte da Virgínia), o URL do endpoint bedrock-mantle será "“. https://bedrock-mantle.us-east-1.api.aws/openai/v1*

## Níveis de serviço
<a name="model-card-google-gemma-4-31b-tiers"></a>

O Amazon Bedrock oferece vários níveis de serviço para atender às suas necessidades de carga de trabalho. O **Standard** fornece acesso pago por token sem compromisso. O **Priority** oferece maior produtividade com um compromisso baseado em tempo. O **Flex** fornece acesso de baixo custo para cargas de trabalho flexíveis e não urgentes. O **Reserved** fornece taxa de transferência dedicada com um compromisso de longo prazo para cargas de trabalho previsíveis. Para obter mais informações, consulte [níveis de serviço](https://docs.aws.amazon.com/bedrock/latest/userguide/service-tiers-inference.html).


| **Padrão** | **Priority** | **Flexionar** | **Reservado** | 
| --- | --- | --- | --- | 
| ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png) | 

## Disponibilidade regional
<a name="model-card-google-gemma-4-31b-regional-availability"></a>

***Visão geral da disponibilidade regional***

O Bedrock oferece três opções de inferência: **In-Region**mantém as solicitações em uma única região para conformidade estrita, Cross-Region rotas **geográficas** entre regiões dentro de uma geografia (EUA, UE etc.) para maior produtividade, respeitando a residência dos dados, e Cross-Region rotas **globais** em qualquer lugar do mundo para obter a máxima produtividade quando não há restrições de residência. Consulte a [Disponibilidade regional](models-region-compatibility.md) página para obter mais detalhes.


| **Região** | **In-Region** | **Geo** | **Global** | 
| --- | --- | --- | --- | 
| us-east-1(Norte da Virgínia) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png) | 
| us-east-2(Ohio) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png) | 
| us-west-2(Oregon) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png) | 
| eu-central-1(Frankfurt) | ![Green circle with white checkmark icon.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-yes.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png) | ![Red circle with white X icon indicating error, cancel, or close action.](http://docs.aws.amazon.com/pt_br/bedrock/latest/userguide/images/icons/icon-no.png) | 

## Cotas e limites
<a name="model-card-google-gemma-4-31b-quotas"></a>

Sua conta da AWS tem cotas padrão para manter o desempenho do serviço e garantir o uso adequado do Amazon Bedrock. [As cotas padrão atribuídas a uma conta podem ser atualizadas dependendo de fatores regionais, histórico de pagamentos, uso fraudulento e and/or aprovação de uma solicitação de aumento de cota.](https://docs.aws.amazon.com/bedrock/latest/userguide/quotas-increase.html) Para obter mais detalhes, consulte a [Cotas do Amazon Bedrock](quotas.md) documentação e veja os [limites](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock) do modelo.

Ao consumir a taxa de transferência sob demanda no `bedrock-mantle` endpoint, a taxa de [transferência disponível](https://docs.aws.amazon.com/bedrock/latest/userguide/scaling-throughput-best-practices.html#scaling-ramp-up) aumenta com o tempo. Nem todas as solicitações dentro de sua cota têm garantia de sucesso durante períodos de alta demanda, portanto, aumentar gradualmente é importante. Para esse modelo, os limites padrão não são apresentados diretamente por meio de Quotas de Serviço, então recomendamos seguir a rampa como guia.

## Código de exemplo
<a name="model-card-google-gemma-4-31b-sample-code"></a>

**Etapa 1 - Conta da AWS:** se você já tem uma conta da AWS, pule esta etapa. Se você é novo na AWS, cadastre-se em uma [conta da AWS](https://portal.aws.amazon.com/billing/signup).

**Etapa 2 - Chave de API:** acesse o [console do Amazon Bedrock](https://console.aws.amazon.com/bedrock/home#/api-keys/long-term/create) e gere uma chave de API de longo prazo.

**Etapa 3 - Obtenha o SDK:** para usar este guia de introdução, você deve ter o Python já instalado. Em seguida, instale o software relevante, dependendo das APIs que você está usando.

```
pip install openai
```

**Etapa 4 - Definir variáveis de ambiente:** configure seu ambiente para usar a chave de API para autenticação.

```
OPENAI_API_KEY="<provide your Bedrock API key>"
OPENAI_BASE_URL="https://bedrock-mantle.<your-region>.api.aws/openai/v1"
```

**Etapa 5 - Execute sua primeira solicitação de inferência:** salve o arquivo como `bedrock-first-request.py`

------
#### [ Chat Completions API ]

```
from openai import OpenAI

client = OpenAI()

response = client.chat.completions.create(
    model="google.gemma-4-31b",
    messages=[{"role": "user", "content": "Can you explain the features of Amazon Bedrock?"}]
    )
print(response)
```

------
#### [ Responses API ]

```
from openai import OpenAI

client = OpenAI()

response = client.responses.create(
    model="google.gemma-4-31b",
    input="Explain the benefits of mixture-of-experts architectures for production inference.",
    max_output_tokens=512,
)
print(response.output_text)
```

------

## Considerações e limitações de uso
<a name="model-card-google-gemma-4-31b-considerations"></a>
+ **Modo de raciocínio** — O esforço de raciocínio é respeitado nas APIs de conclusão e respostas de bate-papo, e o modelo executa o raciocínio estendido em ambos os casos. No entanto, o conteúdo do raciocínio é retornado somente pela API de respostas. A API Chat Completions não retorna os tokens de raciocínio, porque a especificação OpenAI Chat Completions não oferece suporte para devolvê-los.
+ **Chamadas de ferramentas paralelas** — A solicitação de mais de uma chamada de ferramenta em um único turno não é suportada atualmente. Solicite chamadas da ferramenta uma de cada vez.
+ **Tamanho da carga útil** da solicitação — A carga útil total do corpo da solicitação para Gemma 4 31B, incluindo imagens e vídeo, suporta um tamanho máximo de 3,5 MB.