As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Gemma 3 4B IT
Google — Gemma 3 4B IT
Detalhes do modelo
O Gemma 3 4B IT é o modelo aberto compacto de 4 bilhões de parâmetros do Google com ajuste de instruções, projetado para implantação no dispositivo e na borda. Para obter mais informações sobre desenvolvimento e desempenho de modelos, consulte o model/service cartão
Data de lançamento do modelo: 12 de março de 2025
Data de EOL do modelo: N/A
Contratos de licença de usuário final e termos de uso: Exibir
Ciclo de vida do modelo: Ativo
Janela de contexto: 128K tokens
Tokens de saída máximos: 8K
| Modalidades de entrada | Modalidades de saída | APIs suportadas | Endpoints suportados |
|---|---|---|---|
Responses | bedrock-runtime | ||
Chat Completions | bedrock-mantle | ||
Invoke | |||
Converse | |||
nota
Sempre que possível, recomendamos que você use o bedrock-mantle endpoint.
Capacidades e recursos
Características do Bedrock
Recursos compatíveis com o bedrock-mantle endpoint
| Suportado | Não suportado |
|---|---|
Recursos compatíveis com o bedrock-runtime endpoint
Preços
Para obter os preços, consulte a página de preços do Amazon Bedrock
Acesso programático
Use os seguintes IDs de modelo e URLs de endpoint para acessar esse modelo programaticamente. Para obter mais informações sobre as APIs e os endpoints disponíveis, consulte APIs suportadas e Endpoints suportados.
| Endpoint | ID do modelo | In-Region URL do endpoint | ID de inferência geográfica | ID de inferência global |
|---|---|---|---|---|
bedrock-runtime |
google.gemma-3-4b-it |
https://bedrock-runtime.{region}.amazonaws.com |
Sem compatibilidade | Sem compatibilidade |
bedrock-mantle |
google.gemma-3-4b-it |
https://bedrock-mantle.{region}.api.aws/v1 |
Sem compatibilidade | Sem compatibilidade |
Por exemplo, se a região for us-east-1 (Norte da Virgínia), a URL do endpoint bedrock-runtime será "" e para bedrock-mantle será https://bedrock-runtime.us-east-1.amazonaws.com "“. https://bedrock-mantle.us-east-1.api.aws/v1
Níveis de serviço
O Amazon Bedrock oferece vários níveis de serviço para atender às suas necessidades de carga de trabalho. O Standard fornece acesso pago por token sem compromisso. O Priority oferece maior produtividade com um compromisso baseado em tempo. O Flex fornece acesso de baixo custo para cargas de trabalho flexíveis e não urgentes. O Reserved fornece taxa de transferência dedicada com um compromisso de longo prazo para cargas de trabalho previsíveis. Para obter mais informações, consulte níveis de serviço.
| Padrão | Priority | Flexionar | Reservado |
|---|---|---|---|
Disponibilidade regional
Visão geral da disponibilidade regional
O Bedrock oferece três opções de inferência: In-Regionmantém as solicitações em uma única região para conformidade estrita, Cross-Region rotas geográficas entre regiões dentro de uma geografia (EUA, UE etc.) para maior produtividade, respeitando a residência dos dados, e Cross-Region rotas globais em qualquer lugar do mundo para obter a máxima produtividade quando não há restrições de residência. Consulte a Disponibilidade regional página para obter mais detalhes.
| Região | In-Region | Geo | Global |
|---|---|---|---|
us-east-1(Norte da Virgínia) | |||
us-east-2(Ohio) | |||
us-west-2(Oregon) | |||
eu-south-1(Milão) | |||
eu-west-1(Irlanda) | |||
eu-west-2(Londres) | |||
ap-northeast-1(Tóquio) | |||
ap-south-1(Mumbai) | |||
ap-southeast-2(Sidney) | |||
sa-east-1(São Paulo) | |||
ap-southeast-3(Jacarta) | |||
ap-southeast-4(Melbourne) | |||
eu-central-1(Frankfurt) | |||
eu-north-1(Estocolmo) |
Cotas e limites
Sua conta da AWS tem cotas padrão para manter o desempenho do serviço e garantir o uso adequado do Amazon Bedrock. As cotas padrão atribuídas a uma conta podem ser atualizadas dependendo de fatores regionais, histórico de pagamentos, uso fraudulento e and/or aprovação de uma solicitação de aumento de cota. Para obter mais detalhes, consulte a Cotas do Amazon Bedrock documentação e veja os limites do modelo.
Código de exemplo
Etapa 1 - Conta da AWS: se você já tem uma conta da AWS, pule esta etapa. Se você é novo na AWS, cadastre-se em uma conta da AWS
Etapa 2 - Chave de API: acesse o console do Amazon Bedrock
Etapa 3 - Obtenha o SDK: para usar este guia de introdução, você deve ter o Python já instalado. Em seguida, instale o software relevante, dependendo das APIs que você está usando.
Etapa 4 - Definir variáveis de ambiente: configure seu ambiente para usar a chave de API para autenticação.
Etapa 5 - Execute sua primeira solicitação de inferência: salve o arquivo como bedrock-first-request.py