Nova Lite - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Nova Lite

Amazon — Nova Lite

Detalhes do modelo

O Nova Lite é o modelo multimodal de baixo custo da Amazon que processa entradas de texto, imagens e vídeo para tarefas como análise de documentos e perguntas e respostas visuais. Para obter mais informações sobre desenvolvimento e desempenho do modelo, consulte o modelo/cartão de serviço.

  • Data de lançamento do modelo: 05 de dezembro de 2024

  • Data de EOL do modelo: Não antes de 12/4/2025

  • Contratos de licença de usuário final e termos de uso: Exibir

  • Ciclo de vida do modelo: Ativo

  • Janela de contexto: 300 mil tokens

  • Tokens de saída máximos: 5K

  • Limite de conhecimento: outubro de 2024

Modalidades de entrada Modalidades de saída APIs suportado Endpoints suportados
NoÁudioNoIncorporaçãoNo ResponsesYes bedrock-runtime
YesImagemNoImagemNo Chat CompletionsNo bedrock-mantle
NoDiscursoNoDiscursoYes Invoke
YesTextoYesTextoYes Converse
YesVídeoNoVídeo

Preços

Para obter os preços, consulte a página de preços do Amazon Bedrock.

Acesso programático

Use o modelo IDs e o endpoint URLs a seguir para acessar esse modelo programaticamente. Para obter mais informações sobre os endpoints disponíveis APIs , consulte APIs suportados e Endpoints suportados.

Endpoint ID do modelo URL do endpoint na região ID de inferência geográfica ID de inferência global
bedrock-runtime amazon.nova-lite-v1:0 https://bedrock-runtime.{region}.amazonaws.com

us.amazon.nova-lite-v1:0

eu.amazon.nova-lite-v1:0

Não compatível

Por exemplo, se a região for us-east-1 (Norte da Virgínia), a URL do endpoint bedrock-runtime será "" e para bedrock-mantle será https://bedrock-runtime.us-east-1.amazonaws.com "https://bedrock-mantle.us-east-1.api.aws/v1”.

Níveis de serviço

O Amazon Bedrock oferece vários níveis de serviço para atender às suas necessidades de carga de trabalho. O padrão fornece pay-per-token acesso sem compromisso. O Priority oferece maior produtividade com um compromisso baseado em tempo. O Flex fornece acesso de baixo custo para cargas de trabalho flexíveis. non-time-sensitive O Reserved fornece taxa de transferência dedicada com um compromisso de longo prazo para cargas de trabalho previsíveis. Para obter mais informações, consulte níveis de serviço.

Padrão Priority Flexionar Reservado
Yes No No No

Disponibilidade regional

Visão geral da disponibilidade regional

A Bedrock oferece três opções de inferência: In-Region mantém as solicitações em uma única região para conformidade estrita, rotas geográficas entre regiões dentro de uma geografia (EUA, UE, etc.) para maior produtividade, respeitando a residência dos dados, e rotas globais entre regiões em qualquer lugar do mundo para máxima produtividade quando não há restrições de residência. Consulte a Disponibilidade regional página para obter mais detalhes.

Região Na região Geo Global
us-east-1(Norte da Virgínia)YesYesNo
us-east-2(Ohio)NoYesNo
us-west-1(Norte da Califórnia)NoYesNo
us-west-2(Oregon)NoYesNo
us-gov-west-1 (GovCloud)YesNoNo
eu-central-1(Frankfurt)NoYesNo
eu-north-1(Estocolmo)YesYesNo
eu-south-1(Milão)NoYesNo
eu-south-2(Espanha)NoYesNo
eu-west-1(Irlanda)NoYesNo
eu-west-2(Londres)YesNoNo
eu-west-3(Paris)NoYesNo
ap-northeast-1(Tóquio)YesNoNo
ap-southeast-2(Sidney)YesNoNo
ap-southeast-3(Jacarta)YesNoNo
il-central-1(Telavive)NoYesNo
me-central-1(EMIRADOS ÁRABES UNIDOS)YesNoNo

Detalhes da inferência geográfica

Geo: EUA

ID de inferência geográfica: us.amazon.nova-lite-v1:0

Região de origem Regiões de destino
us-east-1 (N. Virginia)us-east-1 (Norte da Virgínia), us-east-2 (Ohio), us-west-2 (Oregon)
us-east-2 (Ohio)us-east-1 (Norte da Virgínia), us-east-2 (Ohio), us-west-2 (Oregon)
us-west-1 (Norte da Califórnia)us-east-1 (Norte da Virgínia), us-east-2 (Ohio), us-west-1 (Norte da Califórnia), us-west-2 (Oregon)
us-west-2 (Oregon)us-east-1 (Norte da Virgínia), us-east-2 (Ohio), us-west-2 (Oregon)

Geo: UE

ID de inferência geográfica: eu.amazon.nova-lite-v1:0

Região de origem Regiões de destino
eu-central-1 (Frankfurt)eu-central-1 (Frankfurt), eu-north-1 (Estocolmo), eu-west-1 (Irlanda), eu-west-3 (Paris)
eu-north-1 (Estocolmo)eu-central-1 (Frankfurt), eu-north-1 (Estocolmo), eu-west-1 (Irlanda), eu-west-3 (Paris)
eu-south-1 (Milão)eu-central-1 (Frankfurt), eu-north-1 (Estocolmo), eu-south-1 (Milão), eu-west-1 (Irlanda), eu-west-3 (Paris)
eu-south-2 (Espanha)eu-central-1 (Frankfurt), eu-north-1 (Estocolmo), eu-south-2 (Espanha), eu-west-1 (Irlanda), eu-west-3 (Paris)
eu-west-1 (Irlanda)eu-central-1 (Frankfurt), eu-north-1 (Estocolmo), eu-west-1 (Irlanda), eu-west-3 (Paris)
eu-west-3 (Paris)eu-central-1 (Frankfurt), eu-north-1 (Estocolmo), eu-west-1 (Irlanda), eu-west-3 (Paris)
il-central-1 (Tel Aviv)eu-central-1 (Frankfurt), eu-north-1 (Estocolmo), eu-south-1 (Milão), eu-west-1 (Irlanda), eu-west-3 (Paris), il-central-1 (Telavive)

Cotas e limites

Sua conta da AWS tem cotas padrão para manter o desempenho do serviço e garantir o uso adequado do Amazon Bedrock. As cotas padrão atribuídas a uma conta podem ser atualizadas dependendo de fatores regionais, histórico de pagamentos, uso fraudulento e and/or aprovação de uma solicitação de aumento de cota. Para obter mais detalhes, consulte a Cotas do Amazon Bedrock documentação e veja os limites do modelo.

Código de exemplo

Etapa 1 - Conta da AWS: se você já tem uma conta da AWS, pule esta etapa. Se você é novo na AWS, cadastre-se em uma conta da AWS.

Etapa 2 - Chave de API: acesse o console do Amazon Bedrock e gere uma chave de API de longo prazo.

Etapa 3 - Obtenha o SDK: para usar este guia de introdução, você deve ter o Python já instalado. Em seguida, instale o software relevante, dependendo do APIs que você está usando.

pip install boto3

Etapa 4 - Definir variáveis de ambiente: configure seu ambiente para usar a chave de API para autenticação.

AWS_BEARER_TOKEN_BEDROCK="<provide your Bedrock API key>"

Etapa 5 - Execute sua primeira solicitação de inferência: salve o arquivo como bedrock-first-request.py

Invoke API
import json import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.invoke_model( modelId='amazon.nova-lite-v1:0', body=json.dumps({ 'messages': [{ 'role': 'user', 'content': 'Can you explain the features of Amazon Bedrock?'}], 'max_tokens': 1024 }) ) print(json.loads(response['body'].read()))
Converse API
import boto3 client = boto3.client('bedrock-runtime', region_name='us-east-1') response = client.converse( modelId='amazon.nova-lite-v1:0', messages=[ { 'role': 'user', 'content': [{'text': 'Can you explain the features of Amazon Bedrock?'}] } ] ) print(response)