Categorias de modelos do Amazon Nova Especificações do modelo

O que é o Amazon Nova?

nota

Esta documentação é para o Amazon Nova versão 1. O Amazon Nova 2 agora está disponível com novos modelos e recursos aprimorados. Novos recursos e atualizações de documentação são publicados no Guia do usuário do Amazon Nova 2. Para obter informações sobre as novidades do Amazon Nova 2, acesse Novidades no Amazon Nova 2.

Os modelos básicos do Amazon Nova entregam a última palavra em inteligência e desempenho de preço líder do setor. As organizações podem criar e escalar aplicações de IA generativa seguras, confiáveis e econômicas com o Amazon Nova. O Amazon Nova acelera a inovação da IA em todas as modalidades e casos de uso, incluindo texto, imagem, vídeo, fala, chamadas de API e IA agêntica. Para começar a criar com o Amazon Nova, você deve acessar os modelos por meio de uma API usando o Amazon Bedrock.

Categorias de modelos do Amazon Nova

O Amazon Nova entrega modelos básicos poderosos em três categorias: recursos de compreensão, criativos e de fala.

Modelo	Categoria	Descrição	Casos de uso	Regiões
Amazon Nova Premier	Noções básicas	O modelo multimodal mais capaz para tarefas complexas e o melhor instrutor para destilação de modelos personalizados para aplicações econômicas. Inclui várias entradas como texto, imagens, vídeo, documentos e código.	Interfaces de bate-papo interativas, sistemas de geração aumentada via recuperação (RAG), aplicações agênticas, análise de vídeo, automação de fluxo de trabalho de interface do usuário	Leste dos EUA (Norte da Virgínia) ¹, AWS GovCloud (Oeste dos EUA)
Amazon Nova Pro	Noções básicas	Modelo multimodal altamente capaz com a melhor combinação de precisão, velocidade e custo para uma ampla variedade de tarefas. Inclui várias entradas como texto, imagens, vídeo, documentos e código.	Interfaces de bate-papo interativas, sistemas de geração aumentada via recuperação (RAG), aplicações agênticas, análise de vídeo, automação de fluxo de trabalho de interface do usuário	Leste dos EUA (Norte da Virgínia)¹, Ásia-Pacífico (Sydney)¹, Europa (Londres) ¹, AWS GovCloud (Oeste dos EUA)
Amazon Nova Lite	Noções básicas	Modelo multimodal de custo muito baixo com processamento extremamente rápido de entradas de imagem, vídeo e texto. Inclui várias entradas como texto, imagens, vídeo, documentos e código.	Interfaces de bate-papo interativas, sistemas de geração aumentada via recuperação (RAG), aplicações agênticas, análise de vídeo, automação de fluxo de trabalho de interface do usuário	Leste dos EUA (Norte da Virgínia)¹, Ásia-Pacífico (Sydney)¹, Europa (Londres) ¹, AWS GovCloud (Oeste dos EUA)
Amazon Nova Micro	Noções básicas	Modelo somente texto que oferece as respostas de menor latência a um custo muito baixo.	Interfaces de bate-papo interativas, sistemas de geração aumentada via recuperação (RAG), aplicações agênticas	Leste dos EUA (Norte da Virgínia)¹, Ásia-Pacífico (Sydney)¹, Europa (Londres) ¹, AWS GovCloud (Oeste dos EUA)
Amazon Nova Canvas	Criativa	Modelo de geração de imagens de alta qualidade com personalização e controle. Transforma entradas de texto e imagem em imagens de nível profissional.	Mídia, entretenimento, varejo, marketing, publicidade, geração de conteúdo visual personalizável	Leste dos EUA (Norte da Virgínia), Europa (Irlanda), Ásia-Pacífico (Tóquio)
Amazon Nova Reel	Criativa	Modelo de geração de vídeo projetado para democratizar a geração de conteúdo criativo. Transforma entradas de texto e imagem em vídeos de nível profissional.	Mídia, entretenimento, varejo, marketing, publicidade, geração de conteúdo visual personalizável	Leste dos EUA (Norte da Virgínia), Europa (Irlanda), Ásia-Pacífico (Tóquio)
Amazon Nova Sonic	Fala	Modelo de base para a compreensão e a geração de fala conversacional em cinco idiomas (inglês (EUA, Reino Unido), francês, italiano, alemão e espanhol). Aceita fala como entrada e fornece fala com transcrições de texto como saída. Apresenta recursos de API de streaming bidirecional para conversas de vários turnos em tempo real e com baixa latência.	Assistentes virtuais, soluções de atendimento ao cliente, experiências de voz interativas, interações de voz em tempo real	Leste dos EUA (Norte da Virgínia), Europa (Estocolmo), Ásia-Pacífico (Tóquio)

¹você pode acessar este modelo nas regiões adicionais por meio de inferência entre regiões: Leste dos EUA (Ohio), Oeste dos EUA (Oregon), Europa (Estocolmo), Europa (Irlanda), Europa (Frankfurt), Europa (Paris), Ásia-Pacífico (Tóquio), Ásia-Pacífico (Singapura), Ásia-Pacífico (Sydney), Ásia-Pacífico (Seul) e Ásia-Pacífico (Mumbai). Para saber mais, consulte Improve resilience with cross-region inference.

Para obter todas as informações sobre compatibilidade de modelos e regiões no Amazon Bedrock, consulte Supported foundation models in Amazon Bedrock.

Especificações do modelo

As tabelas a seguir fornecem especificações detalhadas para cada família de modelos do Amazon Nova.

Compreensão das especificações de modelos

	Amazon Nova Premier	Amazon Nova Pro	Amazon Nova Lite	Amazon Nova Micro
ID do modelo	amazon.nova-premier-v1:0	amazon.nova-pro-v1:0	amazon.nova-lite-v1:0	amazon.nova-micro-v1:0
ID do perfil de inferência	us.amazon.nova-premier-v1:0	us.amazon.nova-pro-v1:0	us.amazon.nova-lite-v1:0	us.amazon.nova-micro-v1:0
Modalidades de entrada	Texto, imagem, vídeo	Texto, imagem, vídeo	Texto, imagem, vídeo	Texto
Modalidades de saída	Texto	Texto	Texto	Texto
Janela de contexto	1 milhão	300 mil	300 mil	128k
Máximo de tokens de saída	10 mil	10 mil	10 mil	10 mil
Idiomas compatíveis	200+1¹	200+1¹	200+1¹	200+1¹
Regiões	Leste dos EUA (Norte da Virgínia)²	Leste dos EUA (Norte da Virgínia)², Ásia-Pacífico (Tóquio)², Ásia-Pacífico (Sydney)², Europa (Londres)², AWS GovCloud (Oeste dos EUA)	Leste dos EUA (Norte da Virgínia)², Ásia-Pacífico (Tóquio)², Ásia-Pacífico (Sydney)², Europa (Londres)², AWS GovCloud (Oeste dos EUA)	Leste dos EUA (Norte da Virgínia)², Ásia-Pacífico (Tóquio)², Ásia-Pacífico (Sydney)², Europa (Londres)², AWS GovCloud (Oeste dos EUA)
Documentos de apoio	PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD	PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD	PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD	Não
API Converse	Sim	Sim	Sim	Sim
InvokeAPI	Sim	Sim	Sim	Sim
Streaming	Sim	Sim	Sim	Sim
Inferência em lote	Sim	Sim	Sim	Sim
Ajuste	Não	Sim	Sim	Sim
Throughput provisionado	Não	Sim	Sim	Sim
Bases de conhecimento para Bedrock	Sim	Sim	Sim	Sim
Agentes para Bedrock	Sim	Sim	Sim	Sim
Barreiras de proteção do Bedrock	Sim (somente texto)	Sim (somente texto)	Sim (somente texto)	Sim
Avaliações do Bedrock	Sim (somente texto)	Sim (somente texto)	Sim (somente texto)	Sim
Fluxos de prompts do Bedrock	Sim	Sim	Sim	Sim
Bedrock Studio	Sim	Sim	Sim	Sim
Destilação de modelos do Bedrock	Instrutor para: Pro, Lite e Micro	Instrutor para: Lite e Micro Aprendiz de: Premier	Aprendiz de: Premier e Pro	Aprendiz de: Premier e Pro

¹Otimizado para estes 15 idiomas: inglês, alemão, espanhol, francês, italiano, japonês, coreano, árabe, chinês simplificado, russo, hindi, português, holandês, turco e hebraico.

²Você pode acessar este modelo nas regiões Leste dos EUA (Ohio), Oeste dos EUA (Oregon), Europa (Estocolmo), Europa (Irlanda), Europa (Frankfurt), Europa (Paris), Ásia-Pacífico (Tóquio), Ásia-Pacífico (Singapura), Ásia-Pacífico (Sydney), Ásia-Pacífico (Seul) e Ásia-Pacífico (Mumbai) por meio de inferência entre regiões. A inferência entre regiões permite que você gerencie perfeitamente intermitências de tráfego não planejadas utilizando computação em diferentes Regiões da AWS. Com a inferência entre regiões, é possível distribuir o tráfego entre várias Regiões da AWS. Para saber mais sobre a inferência entre regiões, consulte Supported Regions and models for inference profiles e Improve resilience with cross-region inference no Guia do usuário do Amazon Bedrock.

Especificações do modelo criativo e de fala

	Amazon Nova Canvas	Amazon Nova Reel	Amazon Nova Sonic
ID do modelo	amazon.nova-canvas-v1:0	amazon.nova-reel-v1:1	amazon.nova-sonic-v1:0
Modalidades de entrada	Texto, imagem	Texto, imagem	Fala
Modalidades de saída	Imagem	Vídeo	Fala com transcrição e respostas em texto
Tamanho máximo do prompt	1024 caracteres
Janela de contexto de entrada		512 caracteres	Contexto de 300K
Resolução de saída (tarefas de geração)	4,19 milhões de pixels (ou seja, 2048 x 2048, 2816 x 1536)	1280 x 720, 24 quadros por segundo
Resolução máxima de saída (tarefas de edição)	Deve atender a todos os itens abaixo: 4096 pixels no seu lado mais longo Taxa de proporção entre 1:4 e 4:1 Contagem total de pixels de 4,19 milhões ou menor
Duração máxima da conexão			Tempo limite de conexão de oito minutos, com no máximo vinte conexões simultâneas por cliente.¹
Tipos de entrada com suporte	PNG, JPEG	PNG, JPEG
Idiomas compatíveis	Inglês	Inglês	Inglês (EUA, Reino Unido), francês, italiano, alemão e espanhol²
Regiões	Leste dos EUA (Norte da Virgínia), Europa (Irlanda), Ásia-Pacífico (Tóquio)	Leste dos EUA (Norte da Virgínia), Europa (Irlanda), Ásia-Pacífico (Tóquio)	Leste dos EUA (Norte da Virgínia), Europa (Estocolmo), Ásia-Pacífico (Tóquio)
API do modelo de invocação assíncrona	Não	Sim
API para invocar modelo	Sim	Não
Compatibilidade com a API de streaming bidirecional			Sim
Bases de conhecimento para Bedrock			Compatível por meio do uso de ferramentas (chamada de função)

¹Por padrão, o limite de conexão é de oito minutos, mas você pode renovar a conexão e continuar a conversa fornecendo o histórico da conversa anterior.

²Para obter uma lista das vozes compatíveis, consulte Vozes disponíveis para o Amazon Nova Sonic.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Introdução