O que é o Amazon Nova? - Amazon Nova

O que é o Amazon Nova?

nota

Esta documentação é para o Amazon Nova versão 1. O Amazon Nova 2 agora está disponível com novos modelos e recursos aprimorados. Novos recursos e atualizações de documentação são publicados no Guia do usuário do Amazon Nova 2. Para obter informações sobre as novidades do Amazon Nova 2, acesse Novidades no Amazon Nova 2.

Os modelos básicos do Amazon Nova entregam a última palavra em inteligência e desempenho de preço líder do setor. As organizações podem criar e escalar aplicações de IA generativa seguras, confiáveis e econômicas com o Amazon Nova. O Amazon Nova acelera a inovação da IA em todas as modalidades e casos de uso, incluindo texto, imagem, vídeo, fala, chamadas de API e IA agêntica. Para começar a criar com o Amazon Nova, você deve acessar os modelos por meio de uma API usando o Amazon Bedrock.

Categorias de modelos do Amazon Nova

O Amazon Nova entrega modelos básicos poderosos em três categorias: recursos de compreensão, criativos e de fala.

Modelo

Categoria

Descrição

Casos de uso

Regiões

Amazon Nova Premier

Noções básicas

O modelo multimodal mais capaz para tarefas complexas e o melhor instrutor para destilação de modelos personalizados para aplicações econômicas. Inclui várias entradas como texto, imagens, vídeo, documentos e código.

Interfaces de bate-papo interativas, sistemas de geração aumentada via recuperação (RAG), aplicações agênticas, análise de vídeo, automação de fluxo de trabalho de interface do usuário

Leste dos EUA (Norte da Virgínia) 1, AWS GovCloud (Oeste dos EUA)

Amazon Nova Pro

Noções básicas

Modelo multimodal altamente capaz com a melhor combinação de precisão, velocidade e custo para uma ampla variedade de tarefas. Inclui várias entradas como texto, imagens, vídeo, documentos e código.

Interfaces de bate-papo interativas, sistemas de geração aumentada via recuperação (RAG), aplicações agênticas, análise de vídeo, automação de fluxo de trabalho de interface do usuário

Leste dos EUA (Norte da Virgínia)1, Ásia-Pacífico (Sydney)1, Europa (Londres) 1, AWS GovCloud (Oeste dos EUA)

Amazon Nova Lite

Noções básicas

Modelo multimodal de custo muito baixo com processamento extremamente rápido de entradas de imagem, vídeo e texto. Inclui várias entradas como texto, imagens, vídeo, documentos e código.

Interfaces de bate-papo interativas, sistemas de geração aumentada via recuperação (RAG), aplicações agênticas, análise de vídeo, automação de fluxo de trabalho de interface do usuário

Leste dos EUA (Norte da Virgínia)1, Ásia-Pacífico (Sydney)1, Europa (Londres) 1, AWS GovCloud (Oeste dos EUA)

Amazon Nova Micro

Noções básicas

Modelo somente texto que oferece as respostas de menor latência a um custo muito baixo.

Interfaces de bate-papo interativas, sistemas de geração aumentada via recuperação (RAG), aplicações agênticas

Leste dos EUA (Norte da Virgínia)1, Ásia-Pacífico (Sydney)1, Europa (Londres) 1, AWS GovCloud (Oeste dos EUA)

Amazon Nova Canvas

Criativa

Modelo de geração de imagens de alta qualidade com personalização e controle. Transforma entradas de texto e imagem em imagens de nível profissional.

Mídia, entretenimento, varejo, marketing, publicidade, geração de conteúdo visual personalizável

Leste dos EUA (Norte da Virgínia), Europa (Irlanda), Ásia-Pacífico (Tóquio)

Amazon Nova Reel

Criativa

Modelo de geração de vídeo projetado para democratizar a geração de conteúdo criativo. Transforma entradas de texto e imagem em vídeos de nível profissional.

Mídia, entretenimento, varejo, marketing, publicidade, geração de conteúdo visual personalizável

Leste dos EUA (Norte da Virgínia), Europa (Irlanda), Ásia-Pacífico (Tóquio)

Amazon Nova Sonic

Fala

Modelo de base para a compreensão e a geração de fala conversacional em cinco idiomas (inglês (EUA, Reino Unido), francês, italiano, alemão e espanhol). Aceita fala como entrada e fornece fala com transcrições de texto como saída. Apresenta recursos de API de streaming bidirecional para conversas de vários turnos em tempo real e com baixa latência.

Assistentes virtuais, soluções de atendimento ao cliente, experiências de voz interativas, interações de voz em tempo real

Leste dos EUA (Norte da Virgínia), Europa (Estocolmo), Ásia-Pacífico (Tóquio)

1você pode acessar este modelo nas regiões adicionais por meio de inferência entre regiões: Leste dos EUA (Ohio), Oeste dos EUA (Oregon), Europa (Estocolmo), Europa (Irlanda), Europa (Frankfurt), Europa (Paris), Ásia-Pacífico (Tóquio), Ásia-Pacífico (Singapura), Ásia-Pacífico (Sydney), Ásia-Pacífico (Seul) e Ásia-Pacífico (Mumbai). Para saber mais, consulte Improve resilience with cross-region inference.

Para obter todas as informações sobre compatibilidade de modelos e regiões no Amazon Bedrock, consulte Supported foundation models in Amazon Bedrock.

Especificações do modelo

As tabelas a seguir fornecem especificações detalhadas para cada família de modelos do Amazon Nova.

Compreensão das especificações de modelos

Amazon Nova Premier

Amazon Nova Pro

Amazon Nova Lite

Amazon Nova Micro

ID do modelo

amazon.nova-premier-v1:0

amazon.nova-pro-v1:0

amazon.nova-lite-v1:0

amazon.nova-micro-v1:0

ID do perfil de inferência

us.amazon.nova-premier-v1:0

us.amazon.nova-pro-v1:0

us.amazon.nova-lite-v1:0

us.amazon.nova-micro-v1:0

Modalidades de entrada

Texto, imagem, vídeo

Texto, imagem, vídeo

Texto, imagem, vídeo

Texto

Modalidades de saída

Texto

Texto

Texto

Texto

Janela de contexto

1 milhão

300 mil

300 mil

128k

Máximo de tokens de saída

10 mil

10 mil

10 mil

10 mil

Idiomas compatíveis

200+11

200+11

200+11

200+11

Regiões

Leste dos EUA (Norte da Virgínia)2

Leste dos EUA (Norte da Virgínia)2, Ásia-Pacífico (Tóquio)2, Ásia-Pacífico (Sydney)2, Europa (Londres)2, AWS GovCloud (Oeste dos EUA)

Leste dos EUA (Norte da Virgínia)2, Ásia-Pacífico (Tóquio)2, Ásia-Pacífico (Sydney)2, Europa (Londres)2, AWS GovCloud (Oeste dos EUA)

Leste dos EUA (Norte da Virgínia)2, Ásia-Pacífico (Tóquio)2, Ásia-Pacífico (Sydney)2, Europa (Londres)2, AWS GovCloud (Oeste dos EUA)

Documentos de apoio

PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD

PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD

PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD

Não

API Converse

Sim

Sim

Sim

Sim

InvokeAPI

Sim

Sim

Sim

Sim

Streaming

Sim

Sim

Sim

Sim

Inferência em lote

Sim

Sim

Sim

Sim

Ajuste

Não

Sim

Sim

Sim

Throughput provisionado

Não

Sim

Sim

Sim

Bases de conhecimento para Bedrock

Sim

Sim

Sim

Sim

Agentes para Bedrock

Sim

Sim

Sim

Sim

Barreiras de proteção do Bedrock

Sim (somente texto)

Sim (somente texto)

Sim (somente texto)

Sim

Avaliações do Bedrock

Sim (somente texto)

Sim (somente texto)

Sim (somente texto)

Sim

Fluxos de prompts do Bedrock

Sim

Sim

Sim

Sim

Bedrock Studio

Sim

Sim

Sim

Sim

Destilação de modelos do Bedrock

Instrutor para: Pro, Lite e Micro

Instrutor para: Lite e Micro

Aprendiz de: Premier

Aprendiz de: Premier e Pro

Aprendiz de: Premier e Pro

1Otimizado para estes 15 idiomas: inglês, alemão, espanhol, francês, italiano, japonês, coreano, árabe, chinês simplificado, russo, hindi, português, holandês, turco e hebraico.

2Você pode acessar este modelo nas regiões Leste dos EUA (Ohio), Oeste dos EUA (Oregon), Europa (Estocolmo), Europa (Irlanda), Europa (Frankfurt), Europa (Paris), Ásia-Pacífico (Tóquio), Ásia-Pacífico (Singapura), Ásia-Pacífico (Sydney), Ásia-Pacífico (Seul) e Ásia-Pacífico (Mumbai) por meio de inferência entre regiões. A inferência entre regiões permite que você gerencie perfeitamente intermitências de tráfego não planejadas utilizando computação em diferentes Regiões da AWS. Com a inferência entre regiões, é possível distribuir o tráfego entre várias Regiões da AWS. Para saber mais sobre a inferência entre regiões, consulte Supported Regions and models for inference profiles e Improve resilience with cross-region inference no Guia do usuário do Amazon Bedrock.

Especificações do modelo criativo e de fala

Amazon Nova Canvas

Amazon Nova Reel

Amazon Nova Sonic

ID do modelo

amazon.nova-canvas-v1:0

amazon.nova-reel-v1:1

amazon.nova-sonic-v1:0

Modalidades de entrada

Texto, imagem

Texto, imagem

Fala

Modalidades de saída

Imagem

Vídeo

Fala com transcrição e respostas em texto

Tamanho máximo do prompt

1024 caracteres

Janela de contexto de entrada

512 caracteres

Contexto de 300K

Resolução de saída (tarefas de geração)

4,19 milhões de pixels (ou seja, 2048 x 2048, 2816 x 1536)

1280 x 720, 24 quadros por segundo

Resolução máxima de saída (tarefas de edição)

Deve atender a todos os itens abaixo:

  • 4096 pixels no seu lado mais longo

  • Taxa de proporção entre 1:4 e 4:1

  • Contagem total de pixels de 4,19 milhões ou menor

Duração máxima da conexão

Tempo limite de conexão de oito minutos, com no máximo vinte conexões simultâneas por cliente.1

Tipos de entrada com suporte

PNG, JPEG

PNG, JPEG

Idiomas compatíveis

Inglês

Inglês

Inglês (EUA, Reino Unido), francês, italiano, alemão e espanhol2

Regiões

Leste dos EUA (Norte da Virgínia), Europa (Irlanda), Ásia-Pacífico (Tóquio)

Leste dos EUA (Norte da Virgínia), Europa (Irlanda), Ásia-Pacífico (Tóquio)

Leste dos EUA (Norte da Virgínia), Europa (Estocolmo), Ásia-Pacífico (Tóquio)

API do modelo de invocação assíncrona

Não

Sim

API para invocar modelo

Sim

Não

Compatibilidade com a API de streaming bidirecional

Sim

Bases de conhecimento para Bedrock

Compatível por meio do uso de ferramentas (chamada de função)

1Por padrão, o limite de conexão é de oito minutos, mas você pode renovar a conexão e continuar a conversa fornecendo o histórico da conversa anterior.

2Para obter uma lista das vozes compatíveis, consulte Vozes disponíveis para o Amazon Nova Sonic.