Categorías de modelos de Amazon Nova Especificaciones del modelo

¿Qué es Amazon Nova?

nota

Esta documentación corresponde a la versión 1 de Amazon Nova. Amazon Nova 2 ya está disponible con nuevos modelos y funciones mejoradas. Las nuevas características y actualizaciones de la documentación se publican en la Guía del usuario de Amazon Nova 2. Para obtener información sobre las novedades de Amazon Nova 2, consulte What's new in Amazon Nova 2.

Los modelos fundacionales de Amazon Nova ofrecen inteligencia de vanguardia y un rendimiento líder en el sector respecto del precio. Con Amazon Nova, las organizaciones pueden crear y escalar aplicaciones de IA generativa que sean seguras, fiables y rentables. Amazon Nova acelera la innovación de la IA en todas las modalidades y casos de uso, incluyendo texto, imagen, vídeo, voz, llamadas a API e IA agéntica. Para empezar a crear con Amazon Nova, debe acceder a los modelos a través de una API mediante Amazon Bedrock.

Categorías de modelos de Amazon Nova

Amazon Nova ofrece potentes modelos fundacionales en cuanto a tres categorías: comprensión, creatividad y capacidades de habla.

Modelo	Categoría	Descripción	Casos de uso	Regions
Amazon Nova Premier	Descripción	Es nuestro modelo multimodal más capaz para tareas complejas y nuestro mejor instructor para destilar modelos personalizados orientados a aplicaciones rentables. Es capaz de comprender diversas entradas, como texto, imágenes, video, documentos y código.	Interfaces de chat interactivas, sistemas de generación aumentada por recuperación (RAG), aplicaciones de agentes, análisis de video y soluciones de automatización del flujo de trabajo de la interfaz de usuario.	Este de EE. UU. (Norte de Virginia)¹, AWS GovCloud (Oeste de EE. UU.)
Amazon Nova Pro	Descripción	Modelo multimodal de gran capacidad con la mejor combinación de precisión, velocidad y costo para una amplia gama de tareas. Es capaz de comprender diversas entradas, como texto, imágenes, video, documentos y código.	Interfaces de chat interactivas, sistemas de generación aumentada por recuperación (RAG), aplicaciones de agentes, análisis de video y soluciones de automatización del flujo de trabajo de la interfaz de usuario.	Este de EE. UU. (Norte de Virginia)¹, Asia-Pacífico (Sídney)¹, Europa (Londres)¹, AWS GovCloud (Oeste de EE. UU.)
Amazon Nova Lite	Descripción	Es un modelo multimodal de muy bajo costo que es ultrarrápido para procesar entradas de imágenes, video y texto. Es capaz de comprender diversas entradas, como texto, imágenes, video, documentos y código.	Interfaces de chat interactivas, sistemas de generación aumentada por recuperación (RAG), aplicaciones de agentes, análisis de video y soluciones de automatización del flujo de trabajo de la interfaz de usuario.	Este de EE. UU. (Norte de Virginia)¹, Asia-Pacífico (Sídney)¹, Europa (Londres)¹, AWS GovCloud (Oeste de EE. UU.)
Amazon Nova Micro	Descripción	Es un modelo de solo texto que ofrece las respuestas de menor latencia a un costo muy bajo.	Interfaces de chat interactivas, sistemas de generación aumentada por recuperación (RAG) y aplicaciones de agentes	Este de EE. UU. (Norte de Virginia)¹, Asia-Pacífico (Sídney)¹, Europa (Londres)¹, AWS GovCloud (Oeste de EE. UU.)
Amazon Nova Canvas	Creative	Es un modelo de generación de imágenes de alta calidad con personalización y control. Transforma las entradas de texto e imágenes en imágenes profesionales.	Contenido multimedia, entretenimiento, venta minorista, marketing, publicidad y generación de contenido visual personalizable	Este de EE. UU. (Norte de Virginia), Europa (Irlanda) y Asia-Pacífico (Tokio)
Amazon Nova Reel	Creative	Es un modelo de generación de video diseñado para democratizar la generación de contenido creativo. Transforma las entradas de texto e imágenes en videos profesionales.	Contenido multimedia, entretenimiento, venta minorista, marketing, publicidad y generación de contenido visual personalizable	Este de EE. UU. (Norte de Virginia), Europa (Irlanda) y Asia-Pacífico (Tokio)
Amazon Nova Sonic	Speech	Es un modelo fundacional para la comprensión y generación de voz conversacional en cinco idiomas: inglés (EE. UU., Reino Unido), francés, italiano, alemán y español. Acepta voz como entrada y proporciona voz con transcripciones de texto como salida. Incluye capacidades de API de transmisión continua bidireccional, lo que permite mantener conversaciones en tiempo real y de baja latencia en varios turnos.	Asistentes virtuales, soluciones de servicio al cliente, experiencias de voz interactivas e interacciones de voz en tiempo real	Este de EE. UU. (Norte de Virginia), Europa (Estocolmo) y Asia-Pacífico (Tokio)

¹Puede acceder a este modelo en regiones adicionales mediante inferencia entre regiones: Este de EE. UU. (Ohio), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Irlanda), Europa (Fráncfort), Europa (París), Asia-Pacífico (Tokio), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Seúl) y Asia-Pacífico (Mumbai). Para obtener más información, consulte Improve resilience with cross-region inference.

Para obtener información completa sobre la compatibilidad de modelos y regiones en Amazon Bedrock, consulte Supported foundation models in Amazon Bedrock.

Especificaciones del modelo

En las siguientes tablas se proporcionan especificaciones detalladas para cada familia de modelos de Amazon Nova.

Descripción de las especificaciones del modelo

	Amazon Nova Premier	Amazon Nova Pro	Amazon Nova Lite	Amazon Nova Micro
ID del modelo	amazon.nova-premier-v1:0	amazon.nova-pro-v1:0	amazon.nova-lite-v1:0	amazon.nova-micro-v1:0
ID del perfil de inferencia	us.amazon.nova-premier-v1:0	us.amazon.nova-pro-v1:0	us.amazon.nova-lite-v1:0	us.amazon.nova-micro-v1:0
Modalidades de entrada	Texto, imagen, video	Texto, imagen, video	Texto, imagen, video	Texto
Modalidades de salida	Texto	Texto	Texto	Texto
Ventana de contexto	1M	300 000	300 000	128 000
Cantidad máxima de tokens de salida	10 000	10 000	10 000	10 000
Idiomas admitidos	200+1¹	200+1¹	200+1¹	200+1¹
Regions	Este de EE. UU. (Norte de Virginia)²	Este de EE. UU. (Norte de Virginia)², Asia-Pacífico (Tokio)², Asia-Pacífico (Sídney)², Europa (Londres)², AWS GovCloud (Oeste de EE. UU.)	Este de EE. UU. (Norte de Virginia)², Asia-Pacífico (Tokio)², Asia-Pacífico (Sídney)², Europa (Londres)², AWS GovCloud (Oeste de EE. UU.)	Este de EE. UU. (Norte de Virginia)², Asia-Pacífico (Tokio)², Asia-Pacífico (Sídney)², Europa (Londres)², AWS GovCloud (Oeste de EE. UU.)
Compatibilidad con documentos	PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD	PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD	PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD	No
API de Converse	Sí	Sí	Sí	Sí
API de Invoke	Sí	Sí	Sí	Sí
Streaming	Sí	Sí	Sí	Sí
Inferencia en lotes	Sí	Sí	Sí	Sí
Afinamiento	No	Sí	Sí	Sí
Rendimiento aprovisionado	No	Sí	Sí	Sí
Bases de conocimientos de Bedrock	Sí	Sí	Sí	Sí
Agentes de Bedrock	Sí	Sí	Sí	Sí
Barreras de protección de Bedrock	Sí (solo texto)	Sí (solo texto)	Sí (solo texto)	Sí
Evaluaciones de Bedrock	Sí (solo texto)	Sí (solo texto)	Sí (solo texto)	Sí
Flujos de peticiones de Bedrock	Sí	Sí	Sí	Sí
Bedrock Studio	Sí	Sí	Sí	Sí
Destilación de modelos de Bedrock	Instructor de Pro, Lite y Micro	Instructor de Lite y Micro Aprendiz de Premier	Aprendiz de Premier y Pro	Aprendiz de Premier y Pro

¹Optimizado para estos 15 idiomas: inglés, alemán, español, francés, italiano, japonés, coreano, árabe, chino simplificado, ruso, hindi, portugués, neerlandés, turco y hebreo.

²Puede acceder a este modelo en las regiones Este de EE. UU. (Ohio), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Irlanda), Europa (Fráncfort), Europa (París), Asia-Pacífico (Tokio), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Seúl) y Asia-Pacífico (Mumbai) mediante inferencia entre regiones. La inferencia entre regiones le permite administrar las ráfagas de tráfico no planificadas sin problemas mediante la computación en diferentes Regiones de AWS. Con la inferencia entre regiones, puede distribuir el tráfico entre varias Regiones de AWS. Para obtener información sobre la inferencia entre regiones, consulte Supported Regions and models for inference profiles y Improve resilience with cross-region inference en la Guía del usuario de Amazon Bedrock.

Especificaciones de los modelos creativos y de voz

	Amazon Nova Canvas	Amazon Nova Reel	Amazon Nova Sonic
ID del modelo	amazon.nova-canvas-v1:0	amazon.nova-reel-v1:1	amazon.nova-sonic-v1:0
Modalidades de entrada	Texto, imagen	Texto, imagen	Speech
Modalidades de salida	Image	Video	Voz con transcripción y respuestas de texto
Longitud máxima de la petición	1024 caracteres
Ventana de contexto de entrada		512 caracteres	Contexto de 300 000
Resolución de salida (tareas de generación)	4,19 millones de píxeles (es decir, 2048 x 2048, 2816 x 1536)	1280x720, 24 fotogramas por segundo
Resolución máxima de salida (tareas de edición)	Debe cumplir todos los siguientes requisitos: 4096 píxeles en su lado más largo Relación de aspecto entre 1:4 y 4:1 Recuento total de píxeles de 4,19 millones o menos
Duración máxima de la conexión			Tiempo de espera de la conexión de 8 minutos, con un máximo de 20 conexiones simultáneas por cliente.¹
Tipos de entradas admitidos	PNG, JPEG	PNG, JPEG
Idiomas admitidos	Inglés	Inglés	Inglés (EE. UU., Reino Unido), francés, italiano, alemán y español²
Regions	Este de EE. UU. (Norte de Virginia), Europa (Irlanda) y Asia-Pacífico (Tokio)	Este de EE. UU. (Norte de Virginia), Europa (Irlanda) y Asia-Pacífico (Tokio)	Este de EE. UU. (Norte de Virginia), Europa (Estocolmo) y Asia-Pacífico (Tokio)
API de Invoke asíncrona del modelo	No	Sí
API Invoke Model	Sí	No
Compatibilidad con la API de transmisión bidireccional			Sí
Bases de conocimientos de Bedrock			Compatible mediante el uso de herramientas (llamada a funciones)

¹Por defecto, el límite de conexión es de 8 minutos; sin embargo, puede renovar la conexión y continuar la conversación proporcionando el historial de conversaciones anteriores.

²Para obtener una lista de las voces compatibles, consulte Voces disponibles para Amazon Nova Sonic.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

Introducción