¿Qué es Amazon Nova?
nota
Esta documentación corresponde a la versión 1 de Amazon Nova. Amazon Nova 2 ya está disponible con nuevos modelos y funciones mejoradas. Las nuevas características y actualizaciones de la documentación se publican en la Guía del usuario de Amazon Nova 2. Para obtener información sobre las novedades de Amazon Nova 2, consulte What's new in Amazon Nova 2.
Los modelos fundacionales de Amazon Nova ofrecen inteligencia de vanguardia y un rendimiento líder en el sector respecto del precio. Con Amazon Nova, las organizaciones pueden crear y escalar aplicaciones de IA generativa que sean seguras, fiables y rentables. Amazon Nova acelera la innovación de la IA en todas las modalidades y casos de uso, incluyendo texto, imagen, vídeo, voz, llamadas a API e IA agéntica. Para empezar a crear con Amazon Nova, debe acceder a los modelos a través de una API mediante Amazon Bedrock.
Categorías de modelos de Amazon Nova
Amazon Nova ofrece potentes modelos fundacionales en cuanto a tres categorías: comprensión, creatividad y capacidades de habla.
Modelo |
Categoría |
Descripción |
Casos de uso |
Regions |
|---|---|---|---|---|
Amazon Nova Premier |
Descripción |
Es nuestro modelo multimodal más capaz para tareas complejas y nuestro mejor instructor para destilar modelos personalizados orientados a aplicaciones rentables. Es capaz de comprender diversas entradas, como texto, imágenes, video, documentos y código. |
Interfaces de chat interactivas, sistemas de generación aumentada por recuperación (RAG), aplicaciones de agentes, análisis de video y soluciones de automatización del flujo de trabajo de la interfaz de usuario. |
Este de EE. UU. (Norte de Virginia)1, AWS GovCloud (Oeste de EE. UU.) |
Amazon Nova Pro |
Descripción |
Modelo multimodal de gran capacidad con la mejor combinación de precisión, velocidad y costo para una amplia gama de tareas. Es capaz de comprender diversas entradas, como texto, imágenes, video, documentos y código. |
Interfaces de chat interactivas, sistemas de generación aumentada por recuperación (RAG), aplicaciones de agentes, análisis de video y soluciones de automatización del flujo de trabajo de la interfaz de usuario. |
Este de EE. UU. (Norte de Virginia)1, Asia-Pacífico (Sídney)1, Europa (Londres)1, AWS GovCloud (Oeste de EE. UU.) |
Amazon Nova Lite |
Descripción |
Es un modelo multimodal de muy bajo costo que es ultrarrápido para procesar entradas de imágenes, video y texto. Es capaz de comprender diversas entradas, como texto, imágenes, video, documentos y código. |
Interfaces de chat interactivas, sistemas de generación aumentada por recuperación (RAG), aplicaciones de agentes, análisis de video y soluciones de automatización del flujo de trabajo de la interfaz de usuario. |
Este de EE. UU. (Norte de Virginia)1, Asia-Pacífico (Sídney)1, Europa (Londres)1, AWS GovCloud (Oeste de EE. UU.) |
Amazon Nova Micro |
Descripción |
Es un modelo de solo texto que ofrece las respuestas de menor latencia a un costo muy bajo. |
Interfaces de chat interactivas, sistemas de generación aumentada por recuperación (RAG) y aplicaciones de agentes |
Este de EE. UU. (Norte de Virginia)1, Asia-Pacífico (Sídney)1, Europa (Londres)1, AWS GovCloud (Oeste de EE. UU.) |
Amazon Nova Canvas |
Creative |
Es un modelo de generación de imágenes de alta calidad con personalización y control. Transforma las entradas de texto e imágenes en imágenes profesionales. |
Contenido multimedia, entretenimiento, venta minorista, marketing, publicidad y generación de contenido visual personalizable |
Este de EE. UU. (Norte de Virginia), Europa (Irlanda) y Asia-Pacífico (Tokio) |
Amazon Nova Reel |
Creative |
Es un modelo de generación de video diseñado para democratizar la generación de contenido creativo. Transforma las entradas de texto e imágenes en videos profesionales. |
Contenido multimedia, entretenimiento, venta minorista, marketing, publicidad y generación de contenido visual personalizable |
Este de EE. UU. (Norte de Virginia), Europa (Irlanda) y Asia-Pacífico (Tokio) |
Amazon Nova Sonic |
Speech |
Es un modelo fundacional para la comprensión y generación de voz conversacional en cinco idiomas: inglés (EE. UU., Reino Unido), francés, italiano, alemán y español. Acepta voz como entrada y proporciona voz con transcripciones de texto como salida. Incluye capacidades de API de transmisión continua bidireccional, lo que permite mantener conversaciones en tiempo real y de baja latencia en varios turnos. |
Asistentes virtuales, soluciones de servicio al cliente, experiencias de voz interactivas e interacciones de voz en tiempo real |
Este de EE. UU. (Norte de Virginia), Europa (Estocolmo) y Asia-Pacífico (Tokio) |
1Puede acceder a este modelo en regiones adicionales mediante inferencia entre regiones: Este de EE. UU. (Ohio), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Irlanda), Europa (Fráncfort), Europa (París), Asia-Pacífico (Tokio), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Seúl) y Asia-Pacífico (Mumbai). Para obtener más información, consulte Improve resilience with cross-region inference.
Para obtener información completa sobre la compatibilidad de modelos y regiones en Amazon Bedrock, consulte Supported foundation models in Amazon Bedrock.
Especificaciones del modelo
En las siguientes tablas se proporcionan especificaciones detalladas para cada familia de modelos de Amazon Nova.
Descripción de las especificaciones del modelo
Amazon Nova Premier |
Amazon Nova Pro |
Amazon Nova Lite |
Amazon Nova Micro |
|
|---|---|---|---|---|
ID del modelo |
amazon.nova-premier-v1:0 |
amazon.nova-pro-v1:0 |
amazon.nova-lite-v1:0 |
amazon.nova-micro-v1:0 |
ID del perfil de inferencia |
us.amazon.nova-premier-v1:0 |
us.amazon.nova-pro-v1:0 |
us.amazon.nova-lite-v1:0 |
us.amazon.nova-micro-v1:0 |
Modalidades de entrada |
Texto, imagen, video |
Texto, imagen, video |
Texto, imagen, video |
Texto |
Modalidades de salida |
Texto |
Texto |
Texto |
Texto |
Ventana de contexto |
1M |
300 000 |
300 000 |
128 000 |
Cantidad máxima de tokens de salida |
10 000 |
10 000 |
10 000 |
10 000 |
Idiomas admitidos |
200+11 |
200+11 |
200+11 |
200+11 |
Regions |
Este de EE. UU. (Norte de Virginia)2 |
Este de EE. UU. (Norte de Virginia)2, Asia-Pacífico (Tokio)2, Asia-Pacífico (Sídney)2, Europa (Londres)2, AWS GovCloud (Oeste de EE. UU.) |
Este de EE. UU. (Norte de Virginia)2, Asia-Pacífico (Tokio)2, Asia-Pacífico (Sídney)2, Europa (Londres)2, AWS GovCloud (Oeste de EE. UU.) |
Este de EE. UU. (Norte de Virginia)2, Asia-Pacífico (Tokio)2, Asia-Pacífico (Sídney)2, Europa (Londres)2, AWS GovCloud (Oeste de EE. UU.) |
Compatibilidad con documentos |
PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD |
PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD |
PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD |
No |
API de Converse |
Sí |
Sí |
Sí |
Sí |
API de Invoke |
Sí |
Sí |
Sí |
Sí |
Streaming |
Sí |
Sí |
Sí |
Sí |
Inferencia en lotes |
Sí |
Sí |
Sí |
Sí |
Afinamiento |
No |
Sí |
Sí |
Sí |
Rendimiento aprovisionado |
No |
Sí |
Sí |
Sí |
Bases de conocimientos de Bedrock |
Sí |
Sí |
Sí |
Sí |
Agentes de Bedrock |
Sí |
Sí |
Sí |
Sí |
Barreras de protección de Bedrock |
Sí (solo texto) |
Sí (solo texto) |
Sí (solo texto) |
Sí |
Evaluaciones de Bedrock |
Sí (solo texto) |
Sí (solo texto) |
Sí (solo texto) |
Sí |
Flujos de peticiones de Bedrock |
Sí |
Sí |
Sí |
Sí |
Bedrock Studio |
Sí |
Sí |
Sí |
Sí |
Destilación de modelos de Bedrock |
Instructor de Pro, Lite y Micro |
Instructor de Lite y Micro Aprendiz de Premier |
Aprendiz de Premier y Pro |
Aprendiz de Premier y Pro |
1Optimizado para estos 15 idiomas: inglés, alemán, español, francés, italiano, japonés, coreano, árabe, chino simplificado, ruso, hindi, portugués, neerlandés, turco y hebreo.
2Puede acceder a este modelo en las regiones Este de EE. UU. (Ohio), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Irlanda), Europa (Fráncfort), Europa (París), Asia-Pacífico (Tokio), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Seúl) y Asia-Pacífico (Mumbai) mediante inferencia entre regiones. La inferencia entre regiones le permite administrar las ráfagas de tráfico no planificadas sin problemas mediante la computación en diferentes Regiones de AWS. Con la inferencia entre regiones, puede distribuir el tráfico entre varias Regiones de AWS. Para obtener información sobre la inferencia entre regiones, consulte Supported Regions and models for inference profiles y Improve resilience with cross-region inference en la Guía del usuario de Amazon Bedrock.
Especificaciones de los modelos creativos y de voz
Amazon Nova Canvas |
Amazon Nova Reel |
Amazon Nova Sonic |
|
|---|---|---|---|
ID del modelo |
amazon.nova-canvas-v1:0 |
amazon.nova-reel-v1:1 |
amazon.nova-sonic-v1:0 |
Modalidades de entrada |
Texto, imagen |
Texto, imagen |
Speech |
Modalidades de salida |
Image |
Video |
Voz con transcripción y respuestas de texto |
Longitud máxima de la petición |
1024 caracteres |
||
Ventana de contexto de entrada |
512 caracteres |
Contexto de 300 000 |
|
Resolución de salida (tareas de generación) |
4,19 millones de píxeles (es decir, 2048 x 2048, 2816 x 1536) |
1280x720, 24 fotogramas por segundo |
|
Resolución máxima de salida (tareas de edición) |
Debe cumplir todos los siguientes requisitos:
|
||
Duración máxima de la conexión |
Tiempo de espera de la conexión de 8 minutos, con un máximo de 20 conexiones simultáneas por cliente.1 |
||
Tipos de entradas admitidos |
PNG, JPEG |
PNG, JPEG |
|
Idiomas admitidos |
Inglés |
Inglés |
Inglés (EE. UU., Reino Unido), francés, italiano, alemán y español2 |
Regions |
Este de EE. UU. (Norte de Virginia), Europa (Irlanda) y Asia-Pacífico (Tokio) |
Este de EE. UU. (Norte de Virginia), Europa (Irlanda) y Asia-Pacífico (Tokio) |
Este de EE. UU. (Norte de Virginia), Europa (Estocolmo) y Asia-Pacífico (Tokio) |
API de Invoke asíncrona del modelo |
No |
Sí |
|
API Invoke Model |
Sí |
No |
|
Compatibilidad con la API de transmisión bidireccional |
Sí |
||
Bases de conocimientos de Bedrock |
Compatible mediante el uso de herramientas (llamada a funciones) |
1Por defecto, el límite de conexión es de 8 minutos; sin embargo, puede renovar la conexión y continuar la conversación proporcionando el historial de conversaciones anteriores.
2Para obtener una lista de las voces compatibles, consulte Voces disponibles para Amazon Nova Sonic.