¿Qué es Amazon Nova?
Los modelos fundacionales de Amazon Nova ofrecen inteligencia de vanguardia y un rendimiento líder en el sector respecto del precio. Con Amazon Nova, las organizaciones pueden crear y escalar aplicaciones de IA generativa que sean seguras, fiables y rentables. Amazon Nova acelera la innovación de la IA en todas las modalidades y casos de uso, incluyendo texto, imagen, vídeo, voz, llamadas a API e IA agéntica. Para empezar a crear con Amazon Nova, debe acceder a los modelos a través de una API mediante Amazon Bedrock.
Amazon Nova ofrece potentes modelos fundacionales en cuanto a capacidades de comprensión, imagen, vídeo y voz.
Modelos de comprensión
Los modelos de comprensión de Amazon Nova están diseñados para comprender diversas entradas, como texto, imágenes, vídeo, documentos y código. Estos modelos se destacan por impulsar las interfaces de chat interactivas, los sistemas de generación aumentada por recuperación (RAG), las aplicaciones de agénticas, el análisis de vídeo y las soluciones de automatización del flujo de trabajo de la interfaz de usuario.
-
Amazon Nova Micro es un modelo de solo texto que ofrece las respuestas de menor latencia a un costo muy bajo.
-
Amazon Nova Lite es un modelo multimodal de muy bajo costo que es ultrarrápido para procesar entradas de imágenes, video y texto.
-
Amazon Nova Pro es un modelo multimodal de gran capacidad y nuestra mejor combinación de precisión, velocidad y costo para una amplia gama de tareas.
-
Amazon Nova Premier es nuestro modelo multimodal más capaz para tareas complejas y nuestro mejor instructor para destilar modelos personalizados orientados a aplicaciones rentables.
Los modelos de comprensión de Amazon Nova están disponibles en Este de EE. UU. (Norte de Virginia) y GovCloud de AWS (Oeste de EE. UU.). Amazon Nova Micro, Lite y Pro también están disponibles en Asia-Pacífico (Sídney) y Europa (Londres). Puede acceder a los modelos en las siguientes regiones mediante perfiles de interferencia entre regiones: Oeste de EE. UU. (Norte de California), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Fráncfort), Europa (Irlanda), Europa (París), Asia-Pacífico (Tokio), Asia-Pacífico (Seúl), Asia-Pacífico (Mumbai), Asia-Pacífico (Singapur) y Asia-Pacífico (Sídney).
Modelos creativos
Los modelos creativos de Amazon Nova transforman las entradas de texto e imágenes en imágenes y vídeos de nivel profesional. Están diseñados para ofrecer contenido visual personalizable con características de control, lo que hace que la generación de contenido creativo sea accesible y eficiente para los sectores de los medios, el entretenimiento, la venta minorista, el marketing y la publicidad.
-
Amazon Nova Canvas es un modelo de generación de imágenes de alta calidad con personalización y control.
-
Amazon Nova Reel es un modelo de generación de vídeo diseñado para democratizar la generación de contenido creativo.
Amazon Nova Canvas y Amazon Nova Reel están disponibles en el Este de EE. UU. (Norte de Virginia), Europa (Irlanda) y Asia-Pacífico (Tokio).
Modelo de voz
Amazon Nova Sonic es un modelo fundacional para la comprensión y generación de voz conversacional. El modelo acepta voz como entrada y proporciona voz con transcripciones de texto como salida. Amazon Nova Sonic ofrece una experiencia de IA conversacional natural, similar a la humana, con riqueza contextual. Es el primer modelo que incluye capacidades de API de transmisión bidireccional, lo que permite mantener conversaciones en tiempo real y de baja latencia en varios turnos.
-
Amazon Nova Sonic ofrece conversaciones de voz parecidas a las de un humano en tiempo real.
Amazon Nova Sonic está disponible actualmente en Este de EE. UU. (Norte de Virginia), Europa (Estocolmo) y Asia-Pacífico (Tokio) y para idiomas inglés (EE. UU., Reino Unido) y español.
Para obtener información completa sobre la compatibilidad de modelos y regiones en Amazon Bedrock, consulte Modelos fundacionales compatibles en Amazon Bedrock
Información general del modelo
Amazon Nova Premier |
Amazon Nova Pro |
Amazon Nova Lite |
Amazon Nova Micro |
|
---|---|---|---|---|
ID del modelo |
amazon.nova-premier-v1:0 |
amazon.nova-pro-v1:0 |
amazon.nova-lite-v1:0 |
amazon.nova-micro-v1:0 |
ID del perfil de inferencia |
us.amazon.nova-premier-v1:0 |
us.amazon.nova-pro-v1:0 |
us.amazon.nova-lite-v1:0 |
us.amazon.nova-micro-v1:0 |
Modalidades de entrada |
Texto, imagen, video |
Texto, imagen, video |
Texto, imagen, video |
Texto |
Modalidades de salida |
Texto |
Texto |
Texto |
Texto |
Ventana de contexto |
1M |
300 000 |
300 000 |
128 000 |
Cantidad máxima de tokens de salida |
10,000 |
10 000 |
10 000 |
10 000 |
Idiomas admitidos |
200+1 |
200+1 |
200+1 |
200+1 |
Regiones |
Este de EE. UU. (Norte de Virginia)2 |
Este de EE. UU. (Norte de Virginia)2, Asia-Pacífico (Tokio)2, Asia-Pacífico (Sídney)2, Europa (Londres)2, GovCloud de AWS (Oeste de EE. UU.) |
Este de EE. UU. (Norte de Virginia)2, Asia-Pacífico (Tokio)2, Asia-Pacífico (Sídney)2, Europa (Londres)2, GovCloud de AWS (Oeste de EE. UU.) |
Este de EE. UU. (Norte de Virginia)2, Asia-Pacífico (Tokio)2, Asia-Pacífico (Sídney)2, Europa (Londres)2, GovCloud de AWS (Oeste de EE. UU.) |
Compatibilidad con documentos |
PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD |
PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD |
PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD |
No |
API de Converse |
Sí |
Sí |
Sí |
Sí |
API de Invoke |
Sí |
Sí |
Sí |
Sí |
Transmisión |
Sí |
Sí |
Sí |
Sí |
Inferencia en lotes |
Sí |
Sí |
Sí |
Sí |
Afinamiento |
No |
Sí |
Sí |
Sí |
Rendimiento aprovisionado |
No |
Sí |
Sí |
Sí |
Bases de conocimientos de Bedrock |
Sí |
Sí |
Sí |
Sí |
Agentes de Bedrock |
Sí |
Sí |
Sí |
Sí |
Barreras de protección de Bedrock |
Sí (solo texto) |
Sí (solo texto) |
Sí (solo texto) |
Sí |
Evaluaciones de Bedrock |
Sí (solo texto) |
Sí (solo texto) |
Sí (solo texto) |
Sí |
Flujos de peticiones de Bedrock |
Sí |
Sí |
Sí |
Sí |
Bedrock Studio |
Sí |
Sí |
Sí |
Sí |
Destilación de modelos de Bedrock |
Instructor de Pro, Lite y Micro |
Instructor de Lite y Micro Aprendiz de Premier |
Aprendiz de Premier y Pro |
Aprendiz de Premier y Pro |
1: Optimizado para estos 15 idiomas: inglés, alemán, español, francés, italiano, japonés, coreano, árabe, chino simplificado, ruso, hindi, portugués, neerlandés, turco y hebreo.
2: Puede acceder a este modelo en las regiones Este de EE. UU. (Ohio), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Irlanda), Europa (Fráncfort), Europa (París), Asia-Pacífico (Tokio), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Seúl) y Asia-Pacífico (Mumbai) mediante inferencia entre regiones. La inferencia entre regiones le permite administrar las ráfagas de tráfico no planificadas sin problemas mediante la computación en diferentes Regiones de AWS. Con la inferencia entre regiones, puede distribuir el tráfico entre varias Regiones de AWS. Para obtener más información sobre la inferencia entre regiones, consulte Supported Regions and models for inference profiles y Mejora de la resiliencia con la inferencia entre regiones en la Guía del usuario de Amazon Bedrock.
Amazon Nova Canvas |
Amazon Nova Reel |
|
---|---|---|
ID del modelo |
amazon.nova-canvas-v1:0 |
amazon.nova-reel-v1:1 |
Modalidades de entrada |
Texto, imagen |
Texto, imagen |
Modalidades de salida |
Imagen |
Video |
Longitud máxima de la petición |
1024 caracteres |
|
Ventana de contexto de entrada |
512 caracteres |
|
Resolución de salida (tareas de generación) |
4,19 millones de píxeles (es decir, 2048 x 2048, 2816 x 1536) |
1280x720, 24 fotogramas por segundo |
Resolución máxima de salida (tareas de edición) |
Debe cumplir todos los siguientes requisitos:
|
|
Tipos de entradas admitidos |
PNG, JPEG |
PNG, JPEG |
Idiomas admitidos |
Inglés |
Inglés |
Regiones |
Este de EE. UU. (Norte de Virginia), Europa (Irlanda) y Asia-Pacífico (Tokio) |
Este de EE. UU. (Norte de Virginia), Europa (Irlanda) y Asia-Pacífico (Tokio) |
API de Invoke asíncrona del modelo |
No |
Sí |
API Invoke Model |
Sí |
No |
Amazon Nova Sonic |
|
---|---|
ID del modelo |
amazon.nova-sonic-v1:0 |
Modalidades de entrada |
Speech |
Modalidades de salida |
Voz con transcripción y respuestas de texto |
Ventana de contexto |
Contexto de 300 000 |
Duración máxima de la conexión |
Tiempo de espera de la conexión de 8 minutos, con un máximo de 20 conexiones simultáneas por cliente.1 |
Idiomas admitidos |
Inglés (EE. UU., Reino Unido) y español |
Regiones |
Este de EE. UU. (Norte de Virginia), Europa (Estocolmo) y Asia-Pacífico (Tokio) |
Compatibilidad con la API de transmisión bidireccional |
Sí |
Bases de conocimientos de Bedrock |
Compatible mediante el uso de herramientas (llamada a funciones) |
1: Por defecto, el límite de conexión es de 8 minutos; sin embargo, puede renovar la conexión y continuar la conversación proporcionando el historial de conversaciones anteriores.