¿Qué es Amazon Nova? - Amazon Nova

¿Qué es Amazon Nova?

nota

Esta documentación corresponde a la versión 1 de Amazon Nova. Amazon Nova 2 ya está disponible con nuevos modelos y funciones mejoradas. Las nuevas características y actualizaciones de la documentación se publican en la Guía del usuario de Amazon Nova 2. Para obtener información sobre las novedades de Amazon Nova 2, consulte What's new in Amazon Nova 2.

Los modelos fundacionales de Amazon Nova ofrecen inteligencia de vanguardia y un rendimiento líder en el sector respecto del precio. Con Amazon Nova, las organizaciones pueden crear y escalar aplicaciones de IA generativa que sean seguras, fiables y rentables. Amazon Nova acelera la innovación de la IA en todas las modalidades y casos de uso, incluyendo texto, imagen, vídeo, voz, llamadas a API e IA agéntica. Para empezar a crear con Amazon Nova, debe acceder a los modelos a través de una API mediante Amazon Bedrock.

Categorías de modelos de Amazon Nova

Amazon Nova ofrece potentes modelos fundacionales en cuanto a tres categorías: comprensión, creatividad y capacidades de habla.

Modelo

Categoría

Descripción

Casos de uso

Regions

Amazon Nova Premier

Descripción

Es nuestro modelo multimodal más capaz para tareas complejas y nuestro mejor instructor para destilar modelos personalizados orientados a aplicaciones rentables. Es capaz de comprender diversas entradas, como texto, imágenes, video, documentos y código.

Interfaces de chat interactivas, sistemas de generación aumentada por recuperación (RAG), aplicaciones de agentes, análisis de video y soluciones de automatización del flujo de trabajo de la interfaz de usuario.

Este de EE. UU. (Norte de Virginia)1, AWS GovCloud (Oeste de EE. UU.)

Amazon Nova Pro

Descripción

Modelo multimodal de gran capacidad con la mejor combinación de precisión, velocidad y costo para una amplia gama de tareas. Es capaz de comprender diversas entradas, como texto, imágenes, video, documentos y código.

Interfaces de chat interactivas, sistemas de generación aumentada por recuperación (RAG), aplicaciones de agentes, análisis de video y soluciones de automatización del flujo de trabajo de la interfaz de usuario.

Este de EE. UU. (Norte de Virginia)1, Asia-Pacífico (Sídney)1, Europa (Londres)1, AWS GovCloud (Oeste de EE. UU.)

Amazon Nova Lite

Descripción

Es un modelo multimodal de muy bajo costo que es ultrarrápido para procesar entradas de imágenes, video y texto. Es capaz de comprender diversas entradas, como texto, imágenes, video, documentos y código.

Interfaces de chat interactivas, sistemas de generación aumentada por recuperación (RAG), aplicaciones de agentes, análisis de video y soluciones de automatización del flujo de trabajo de la interfaz de usuario.

Este de EE. UU. (Norte de Virginia)1, Asia-Pacífico (Sídney)1, Europa (Londres)1, AWS GovCloud (Oeste de EE. UU.)

Amazon Nova Micro

Descripción

Es un modelo de solo texto que ofrece las respuestas de menor latencia a un costo muy bajo.

Interfaces de chat interactivas, sistemas de generación aumentada por recuperación (RAG) y aplicaciones de agentes

Este de EE. UU. (Norte de Virginia)1, Asia-Pacífico (Sídney)1, Europa (Londres)1, AWS GovCloud (Oeste de EE. UU.)

Amazon Nova Canvas

Creative

Es un modelo de generación de imágenes de alta calidad con personalización y control. Transforma las entradas de texto e imágenes en imágenes profesionales.

Contenido multimedia, entretenimiento, venta minorista, marketing, publicidad y generación de contenido visual personalizable

Este de EE. UU. (Norte de Virginia), Europa (Irlanda) y Asia-Pacífico (Tokio)

Amazon Nova Reel

Creative

Es un modelo de generación de video diseñado para democratizar la generación de contenido creativo. Transforma las entradas de texto e imágenes en videos profesionales.

Contenido multimedia, entretenimiento, venta minorista, marketing, publicidad y generación de contenido visual personalizable

Este de EE. UU. (Norte de Virginia), Europa (Irlanda) y Asia-Pacífico (Tokio)

Amazon Nova Sonic

Speech

Es un modelo fundacional para la comprensión y generación de voz conversacional en cinco idiomas: inglés (EE. UU., Reino Unido), francés, italiano, alemán y español. Acepta voz como entrada y proporciona voz con transcripciones de texto como salida. Incluye capacidades de API de transmisión continua bidireccional, lo que permite mantener conversaciones en tiempo real y de baja latencia en varios turnos.

Asistentes virtuales, soluciones de servicio al cliente, experiencias de voz interactivas e interacciones de voz en tiempo real

Este de EE. UU. (Norte de Virginia), Europa (Estocolmo) y Asia-Pacífico (Tokio)

1Puede acceder a este modelo en regiones adicionales mediante inferencia entre regiones: Este de EE. UU. (Ohio), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Irlanda), Europa (Fráncfort), Europa (París), Asia-Pacífico (Tokio), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Seúl) y Asia-Pacífico (Mumbai). Para obtener más información, consulte Improve resilience with cross-region inference.

Para obtener información completa sobre la compatibilidad de modelos y regiones en Amazon Bedrock, consulte Supported foundation models in Amazon Bedrock.

Especificaciones del modelo

En las siguientes tablas se proporcionan especificaciones detalladas para cada familia de modelos de Amazon Nova.

Descripción de las especificaciones del modelo

Amazon Nova Premier

Amazon Nova Pro

Amazon Nova Lite

Amazon Nova Micro

ID del modelo

amazon.nova-premier-v1:0

amazon.nova-pro-v1:0

amazon.nova-lite-v1:0

amazon.nova-micro-v1:0

ID del perfil de inferencia

us.amazon.nova-premier-v1:0

us.amazon.nova-pro-v1:0

us.amazon.nova-lite-v1:0

us.amazon.nova-micro-v1:0

Modalidades de entrada

Texto, imagen, video

Texto, imagen, video

Texto, imagen, video

Texto

Modalidades de salida

Texto

Texto

Texto

Texto

Ventana de contexto

1M

300 000

300 000

128 000

Cantidad máxima de tokens de salida

10 000

10 000

10 000

10 000

Idiomas admitidos

200+11

200+11

200+11

200+11

Regions

Este de EE. UU. (Norte de Virginia)2

Este de EE. UU. (Norte de Virginia)2, Asia-Pacífico (Tokio)2, Asia-Pacífico (Sídney)2, Europa (Londres)2, AWS GovCloud (Oeste de EE. UU.)

Este de EE. UU. (Norte de Virginia)2, Asia-Pacífico (Tokio)2, Asia-Pacífico (Sídney)2, Europa (Londres)2, AWS GovCloud (Oeste de EE. UU.)

Este de EE. UU. (Norte de Virginia)2, Asia-Pacífico (Tokio)2, Asia-Pacífico (Sídney)2, Europa (Londres)2, AWS GovCloud (Oeste de EE. UU.)

Compatibilidad con documentos

PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD

PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD

PDF, CSV, DOC, DOCX, XLS, XLSX, HTML, TXT, MD

No

API de Converse

API de Invoke

Streaming

Inferencia en lotes

Afinamiento

No

Rendimiento aprovisionado

No

Bases de conocimientos de Bedrock

Agentes de Bedrock

Barreras de protección de Bedrock

Sí (solo texto)

Sí (solo texto)

Sí (solo texto)

Evaluaciones de Bedrock

Sí (solo texto)

Sí (solo texto)

Sí (solo texto)

Flujos de peticiones de Bedrock

Bedrock Studio

Destilación de modelos de Bedrock

Instructor de Pro, Lite y Micro

Instructor de Lite y Micro

Aprendiz de Premier

Aprendiz de Premier y Pro

Aprendiz de Premier y Pro

1Optimizado para estos 15 idiomas: inglés, alemán, español, francés, italiano, japonés, coreano, árabe, chino simplificado, ruso, hindi, portugués, neerlandés, turco y hebreo.

2Puede acceder a este modelo en las regiones Este de EE. UU. (Ohio), Oeste de EE. UU. (Oregón), Europa (Estocolmo), Europa (Irlanda), Europa (Fráncfort), Europa (París), Asia-Pacífico (Tokio), Asia-Pacífico (Singapur), Asia-Pacífico (Sídney), Asia-Pacífico (Seúl) y Asia-Pacífico (Mumbai) mediante inferencia entre regiones. La inferencia entre regiones le permite administrar las ráfagas de tráfico no planificadas sin problemas mediante la computación en diferentes Regiones de AWS. Con la inferencia entre regiones, puede distribuir el tráfico entre varias Regiones de AWS. Para obtener información sobre la inferencia entre regiones, consulte Supported Regions and models for inference profiles y Improve resilience with cross-region inference en la Guía del usuario de Amazon Bedrock.

Especificaciones de los modelos creativos y de voz

Amazon Nova Canvas

Amazon Nova Reel

Amazon Nova Sonic

ID del modelo

amazon.nova-canvas-v1:0

amazon.nova-reel-v1:1

amazon.nova-sonic-v1:0

Modalidades de entrada

Texto, imagen

Texto, imagen

Speech

Modalidades de salida

Image

Video

Voz con transcripción y respuestas de texto

Longitud máxima de la petición

1024 caracteres

Ventana de contexto de entrada

512 caracteres

Contexto de 300 000

Resolución de salida (tareas de generación)

4,19 millones de píxeles (es decir, 2048 x 2048, 2816 x 1536)

1280x720, 24 fotogramas por segundo

Resolución máxima de salida (tareas de edición)

Debe cumplir todos los siguientes requisitos:

  • 4096 píxeles en su lado más largo

  • Relación de aspecto entre 1:4 y 4:1

  • Recuento total de píxeles de 4,19 millones o menos

Duración máxima de la conexión

Tiempo de espera de la conexión de 8 minutos, con un máximo de 20 conexiones simultáneas por cliente.1

Tipos de entradas admitidos

PNG, JPEG

PNG, JPEG

Idiomas admitidos

Inglés

Inglés

Inglés (EE. UU., Reino Unido), francés, italiano, alemán y español2

Regions

Este de EE. UU. (Norte de Virginia), Europa (Irlanda) y Asia-Pacífico (Tokio)

Este de EE. UU. (Norte de Virginia), Europa (Irlanda) y Asia-Pacífico (Tokio)

Este de EE. UU. (Norte de Virginia), Europa (Estocolmo) y Asia-Pacífico (Tokio)

API de Invoke asíncrona del modelo

No

API Invoke Model

No

Compatibilidad con la API de transmisión bidireccional

Bases de conocimientos de Bedrock

Compatible mediante el uso de herramientas (llamada a funciones)

1Por defecto, el límite de conexión es de 8 minutos; sin embargo, puede renovar la conexión y continuar la conversación proporcionando el historial de conversaciones anteriores.

2Para obtener una lista de las voces compatibles, consulte Voces disponibles para Amazon Nova Sonic.