Modelos de Luma AI - Amazon Bedrock

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Modelos de Luma AI

En esta sección se describen los parámetros de solicitud y los campos de respuesta de los modelos Luma AI. Utilice esta información para realizar llamadas de inferencia a los modelos de Luma AI con la operación. StartAsyncInvoke En esta sección también se incluyen ejemplos de código de Python que muestran cómo llamar a los modelos Luma AI. Para utilizar un modelo en una operación de inferencia, necesitará el ID del modelo.

  • ID del modelo: luma.ray-v 2:0

  • Nombre del modelo: Luma Ray 2

  • Modelo de texto a vídeo

Los modelos Luma AI procesan las solicitudes del modelo de forma asíncrona mediante el Async, que incluye, y. APIs StartAsyncInvokeGetAsyncInvokeListAsyncInvokes

El modelo Luma AI procesa las peticiones mediante los siguientes pasos.

  • El usuario solicita el modelo mediante. StartAsyncInvoke

  • Espere hasta que InvokeJob termine. Puede usar GetAsyncInvoke o ListAsyncInvokes para comprobar el estado de finalización del trabajo.

  • La salida del modelo se colocará en el bucket de Amazon S3 de salida especificado.

Para obtener más información sobre el uso de los modelos Luma AI con APIs, consulte Generación de vídeo.

Llamada de inferencia de Luma AI.

POST /async-invoke HTTP/1.1 Content-type: application/json { "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "your input text here", "aspect_ratio": "16:9", "loop": false, "duration": "5s", "resolution": "720p" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Campos

  • prompt (cadena): el contenido necesario en el vídeo de salida (1 <= longitud <= 5000 caracteres).

  • aspect_ratio (enumeración): la relación de aspecto del vídeo de salida ("1:1", "16:9", "9:16", "4:3", "3:4", "21:9", "9:21").

  • loop (booleano): si se debe reproducir en bucle el vídeo de salida.

  • duration (enumeración): la duración del vídeo de salida (“5 s”, “9 s”).

  • resolution (enumeración): la resolución del vídeo de salida ("540p", "720p").

El MP4 archivo se almacenará en el bucket de Amazon S3 tal y como se configuró en la respuesta.

Text-to-Video Generación

Genere vídeos a partir de peticiones de texto utilizando el modelo Luma Ray 2. El modelo admite varias opciones de personalización, como la relación de aspecto, la duración, la resolución y la reproducción en bucle.

Text-to-VideoSolicitud básica

{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "an old lady laughing underwater, wearing a scuba diving suit" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Avanzado Text-to-Video con opciones

{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "an old lady laughing underwater, wearing a scuba diving suit", "aspect_ratio": "16:9", "loop": true, "duration": "5s", "resolution": "720p" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Text-to-VideoEjemplo adicional

Ejemplo con parámetros de resolución y duración.

{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "a car", "resolution": "720p", "duration": "5s" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Image-to-Video Generación

Transforma imágenes estáticas en vídeos dinámicos proporcionando fotogramas clave. Puede especificar los fotogramas iniciales, los fotogramas finales o ambos para controlar el proceso de generación de vídeo.

Básico Image-to-Video con Start Frame

{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "A tiger walking in snow", "keyframes": { "frame0": { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3" } } } }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Image-to-Video con marcos inicial y final

{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "A tiger walking in snow", "keyframes": { "frame0": { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3" } }, "frame1": { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3" } } }, "loop": false, "aspect_ratio": "16:9" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }

Parámetros adicionales para Image-to-Video

  • fotogramas clave: (objeto) Defina los fotogramas clave de inicio (fotograma 0) y and/or final (fotograma 1)

    • frame0: imagen de fotograma clave inicial

    • frame1: imagen del fotograma clave final

    • type: debe ser "image"

    • source: origen de la imagen

Resolución de problemas

Problemas comunes y soluciones al trabajar con los modelos Luma AI:

  • Estado del trabajo “con error”: compruebe que su bucket de S3 tenga los permisos de escritura adecuados y que el bucket esté en la misma región que su servicio Bedrock.

  • Errores de acceso a la URL de la imagen: asegúrese de que la imagen URLs sea de acceso público y utilice HTTPS. Las imágenes deben estar en los formatos admitidos (JPEG o PNG).

  • Errores de parámetros no válidos: compruebe que los valores de la relación de aspecto coincidan con las opciones admitidas ("1:1", "16:9", "9:16", "4:3", "3:4", "21:9", "9:21") y que la duración sea "5 s" o "9 s".

  • Problemas de tiempo de espera agotado: utilice GetAsyncInvoke para comprobar el estado del trabajo en lugar de esperar de forma sincrónica. La generación del vídeo puede tardar varios minutos.

  • Errores en la longitud de la peticiones: mantenga las peticiones entre 1 y 5000 caracteres. Se rechazarán las peticiones más largas.

Notas sobre el rendimiento

Consideraciones importantes sobre el rendimiento y las limitaciones del modelo Luma AI:

  • Tiempo de procesamiento: la generación de vídeo suele tardar de dos a cinco minutos para los vídeos de cinco segundos y de cuatro a ocho minutos para los vídeos de nueve segundos, según la complejidad.

  • Requisitos de imagen: las imágenes de entrada deben ser de alta calidad con una resolución mínima de 512 x 512 píxeles. El tamaño máximo de imagen admitido es 4096 x 4096 píxeles.

  • Tamaño del vídeo de salida: los vídeos generados oscilan entre 5 y 50 MB en función de la duración, la resolución y la complejidad del contenido.

  • Límites de velocidad: las llamadas a la API asíncronas están sujetas a las cuotas de servicio. Supervise el uso y solicite un aumento de cuota si es necesario.

  • Almacenamiento en S3: asegúrese de que haya suficiente capacidad de almacenamiento en S3 para reproducir vídeos y tenga en cuenta las políticas de ciclo de vida para optimizar los costos.

Documentación relacionada

Para obtener información adicional y servicios relacionados: