Text-to-Video Generación Image-to-Video Generación Resolución de problemas Notas sobre el rendimiento Documentación relacionada

Luma AI Modelos de

En esta sección se describen los parámetros de solicitud y los campos de respuesta de los modelos Luma AI. Utilice esta información para realizar llamadas de inferencia a los modelos de Luma AI con la operación. StartAsyncInvoke En esta sección también se incluyen ejemplos de código de Python que muestran cómo llamar a los modelos Luma AI. Para utilizar un modelo en una operación de inferencia, necesitará el ID del modelo.

ID del modelo: luma.ray-v 2:0
Nombre del modelo: Luma Ray 2
Modelo de texto a vídeo

Los modelos Luma AI procesan las solicitudes del modelo de forma asíncrona mediante las API asíncronas, incluidas, y. StartAsyncInvoke GetAsyncInvoke ListAsyncInvokes

El modelo Luma AI procesa las peticiones mediante los siguientes pasos.

El usuario solicita el modelo mediante. StartAsyncInvoke
Espere hasta que InvokeJob termine. Puede usar GetAsyncInvoke o ListAsyncInvokes para comprobar el estado de finalización del trabajo.
La salida del modelo se colocará en el bucket de Amazon S3 de salida especificado.

Para obtener más información sobre el uso de los modelos Luma AI con las API, consulte Video Generation.

Llamada de inferencia de Luma AI.


POST /async-invoke HTTP/1.1
Content-type: application/json
{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "your input text here",
    "aspect_ratio": "16:9",
    "loop": false,
    "duration": "5s",
    "resolution": "720p"
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Campos

prompt (cadena): el contenido necesario en el vídeo de salida (1 <= longitud <= 5000 caracteres).
aspect_ratio (enumeración): la relación de aspecto del vídeo de salida ("1:1", "16:9", "9:16", "4:3", "3:4", "21:9", "9:21").
loop (booleano): si se debe reproducir en bucle el vídeo de salida.
duration (enumeración): la duración del vídeo de salida (“5 s”, “9 s”).
resolution (enumeración): la resolución del vídeo de salida ("540p", "720p").

El archivo MP4 se almacenará en el bucket de Amazon S3 tal y como se configuró en la respuesta.

Text-to-Video Generación

Genere vídeos a partir de peticiones de texto utilizando el modelo Luma Ray 2. El modelo admite varias opciones de personalización, como la relación de aspecto, la duración, la resolución y la reproducción en bucle.

Text-to-Video Solicitud básica


{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "an old lady laughing underwater, wearing a scuba diving suit"
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Avanzado Text-to-Video con opciones


{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "an old lady laughing underwater, wearing a scuba diving suit",
    "aspect_ratio": "16:9",
    "loop": true,
    "duration": "5s",
    "resolution": "720p"
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Text-to-Video Ejemplo adicional

Ejemplo con parámetros de resolución y duración.


{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "a car",
    "resolution": "720p",
    "duration": "5s"
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Image-to-Video Generación

Transforma imágenes estáticas en vídeos dinámicos proporcionando fotogramas clave. Puede especificar los fotogramas iniciales, los fotogramas finales o ambos para controlar el proceso de generación de vídeo.

Básico Image-to-Video con Start Frame


{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "A tiger walking in snow",
    "keyframes": {
      "frame0": {
        "type": "image",
        "source": {
          "type": "base64",
          "media_type": "image/jpeg",
          "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3"
        }
      }
    }
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Image-to-Video con marcos inicial y final


{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "A tiger walking in snow",
    "keyframes": {
      "frame0": {
        "type": "image",
        "source": {
          "type": "base64",
          "media_type": "image/jpeg",
          "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3"
        }
      },
      "frame1": {
        "type": "image",
        "source": {
          "type": "base64",
          "media_type": "image/jpeg",
          "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3"
        }
      }
    },
    "loop": false,
    "aspect_ratio": "16:9"
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Parámetros adicionales para Image-to-Video

fotogramas clave: (objeto) Defina los fotogramas clave de inicio (fotograma 0) y and/or final (fotograma 1)
- frame0: imagen de fotograma clave inicial
- frame1: imagen del fotograma clave final
- type: debe ser "image"
- source: origen de la imagen

Resolución de problemas

Problemas comunes y soluciones al trabajar con los modelos Luma AI:

Estado del trabajo “con error”: compruebe que su bucket de S3 tenga los permisos de escritura adecuados y que el bucket esté en la misma región que su servicio Bedrock.
Errores de acceso a las URL de las imágenes: asegúrese de que las URL de las imágenes sean de acceso público y utilicen HTTPS. Las imágenes deben estar en los formatos admitidos (JPEG o PNG).
Errores de parámetros no válidos: compruebe que los valores de la relación de aspecto coincidan con las opciones admitidas ("1:1", "16:9", "9:16", "4:3", "3:4", "21:9", "9:21") y que la duración sea "5 s" o "9 s".
Problemas de tiempo de espera agotado: utilice GetAsyncInvoke para comprobar el estado del trabajo en lugar de esperar de forma sincrónica. La generación del vídeo puede tardar varios minutos.
Errores en la longitud de la peticiones: mantenga las peticiones entre 1 y 5000 caracteres. Se rechazarán las peticiones más largas.

Notas sobre el rendimiento

Consideraciones importantes sobre el rendimiento y las limitaciones del modelo Luma AI:

Tiempo de procesamiento: la generación de vídeo suele tardar de dos a cinco minutos para los vídeos de cinco segundos y de cuatro a ocho minutos para los vídeos de nueve segundos, según la complejidad.
Requisitos de imagen: las imágenes de entrada deben ser de alta calidad con una resolución mínima de 512 x 512 píxeles. El tamaño máximo de imagen admitido es 4096 x 4096 píxeles.
Tamaño del vídeo de salida: los vídeos generados oscilan entre 5 y 50 MB en función de la duración, la resolución y la complejidad del contenido.
Límites de velocidad: las llamadas a la API asíncronas están sujetas a las cuotas de servicio. Supervise el uso y solicite un aumento de cuota si es necesario.
Almacenamiento en S3: asegúrese de que haya suficiente capacidad de almacenamiento en S3 para reproducir vídeos y tenga en cuenta las políticas de ciclo de vida para optimizar los costos.

Documentación relacionada

Para obtener información adicional y servicios relacionados:

Configuración de Amazon S3: Creación de buckets de S3 y políticas de buckets para el almacenamiento de salida.
Operaciones de API asíncronas: StartAsyncInvoke, y referencia de API. GetAsyncInvoke ListAsyncInvokes
Cuotas de servicio: Cuotas para Amazon Bedrock para solicitudes de límites de servicio y aumento de la cuota de Bedrock.
Prácticas recomendadas de procesamiento de vídeo: Realizar solicitudes de inferencia para obtener orientación general sobre la inferencia de modelos.
Documentación de Luma AI: Luma Labs Video Generation Documentation para conocer las capacidades detalladas del modelo y las características avanzadas.

Aviso JavaScript está desactivado o no está disponible en su navegador.

Para utilizar la documentación de AWS, debe estar habilitado JavaScript. Para obtener más información, consulte las páginas de ayuda de su navegador.

Convenciones del documento

DeepSeek Modelos de

Modelos de Meta Llama