As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Modelos da Luma AI
Esta seção descreve os parâmetros de solicitação e os campos de resposta dos modelos da Luma AI. Use essas informações para fazer chamadas de inferência para modelos de IA do Luma com a StartAsyncInvokeoperação. Esta seção também inclui exemplos de código Python que mostram como chamar modelos da Luma AI. Para usar um modelo em uma operação de inferência, o ID do modelo é necessário.
-
ID do modelo: luma.ray-v 2:0
-
Nome do modelo: Luma Ray 2
-
Modelo de conversão de texto em vídeo
O Luma AI modela solicitações do modelo de processo de forma assíncrona usando o Async APIs , incluindo, e. StartAsyncInvokeGetAsyncInvokeListAsyncInvokes
O modelo da Luma AI processa prompts usando as etapas a seguir.
-
O usuário solicita o modelo usando StartAsyncInvoke.
-
Espere até InvokeJob que termine. Você pode usar
GetAsyncInvokeouListAsyncInvokespara verificar o status de conclusão da tarefa. -
A saída do modelo será colocada no bucket de saída especificado do Amazon S3.
Para obter mais informações sobre como usar os modelos Luma AI com o APIs, consulte Geração de vídeo
Chamada de inferência da Luma AI.
POST /async-invoke HTTP/1.1 Content-type: application/json { "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "your input text here", "aspect_ratio": "16:9", "loop": false, "duration": "5s", "resolution": "720p" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }
Campos
-
prompt: (string) o conteúdo necessário no vídeo de saída (1 <= tamanho <= 5 mil caracteres).
-
aspect_ratio: (enumeração) a proporção do vídeo de saída (“1:1”, “16:9”, “9:16”, “4:3”, “3:4”, “21:9”, “9:21”).
-
loop: (booliano) se o vídeo de saída deve ser repetido.
-
duration: (enumeração) a duração do vídeo de saída (“5 s”, “9 s”).
-
resolution: (enumeração) a resolução do vídeo de saída (“540p”, “720p”).
O MP4 arquivo será armazenado no bucket do Amazon S3 conforme configurado na resposta.
Text-to-Video Geração
Gere vídeos com base em prompts de texto usando o modelo Luma Ray 2. O modelo oferece várias opções de personalização, como proporção, duração, resolução e loop.
Text-to-VideoSolicitação básica
{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "an old lady laughing underwater, wearing a scuba diving suit" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }
Avançado Text-to-Video com opções
{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "an old lady laughing underwater, wearing a scuba diving suit", "aspect_ratio": "16:9", "loop": true, "duration": "5s", "resolution": "720p" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }
Text-to-VideoExemplo adicional
Exemplo com parâmetros de resolução e duração.
{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "a car", "resolution": "720p", "duration": "5s" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }
Image-to-Video Geração
Transforme imagens estáticas em vídeos dinâmicos fornecendo quadros-chave. É possível especificar quadros iniciais, quadros finais ou ambos para controlar o processo de geração de vídeo.
Básico Image-to-Video com Start Frame
{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "A tiger walking in snow", "keyframes": { "frame0": { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3" } } } }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }
Image-to-Video com quadros inicial e final
{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "A tiger walking in snow", "keyframes": { "frame0": { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3" } }, "frame1": { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3" } } }, "loop": false, "aspect_ratio": "16:9" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }
Parâmetros adicionais para Image-to-Video
-
quadros-chave — (objeto) Define quadros-chave de início (quadro0) e and/or fim (quadro1)
-
frame0: imagem do quadro-chave inicial.
-
frame1: imagem do quadro-chave final.
-
type: deve ser “imagem”.
-
source: fonte da imagem.
-
Solução de problemas
Problemas e soluções comuns ao trabalhar com modelos da Luma AI:
-
Status de trabalho “Failed”: verifique se o bucket do S3 tem as permissões de gravação adequadas e se o bucket existe na mesma região do serviço Bedrock.
-
Erros de acesso ao URL da imagem - Certifique-se de que a imagem URLs esteja acessível ao público e use HTTPS. As imagens devem estar nos formatos compatíveis (JPEG ou PNG).
-
Erros de parâmetros inválidos: verifique se os valores das proporções correspondem às opções permitidas (“1:1”, “16:9”, “9:16”, “4:3”, “3:4”, “21:9”, “9:21”) e a duração é “5 s” ou “9 s”.
-
Problemas de tempo limite: use
GetAsyncInvokepara verificar o status do trabalho em vez de esperar de forma síncrona. A geração de vídeo pode levar alguns minutos. -
Erros de tamanho do prompt: mantenha os prompts com 1 a 5 mil caracteres. Prompts mais longos serão rejeitados.
Observações sobre desempenho
Considerações importantes sobre o desempenho e as limitações do modelo da Luma AI:
-
Tempo de processamento: a geração de vídeo normalmente leva de 2 a 5 minutos para vídeos de 5 segundos e de 4 a 8 minutos para vídeos de 9 segundos, dependendo da complexidade.
-
Requisitos de imagem: as imagens de entrada devem ser de alta qualidade, com resolução mínima de 512 x 512 pixels. O tamanho máximo de imagem permitido é de 4.096 x 4096 pixels.
-
Tamanho do vídeo de saída: os vídeos gerados variam de 5 MB a 50 MB, dependendo da duração, resolução e complexidade do conteúdo.
-
Limites de taxa: as chamadas de API assíncronas estão sujeitas a cotas de serviço. Monitore seu uso e solicite aumentos de cota, se necessário.
-
Armazenamento do S3: garanta capacidade de armazenamento suficiente do S3 para vídeos de saída e considere a possibilidade de utilizar políticas de ciclo de vida para otimizar os custos.
Documentação relacionada
Para ter informações adicionais e saber mais sobre serviços relacionados:
-
Configuração do Amazon S3: Criar buckets do S3 e políticas de bucket para armazenamento de saída.
-
Operações de API assíncronas - StartAsyncInvoke, GetAsyncInvoke, e referência de ListAsyncInvokesAPI.
-
Cotas de serviço: Cotas do Amazon Bedrock, para se informar sobre solicitações de aumento de limites e cotas de serviço do Bedrock.
-
Práticas recomendadas de processamento de vídeo: Envie prompts e gere respostas com a inferência de modelo, para obter orientação geral sobre inferência de modelos.
-
Documentação da Luma AI: geração de vídeo da Luma Labs
, para conhecer recursos detalhados do modelo e recursos avançados.