Text-to-Video Geração Image-to-Video Geração Solução de problemas Observações sobre desempenho Documentação relacionada

Luma AI Modelos da

Esta seção descreve os parâmetros de solicitação e os campos de resposta dos modelos da Luma AI. Use essas informações para fazer chamadas de inferência para modelos de IA do Luma com a StartAsyncInvokeoperação. Esta seção também inclui exemplos de código Python que mostram como chamar modelos da Luma AI. Para usar um modelo em uma operação de inferência, o ID do modelo é necessário.

ID do modelo: luma.ray-v 2:0
Nome do modelo: Luma Ray 2
Modelo de conversão de texto em vídeo

O Luma AI modela as solicitações do modelo de processo de forma assíncrona usando as APIs assíncronas, incluindo, e. StartAsyncInvoke GetAsyncInvoke ListAsyncInvokes

O modelo da Luma AI processa prompts usando as etapas a seguir.

O usuário solicita o modelo usando StartAsyncInvoke.
Espere até InvokeJob que termine. Você pode usar GetAsyncInvoke ou ListAsyncInvokes para verificar o status de conclusão da tarefa.
A saída do modelo será colocada no bucket de saída especificado do Amazon S3.

Para ter mais informações sobre como usar os modelos da Luma AI com as APIs, consulte Geração de vídeo.

Chamada de inferência da Luma AI.


POST /async-invoke HTTP/1.1
Content-type: application/json
{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "your input text here",
    "aspect_ratio": "16:9",
    "loop": false,
    "duration": "5s",
    "resolution": "720p"
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Campos

prompt: (string) o conteúdo necessário no vídeo de saída (1 <= tamanho <= 5 mil caracteres).
aspect_ratio: (enumeração) a proporção do vídeo de saída (“1:1”, “16:9”, “9:16”, “4:3”, “3:4”, “21:9”, “9:21”).
loop: (booliano) se o vídeo de saída deve ser repetido.
duration: (enumeração) a duração do vídeo de saída (“5 s”, “9 s”).
resolution: (enumeração) a resolução do vídeo de saída (“540p”, “720p”).

O arquivo MP4 será armazenado no bucket do Amazon S3 conforme configurado na resposta.

Text-to-Video Geração

Gere vídeos com base em prompts de texto usando o modelo Luma Ray 2. O modelo oferece várias opções de personalização, como proporção, duração, resolução e loop.

Text-to-Video Solicitação básica


{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "an old lady laughing underwater, wearing a scuba diving suit"
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Avançado Text-to-Video com opções


{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "an old lady laughing underwater, wearing a scuba diving suit",
    "aspect_ratio": "16:9",
    "loop": true,
    "duration": "5s",
    "resolution": "720p"
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Text-to-Video Exemplo adicional

Exemplo com parâmetros de resolução e duração.


{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "a car",
    "resolution": "720p",
    "duration": "5s"
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Image-to-Video Geração

Transforme imagens estáticas em vídeos dinâmicos fornecendo quadros-chave. É possível especificar quadros iniciais, quadros finais ou ambos para controlar o processo de geração de vídeo.

Básico Image-to-Video com Start Frame


{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "A tiger walking in snow",
    "keyframes": {
      "frame0": {
        "type": "image",
        "source": {
          "type": "base64",
          "media_type": "image/jpeg",
          "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3"
        }
      }
    }
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Image-to-Video com quadros inicial e final


{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "A tiger walking in snow",
    "keyframes": {
      "frame0": {
        "type": "image",
        "source": {
          "type": "base64",
          "media_type": "image/jpeg",
          "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3"
        }
      },
      "frame1": {
        "type": "image",
        "source": {
          "type": "base64",
          "media_type": "image/jpeg",
          "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3"
        }
      }
    },
    "loop": false,
    "aspect_ratio": "16:9"
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Parâmetros adicionais para Image-to-Video

quadros-chave — (objeto) Define quadros-chave de início (quadro0) e and/or fim (quadro1)
- frame0: imagem do quadro-chave inicial.
- frame1: imagem do quadro-chave final.
- type: deve ser “imagem”.
- source: fonte da imagem.

Solução de problemas

Problemas e soluções comuns ao trabalhar com modelos da Luma AI:

Status de trabalho “Failed”: verifique se o bucket do S3 tem as permissões de gravação adequadas e se o bucket existe na mesma região do serviço Bedrock.
Erros de acesso ao URL da imagem: verifique se os URLs das imagens estão acessíveis ao público e usam HTTPS. As imagens devem estar nos formatos compatíveis (JPEG ou PNG).
Erros de parâmetros inválidos: verifique se os valores das proporções correspondem às opções permitidas (“1:1”, “16:9”, “9:16”, “4:3”, “3:4”, “21:9”, “9:21”) e a duração é “5 s” ou “9 s”.
Problemas de tempo limite: use GetAsyncInvoke para verificar o status do trabalho em vez de esperar de forma síncrona. A geração de vídeo pode levar alguns minutos.
Erros de tamanho do prompt: mantenha os prompts com 1 a 5 mil caracteres. Prompts mais longos serão rejeitados.

Observações sobre desempenho

Considerações importantes sobre o desempenho e as limitações do modelo da Luma AI:

Tempo de processamento: a geração de vídeo normalmente leva de 2 a 5 minutos para vídeos de 5 segundos e de 4 a 8 minutos para vídeos de 9 segundos, dependendo da complexidade.
Requisitos de imagem: as imagens de entrada devem ser de alta qualidade, com resolução mínima de 512 x 512 pixels. O tamanho máximo de imagem permitido é de 4.096 x 4096 pixels.
Tamanho do vídeo de saída: os vídeos gerados variam de 5 MB a 50 MB, dependendo da duração, resolução e complexidade do conteúdo.
Limites de taxa: as chamadas de API assíncronas estão sujeitas a cotas de serviço. Monitore seu uso e solicite aumentos de cota, se necessário.
Armazenamento do S3: garanta capacidade de armazenamento suficiente do S3 para vídeos de saída e considere a possibilidade de utilizar políticas de ciclo de vida para otimizar os custos.

Documentação relacionada

Para ter informações adicionais e saber mais sobre serviços relacionados:

Configuração do Amazon S3: Criar buckets do S3 e políticas de bucket para armazenamento de saída.
Operações de API assíncronas - StartAsyncInvoke, GetAsyncInvoke, e referência de ListAsyncInvokesAPI.
Cotas de serviço: Cotas do Amazon Bedrock, para se informar sobre solicitações de aumento de limites e cotas de serviço do Bedrock.
Práticas recomendadas de processamento de vídeo: Fazendo solicitações de inferência, para obter orientação geral sobre inferência de modelos.
Documentação da Luma AI: geração de vídeo da Luma Labs, para conhecer recursos detalhados do modelo e recursos avançados.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

DeepSeek Modelos da

Modelos Llama da Meta