Text-to-Video Generazione Image-to-Video Generazione Risoluzione dei problemi Note per le prestazioni Documentazione correlata

Luma AI Modelli

Questa sezione descrive i parametri di richiesta e i campi di risposta per i modelli Luma AI. Usa queste informazioni per effettuare chiamate di inferenza ai modelli Luma AI con l'operazione. StartAsyncInvoke Questa sezione include anche esempi di codice Python che mostrano come chiamare i modelli Luma AI. Per utilizzare un modello in un’operazione di inferenza, è necessario l’ID modello per il modello.

ID modello: luma.ray-v2:0
Nome del modello: Luma Ray 2
Modello da testo a video

I modelli Luma AI elaborano i prompt dei modelli in modo asincrono utilizzando le API Async, tra cui, e. StartAsyncInvoke GetAsyncInvoke ListAsyncInvokes

Il modello Luma AI elabora i prompt utilizzando la seguente procedura.

L'utente richiede StartAsyncInvokeal modello di utilizzare.
Attendi che InvokeJob sia terminato. Puoi utilizzare GetAsyncInvoke o ListAsyncInvokes per controllare lo stato di completamento del processo.
L’output del modello viene inserito nel bucket Amazon S3 di output specificato

Per ulteriori informazioni sull’utilizzo dei modelli Luma AI con le API, consulta Video Generation.

Chiamata di inferenza Luma AI.


POST /async-invoke HTTP/1.1
Content-type: application/json
{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "your input text here",
    "aspect_ratio": "16:9",
    "loop": false,
    "duration": "5s",
    "resolution": "720p"
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Campi

prompt (stringa): contenuto necessario nel video di output (1 <= lunghezza <= 5.000 caratteri).
aspect_ratio (valore numerico) Proporzioni del video di output (“1:1”, “16:9”, “9:16”, “4:3”, “3:4”, “21:9”, “9:21”).
loop (valore booleano): indica se riprodurre in loop il video di output.
duration (valore numerico): durata del video di output (“5s”, “9s”).
resolution (valore numerico): risoluzione del video di output (“540p”, “720p”).

Il file MP4 verrà archiviato nel bucket Amazon S3 come configurato nella risposta.

Text-to-Video Generazione

Genera video da prompt di testo utilizzando il modello Luma Ray 2. Il modello supporta varie opzioni di personalizzazione tra cui proporzioni, durata, risoluzione e loop.

Text-to-Video Richiesta di base


{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "an old lady laughing underwater, wearing a scuba diving suit"
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Text-to-Video Avanzato con opzioni


{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "an old lady laughing underwater, wearing a scuba diving suit",
    "aspect_ratio": "16:9",
    "loop": true,
    "duration": "5s",
    "resolution": "720p"
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Text-to-Video Esempio aggiuntivo

Esempio con parametri di risoluzione e durata.


{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "a car",
    "resolution": "720p",
    "duration": "5s"
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Image-to-Video Generazione

Trasforma immagini statiche in video dinamici fornendo fotogrammi chiave. È possibile specificare fotogrammi iniziali, fotogrammi finali o entrambi per controllare il processo di generazione del video.

Basic Image-to-Video con Start Frame


{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "A tiger walking in snow",
    "keyframes": {
      "frame0": {
        "type": "image",
        "source": {
          "type": "base64",
          "media_type": "image/jpeg",
          "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3"
        }
      }
    }
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Image-to-Video con frame iniziale e finale


{
  "modelId": "luma.ray-v2:0",
  "modelInput": {
    "prompt": "A tiger walking in snow",
    "keyframes": {
      "frame0": {
        "type": "image",
        "source": {
          "type": "base64",
          "media_type": "image/jpeg",
          "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3"
        }
      },
      "frame1": {
        "type": "image",
        "source": {
          "type": "base64",
          "media_type": "image/jpeg",
          "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3"
        }
      }
    },
    "loop": false,
    "aspect_ratio": "16:9"
  },
  "outputDataConfig": {
    "s3OutputDataConfig": {
      "s3Uri": "s3://your-bucket-name"
    }
  }
}

Parametri aggiuntivi per Image-to-Video

fotogrammi chiave — (oggetto) Definisce i fotogrammi chiave di inizio (frame0) e and/or fine (frame1)
- frame0: immagine del fotogramma chiave iniziale
- frame1: immagine del fotogramma chiave finale
- type: deve essere “image”
- source: origine dell’immagine

Risoluzione dei problemi

Problemi e soluzioni comuni durante l’utilizzo di modelli Luma AI:

Stato del processo non riuscito: verifica che il bucket S3 disponga delle autorizzazioni di scrittura corrette e che il bucket esista nella stessa Regione del servizio Bedrock.
Errori di accesso agli URL delle immagini: assicurati che gli URL delle immagini siano accessibili pubblicamente e utilizzino HTTPS. Le immagini devono essere nei formati supportati (JPEG o PNG).
Errori di parametri non validi: verifica che i valori delle proporzioni corrispondano alle opzioni supportate (“1:1”, “16:9”, “9:16”, “4:3”, “3:4”, “21:9”, “9:21”) e che la durata sia “5s” o “9s”.
Problemi di timeout: utilizza GetAsyncInvoke per controllare lo stato del processo anziché attendere in modo sincrono. La generazione di video può richiedere alcuni minuti.
Errori di lunghezza dei prompt: mantieni i prompt compresi tra 1 e 5.000 caratteri. Prompt più lunghi verranno rifiutati.

Note per le prestazioni

Considerazioni importanti relative alle prestazioni e alle limitazioni dei modelli Luma AI:

Tempo di elaborazione: la generazione di video richiede in genere 2-5 minuti per video di 5 secondi e 4-8 minuti per video di 9 secondi, a seconda della complessità.
Requisiti relativi alle immagini: le immagini di input devono essere di alta qualità con una risoluzione minima di 512 x 512 pixel. La dimensione massima supportata dell’immagine è 4.096 x 4.096 pixel.
Dimensioni dei video di output: i video generati variano da 5 a 50 MB a seconda della durata, della risoluzione e della complessità del contenuto.
Limiti di utilizzo: le chiamate API asincrone sono soggette a quote di servizio. Monitora il tuo utilizzo e richiedi aumenti delle quote, se necessario.
Archiviazione S3: garantisci una capacità di archiviazione S3 sufficiente per i video di output e valuta le policy del ciclo di vita per l’ottimizzazione dei costi.

Documentazione correlata

Per ulteriori informazioni e servizi correlati:

Configurazione di Amazon S3: creazione di bucket S3 e policy di bucket per l’archiviazione di output.
Operazioni API asincrone - e riferimento all'API. StartAsyncInvoke GetAsyncInvoke ListAsyncInvokes
Quote di servizio: Quote per Amazon Bedrock per i limiti del servizio Bedrock e le richieste di aumento delle quote.
Best practice per l’elaborazione video: Effettuare richieste di inferenza per linee guida generali sull’inferenza dei modelli.
Documentazione di Luma AI: documentazione sulla generazione di video di Luma Labs per funzionalità dettagliate dei modelli e funzionalità avanzate.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

DeepSeek Modelli

modelli Meta Llama