Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Modelli Luma AI
Questa sezione descrive i parametri di richiesta e i campi di risposta per i modelli Luma AI. Usa queste informazioni per effettuare chiamate di inferenza ai modelli di intelligenza artificiale di Luma con l'operazione. StartAsyncInvoke Questa sezione include anche esempi di codice Python che mostrano come chiamare i modelli Luma AI. Per utilizzare un modello in un’operazione di inferenza, è necessario l’ID modello per il modello.
-
ID modello: luma.ray-v2:0
-
Nome del modello: Luma Ray 2
-
Modello da testo a video
I modelli Luma AI elaborano i prompt dei modelli in modo asincrono utilizzando Async, tra cui, e. APIs StartAsyncInvokeGetAsyncInvokeListAsyncInvokes
Il modello Luma AI elabora i prompt utilizzando la seguente procedura.
-
L'utente richiede StartAsyncInvokeal modello di utilizzare.
-
Attendere che InvokeJob sia terminato. Puoi utilizzare
GetAsyncInvokeoListAsyncInvokesper controllare lo stato di completamento del processo. -
L’output del modello viene inserito nel bucket Amazon S3 di output specificato
Per ulteriori informazioni sull'utilizzo dei modelli Luma AI con APIs, consulta Generazione video
Chiamata di inferenza Luma AI.
POST /async-invoke HTTP/1.1 Content-type: application/json { "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "your input text here", "aspect_ratio": "16:9", "loop": false, "duration": "5s", "resolution": "720p" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }
Campi
-
prompt (stringa): contenuto necessario nel video di output (1 <= lunghezza <= 5.000 caratteri).
-
aspect_ratio (valore numerico) Proporzioni del video di output (“1:1”, “16:9”, “9:16”, “4:3”, “3:4”, “21:9”, “9:21”).
-
loop (valore booleano): indica se riprodurre in loop il video di output.
-
duration (valore numerico): durata del video di output (“5s”, “9s”).
-
resolution (valore numerico): risoluzione del video di output (“540p”, “720p”).
Il MP4 file verrà archiviato nel bucket Amazon S3 come configurato nella risposta.
Text-to-Video Generazione
Genera video da prompt di testo utilizzando il modello Luma Ray 2. Il modello supporta varie opzioni di personalizzazione tra cui proporzioni, durata, risoluzione e loop.
Text-to-VideoRichiesta di base
{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "an old lady laughing underwater, wearing a scuba diving suit" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }
Text-to-VideoAvanzato con opzioni
{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "an old lady laughing underwater, wearing a scuba diving suit", "aspect_ratio": "16:9", "loop": true, "duration": "5s", "resolution": "720p" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }
Text-to-VideoEsempio aggiuntivo
Esempio con parametri di risoluzione e durata.
{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "a car", "resolution": "720p", "duration": "5s" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }
Image-to-Video Generazione
Trasforma immagini statiche in video dinamici fornendo fotogrammi chiave. È possibile specificare fotogrammi iniziali, fotogrammi finali o entrambi per controllare il processo di generazione del video.
Basic Image-to-Video con Start Frame
{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "A tiger walking in snow", "keyframes": { "frame0": { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3" } } } }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }
Image-to-Video con frame iniziale e finale
{ "modelId": "luma.ray-v2:0", "modelInput": { "prompt": "A tiger walking in snow", "keyframes": { "frame0": { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3" } }, "frame1": { "type": "image", "source": { "type": "base64", "media_type": "image/jpeg", "data": "iVBORw0KGgoAAAANSUhEUgAAAAgAAAAIAQMAAAD+wSzIAAAABlBMVEX///+/v7+jQ3" } } }, "loop": false, "aspect_ratio": "16:9" }, "outputDataConfig": { "s3OutputDataConfig": { "s3Uri": "s3://your-bucket-name" } } }
Parametri aggiuntivi per Image-to-Video
-
fotogrammi chiave — (oggetto) Definisce i fotogrammi chiave di inizio (frame0) e and/or fine (frame1)
-
frame0: immagine del fotogramma chiave iniziale
-
frame1: immagine del fotogramma chiave finale
-
type: deve essere “image”
-
source: origine dell’immagine
-
risoluzione dei problemi
Problemi e soluzioni comuni durante l’utilizzo di modelli Luma AI:
-
Stato del processo non riuscito: verifica che il bucket S3 disponga delle autorizzazioni di scrittura corrette e che il bucket esista nella stessa Regione del servizio Bedrock.
-
Errori di accesso all'URL dell'immagine: assicurati che le immagini URLs siano accessibili pubblicamente e utilizzi HTTPS. Le immagini devono essere nei formati supportati (JPEG o PNG).
-
Errori di parametri non validi: verifica che i valori delle proporzioni corrispondano alle opzioni supportate (“1:1”, “16:9”, “9:16”, “4:3”, “3:4”, “21:9”, “9:21”) e che la durata sia “5s” o “9s”.
-
Problemi di timeout: utilizza
GetAsyncInvokeper controllare lo stato del processo anziché attendere in modo sincrono. La generazione di video può richiedere alcuni minuti. -
Errori di lunghezza dei prompt: mantieni i prompt compresi tra 1 e 5.000 caratteri. Prompt più lunghi verranno rifiutati.
Note per le prestazioni
Considerazioni importanti relative alle prestazioni e alle limitazioni dei modelli Luma AI:
-
Tempo di elaborazione: la generazione di video richiede in genere 2-5 minuti per video di 5 secondi e 4-8 minuti per video di 9 secondi, a seconda della complessità.
-
Requisiti relativi alle immagini: le immagini di input devono essere di alta qualità con una risoluzione minima di 512 x 512 pixel. La dimensione massima supportata dell’immagine è 4.096 x 4.096 pixel.
-
Dimensioni dei video di output: i video generati variano da 5 a 50 MB a seconda della durata, della risoluzione e della complessità del contenuto.
-
Limiti di utilizzo: le chiamate API asincrone sono soggette a quote di servizio. Monitora il tuo utilizzo e richiedi aumenti delle quote, se necessario.
-
Archiviazione S3: garantisci una capacità di archiviazione S3 sufficiente per i video di output e valuta le policy del ciclo di vita per l’ottimizzazione dei costi.
Documentazione correlata
Per ulteriori informazioni e servizi correlati:
-
Configurazione di Amazon S3: creazione di bucket S3 e policy di bucket per l’archiviazione di output.
-
Operazioni API asincrone - StartAsyncInvokee GetAsyncInvokeriferimento all'ListAsyncInvokesAPI.
-
Quote di servizio: Quote per Amazon Bedrock per i limiti del servizio Bedrock e le richieste di aumento delle quote.
-
Best practice per l’elaborazione video: Invio di prompt e generazione di risposte con l’inferenza del modello per linee guida generali sull’inferenza dei modelli.
-
Documentazione di Luma AI: documentazione sulla generazione di video di Luma Labs
per funzionalità dettagliate dei modelli e funzionalità avanzate.