Best practice di prompting per Amazon Nova Canvas
Il prompting per i modelli di generazione di immagini è diverso rispetto a quello per i modelli linguistici di grandi dimensioni (LLM). I modelli di generazione di immagini non hanno la capacità di ragionare o interpretare comandi espliciti. Per questo motivo, è meglio formulare il prompt come se fosse la didascalia di un’immagine anziché un comando o una conversazione. Potresti voler includere dettagli sul soggetto, l’azione, l’ambiente, l’illuminazione, lo stile e la posizione della fotocamera.
Per la scrittura di un prompt di generazione di immagini, tieni presente i seguenti requisiti e best practice:
-
I prompt non devono superare i 1.024 caratteri. Per prompt molto lunghi, inserisci i dettagli meno importanti verso la fine.
-
Non utilizzare parole di negazione come “no”, “non”, “senza” e così via nel prompt. Il modello non comprende le negazioni in un prompt e cercare di utilizzarle produrrà il risultato opposto rispetto a quello desiderato. Ad esempio, un prompt come “un cesto di frutta senza banane” indicherà al modello di includere le banane. Puoi invece utilizzare un prompt negativo, con il parametro
negativeText, per specificare eventuali oggetti o caratteristiche che desideri escludere dall’immagine. Ad esempio, “banane”. -
Come nei prompt, ometti parole di negazione dai prompt negativi.
-
Quando l’output ottenuto da un prompt è simile al risultato che desideri, ma non proprio perfetto, prova a utilizzare le seguenti tecniche una alla volta per perfezionarlo:
-
Utilizzando un valore
seedcoerente, apporta piccole modifiche al prompt o al prompt negativo ed eseguilo nuovamente. In questo modo puoi comprendere meglio in che modo la formulazione dei prompt influisce sull’output e migliorare i risultati in modo iterativo e controllato. -
Una volta perfezionato il prompt secondo le esigenze, genera più varianti utilizzando lo stesso prompt con un valore
seeddiverso. Spesso è utile generare più varianti di un’immagine eseguendo il prompt di esempio con seed diversi per trovare l’immagine di output perfetta.
-
Un prompt efficace spesso include brevi descrizioni dei seguenti elementi:
-
L’oggetto
-
L’ambiente
-
(Facoltativo) La posizione o la posa del soggetto
-
(Facoltativo) La descrizione dell’illuminazione
-
(Facoltativo) La posizione/L’inquadratura della fotocamera
-
(Facoltativo) Lo stile o il supporto visivo (“foto”, “illustrazione”, “dipinto” e così via).
Prompt: foto editoriale realistica di un’insegnante donna di fronte a una lavagna con un sorriso caloroso
Prompt negativo: braccia incrociate
Prompt: illustrazione per una storia fiabesca, eterea e dai toni delicati, con una donna che indossa un ampio cappello sul parapetto di una nave mentre guarda verso l’oceano
Prompt negativo: nuvole, onde
Prompt: vista da un drone di un fiume scuro che scorre in un austero paesaggio islandese, qualità cinematografica
Prompt: un uomo dalla carnagione scura, elegante e alla moda, che indossa una giacca arancione e occhiali a specchio. Scattata da un’angolazione leggermente bassa, con inquadratura su volto e busto, sfondo con edifici lineari verde acqua.