Acesso e uso de geração de imagens - Amazon Nova

Acesso e uso de geração de imagens

O Amazon Nova Canvas está disponível por meio da API InvokeModel do Bedrock e aceita os parâmetros de inferência e respostas de modelo a seguir ao realizar uma inferência do modelo.

Formato de solicitação e resposta da geração de imagens

Ao fazer uma chamada de InvokeModel usando o modelo Amazon Nova Canvas, substitua o campo body da solicitação pelo formato correspondente ao caso de uso. Todas as tarefas compartilham um objeto imageGenerationConfig, mas cada tarefa tem um objeto de parâmetros específico da tarefa. Os casos de uso a seguir são compatíveis:

Valor do tipo da tarefa Campo de parâmetro da tarefa Categoria da tarefa Descrição
TEXT_IMAGE with text only textToImageParams Generation Generate an image using a text prompt.
TEXT_IMAGE with image conditioning textToImageParams Generation Provide an input condicionamento image along with a text prompt to generate an image that follows the layout and composition of the conditioning image.
COLOR_GUIDED_GENERATION colorGuidedGenerationParams Generation Provide a list of color values in hexadecimal format (e.g. #FF9800) along with a text prompt and optional reference image to generate an image that follows the specified color palette.
IMAGE_VARIATION imageVariationParams Generation Provide one or more input images—with or without a text prompt—to influence the generated image. Can be used to influence the visual style of the generated image (when used with a text prompt), to generate variations of a single image (when used without a text prompt), and for other creative effects and control.
INPAINTING inPaintingParams Editing Modify an image by changing the area inside of a mascarado region. Can be used to add, remove, or replace elements of an image.
OUTPAINTING outPaintingParams Editing Modify an image by changing the area outside of a mascarado region. Can be used to replace the background behind a subject.
BACKGROUND_REMOVAL backgroundRemovalParams Editing Automatically remove the background of any image, replacing the background with transparent pixels. Can be useful when you want to later composite the image with other elements in an image editing app, presentation, or website. The background can easily be changed to a solid color through custom code as well.

Imagens de entrada para geração de imagens

Muitos tipos de tarefas exigem que uma ou mais imagens de entrada sejam incluídas na solicitação. Qualquer imagem usada na solicitação deve ser codificada como uma string Base64. Geralmente, as imagens podem estar no formato PNG ou JPEG e devem ter 8 bits por canal de cor (RGB). As imagens PNG podem conter um canal alfa adicional, mas esse canal não deve conter pixels transparentes ou translúcidos. Para obter detalhes específicos sobre as dimensões de imagem de entrada compatíveis, consulte Resoluções de imagem compatíveis.

Uma imagem com máscara é uma imagem que indica a área onde aplicar o recurso de inpainting ou outpainting. Essa imagem pode conter somente pixels em preto puro e branco puro.

Para solicitações de inpainting, a área colorida em preto é denominada a máscara e será alterada. O restante da imagem com máscara deve conter apenas pixels brancos puros. Pixels brancos puros indicam a área fora da máscara.

Para solicitações de outpainting, a área colorida em branco será alterada pelo modelo.

As imagens com máscara não devem conter pixels que não sejam preto puro ou branco puro. Se você estiver usando uma imagem JPEG como máscara, ela deverá ser compactada com 100% de qualidade para evitar a introdução de pixels não brancos ou não pretos durante a compactação.

Para exemplos de como codificar ou decodificar uma imagem de ou para uma string Base64, consulte os exemplos de código.

Mascarar imagens

Quando você está editando uma imagem, uma máscara é uma forma de definir as regiões a serem editadas. Você pode definir uma máscara usando umas das seguintes formas:

  • maskPrompt: escreva um prompt de texto em linguagem natural para descrever as partes da imagem a serem mascaradas.

  • maskImage: uma imagem em preto e branco em que os pixels pretos puros indicam a área dentro da máscara e os pixels brancos puros indicam a área fora da máscara.

    Para uma solicitação de inpainting, os pixels pretos serão alterados pelo modelo. Para solicitações de outpainting, os pixels brancos serão alterados.

Você pode usar uma ferramenta de edição de fotos para desenhar máscaras ou criá-las com seu próprio código personalizado. Do contrário, use o campo maskPrompt para permitir que o modelo infira a máscara.

Resoluções de imagem compatíveis

Você pode especificar qualquer resolução de saída para uma tarefa de geração, desde que ela atenda aos seguintes requisitos:

  • Cada lado deve ter entre 320 e 4096 pixels, inclusive.

  • Cada lado deve ser divisível igualmente por 16.

  • A taxa de proporção deve estar entre 1:4 e 4:1. Ou seja, um lado não pode ser mais de quatro vezes maior que o outro lado.

  • A contagem total de pixels deve ser menor que 4.194.304.

A maioria dessas mesmas restrições também se aplica às imagens de entrada. No entanto, os lados das imagens não precisam ser divisíveis igualmente por 16.