Implementar um modelo personalizado para inferência sob demanda

Depois de criar um modelo personalizado com um trabalho de personalização de modelo ou importar um Amazon Nova modelo personalizado SageMaker treinado por IA, você pode configurar a inferência sob demanda para o modelo. Com a inferência sob demanda, você paga apenas pelo que usa e não precisa configurar recursos computacionais provisionados.

Para configurar a inferência sob demanda para um modelo personalizado, você a implanta com uma implantação de modelo personalizado. Depois de implantar seu modelo personalizado, você usa o Amazon Resource Name (ARN) da implantação como modelId parâmetro ao enviar solicitações e gerar respostas com inferência do modelo.

Para obter informações sobre preços de inferência sob demanda, consulte os preços do Amazon Bedrock. Você pode implantar um modelo personalizado para inferência sob demanda nas seguintes regiões (para obter mais informações sobre regiões suportadas no Amazon Bedrock, consulte endpoints e cotas do Amazon Bedrock):

Leste dos EUA (N. da Virgínia)
Oeste dos EUA (Oregon)

Tópicos

Modelos básicos compatíveis

Você pode configurar a inferência sob demanda para os seguintes modelos básicos:

Amazon Nova Lite
Amazon Nova Micro
Amazon Nova Pro
Instrução Meta Llama 3.3 70B

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Comprar throughput provisionado para um modelo personalizado

Pré-requisitos