Aumentar a capacidade de invocação do modelo com throughput provisionado no Amazon Bedrock

O throughput é definido pelo número e pela taxa de entradas e saídas que um modelo processa e retorna. É possível comprar throughput provisionado para provisionar um nível mais alto de throughput para um modelo a um custo fixo. Se você personalizou um modelo, compre throughput provisionado para poder usá-lo.

Você recebe cobrança por hora pelo throughput provisionado que você compra. Para obter informações detalhadas sobre preços, consulte Preços do Amazon Bedrock. O preço por hora depende dos seguintes fatores:

O modelo que você escolhe (para modelos personalizados, o preço é o mesmo do modelo de base do qual ele foi personalizado).
O número de unidades de modelo (MUs) que você especifica para o throughput provisionado. Uma MU fornece um nível de throughput específico para o modelo especificado. O nível de throughput de uma MU especifica o seguinte:
- O número de tokens de entrada que uma MU pode processar em todas as solicitações em um período de um minuto.
- O número de tokens de saída que uma MU pode gerar em todas as solicitações em um período de um minuto.
nota
Para obter mais informações sobre o que uma MU especifica, preços por MU e para solicitar aumentos de limite, entre em contato com seu gerente. Conta da AWS
O período em que você se compromete a manter o throughput provisionado. Quanto maior o período do compromisso, mais descontos haverá no preço por hora. É possível escolher entre os seguintes níveis de comprometimento:
- Sem compromisso: é possível excluir o throughput provisionado a qualquer momento.
- Um mês: não é possível excluir o throughput provisionado até que o termo de compromisso de um mês tenha transcorrido.
- Seis meses: não é possível excluir o throughput provisionado até que o termo de compromisso de seis meses tenha transcorrido.
nota
O faturamento continua até que você exclua o throughput provisionado.

As etapas a seguir descrevem o processo de configuração e uso do throughput provisionado.

Determine o número de MUs que você deseja comprar para o throughput provisionado e o tempo durante o qual você deseja se comprometer a usar o throughput provisionado.
Compre throughput provisionado para um modelo de base.
Depois que o modelo provisionado for criado, você poderá usá-lo para executar inferência do modelo.

Tópicos

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Excluir um perfil de inferência de aplicação

Regiões e modelos compatíveis

Aumentar a capacidade de invocação do modelo com throughput provisionado no Amazon Bedrock

nota

nota

Tópicos