As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Calcular o custo de execução de um modelo personalizado
Você é recebe cobrança pela execução de inferência com modelos personalizados que você importa para o Amazon Bedrock. Use as informações a seguir para estimar o custo de execução de um modelo personalizado.
Uma unidade de modelo personalizado (CMU) é uma visão abstrata da utilização de hardware da qual o Amazon Bedrock precisa para hospedar uma única cópia do modelo personalizado. Uma cópia do modelo representa uma única instância do modelo importado que está pronta para atender a solicitações de inferência. O Amazon Bedrock determina o número de unidades de modelo personalizado do qual uma cópia do modelo precisa quando você importa o modelo personalizado. Conforme a demanda de inferência muda, o Amazon Bedrock pode aumentar ou diminuir o número de cópias do modelo que estão em execução.
Você pode usar CMUs para estimar o custo de execução do modelo personalizado usando a fórmula a seguir.
Custo total = Número de cópias do modelo em execução × Número de CMUs por cópia × Taxa de cobrança por CMU por minuto × ((Número de janelas de 5 minutos)/60)
-
Número de cópias do modelo em execução: obtenha com a métrica
ModelCopyno Amazon CloudWatch. -
Número de CMUs por cópia: obtenha o valor na página de detalhes do modelo na página de detalhes do Amazon Bedrock. Ou chame a operação GetImportedModel e obtenha o número de CMUs por cópia no campo
customModelUnitsPerModelCopy. -
Taxa de cobrança por CMU por minuto: obtenha a versão personalizada das unidades do modelo na página de detalhes do modelo no console do Amazon Bedrock. Ou chame a operação GetImportedModel e obtenha a versão personalizada das unidades do modelo no campo
customModelUnitsVersion.Em seguida, obtenha a taxa de cobrança (preço por unidade de modelo personalizado por min*) para a versão do modelo (versão de unidade de modelo personalizado) na seção Importação de modelo personalizado da página Preços do Amazon Bedrock
.
O faturamento é aplicado em períodos de faturamento de 5 minutos a partir da primeira chamada de inferência bem-sucedida.
Para obter mais informações, consulte Definição de preçoAmazon Bedrock