View a markdown version of this page

Entendendo os dados do relatório de uso e custo do Amazon Bedrock - Amazon Bedrock

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Entendendo os dados do relatório de uso e custo do Amazon Bedrock

AWS Os relatórios de custo e uso de exportações de dados (CUR 2.0) são a forma AWS recomendada de receber seus dados detalhados de custo e uso. O CUR 2.0 fornece detalhes do item de linha para cada solicitação de inferência do Amazon Bedrock. Cada solicitação gera itens de linha separados para cada tipo de token, com tipos de uso e preços unitários distintos. Esta página explica como ler as entradas do Amazon Bedrock em CUR e reconciliá-las com seus gastos reais. Para obter mais informações sobre o AWS CUR 2.0, consulte a documentação de exportação AWS de dados.

Entendendo os preços do Amazon Bedrock em CUR

Os preços do Amazon Bedrock em CUR são determinados por três fatores: o tipo de token, o nível de serviço e se a solicitação foi encaminhada por meio de inferência entre regiões. Compreender cada um deles é essencial para uma reconciliação precisa de custos.

Tipos de token

As cobranças do Amazon Bedrock são divididas por quatro tipos de token. Cada um tem um preço unitário diferente.

Tipo de token Padrão de tipo de uso do CUR Description
Tokens de entrada *-input-tokens ou *-mantle-input-tokens-* Tokens enviados no prompt de solicitação
Tokens de saída *-output-tokens ou *-mantle-output-tokens-* Tokens gerados na resposta
Tokens de leitura em cache *-cache-read-input-token-count Tokens lidos do cache imediato (significativamente mais baratos do que a entrada)
Tokens de gravação em cache *-cache-write-input-token-count Tokens gravados no cache de solicitações (mais caros do que a entrada)
Importante

Todos os quatro tipos de token devem ser considerados ao conciliar o uso com os gastos. Se você somar apenas os tokens de entrada e saída, seus totais não corresponderão à sua fatura. Essa é a fonte mais comum de lacunas de reconciliação, especialmente para cargas de trabalho que usam muito o cache imediato.

Níveis de serviço

O Amazon Bedrock oferece suporte a diferentes níveis de serviço que afetam os preços e a disponibilidade. O nível de serviço de uma solicitação é refletido no tipo de uso do CUR. Ao reconciliar custos, certifique-se de aplicar o preço unitário correto para o nível de serviço associado a cada item de linha.

Para obter mais informações sobre os níveis de serviço e como eles afetam os preços de inferência, consulte. Níveis de serviço para otimizar o desempenho e o custo

Exemplos de tipos de uso de CUR

O line_item_usage_type campo identifica o modelo, o tipo de token, o nível de serviço e se a solicitação usou inferência entre regiões. O formato varia de acordo com o endpoint:

  • {region}-{model}-{token-type}para solicitações de nível bedrock-runtime padrão

  • {region}-{model}-{token-type}-{tier}para bedrock-runtime solicitações prioritárias ou de nível flexível

  • {region}-{model}-mantle-{token-type}-standardpara bedrock-mantle solicitações

  • {region}-{model}-{token-type}-cross-region-globalpara solicitações entre regiões

Tipo de uso Modelo Nível de serviço Tipo de token Roteamento
USE1-openai.gpt-oss-120b-mantle-input-tokens-standard OpenAI gpt-oss-120b Standard Input In-region
USE1-gpt-oss-120b-output-tokens-priority OpenAI gpt-oss-120b Prioridade Output In-region
USE1-Nova2.0Lite-input-tokens-flex Amazon Nova 2 Lite Flexionar Input In-region
USE1-Claude4.6Sonnet-input-tokens Soneto de Claude 4.6 Standard Input In-region
USE1-Claude4.6Sonnet-cache-read-input-token-count Soneto de Claude 4.6 Standard Leitura de cache In-region
USE1-Claude4.6Sonnet-output-tokens-cross-region-global Soneto de Claude 4.6 Standard Output Cross-region

Etiquetas de alocação de custos em CUR

As tags de alocação de custos dos principais, projetos e perfis de inferência de aplicativos do IAM aparecem como colunas no CUR com o prefixo e. resourceTags/{key} iamPrincipal/{key} Por exemplo, uma tag com chave Team aparece comoresourceTags/Team.

Método de atribuição Como as tags aparecem no CUR
Tags principais do IAM Tags do usuário ou função do IAM que está fazendo a solicitação
Tags de sessão Tags passadas durante a assunção de função ou federação
Tags do projeto Tags atribuídas a um projeto Amazon Bedrock
Tags de perfil de inferência de aplicativos Tags atribuídas a um perfil de inferência de aplicativo

As tags devem ser ativadas como etiquetas de alocação de custos no console de AWS faturamento antes de aparecerem no CUR. Para obter mais informações, consulte Ativação de tags de alocação de custos.

Coisas importantes que você deve saber ao ler seus dados CUR

Para aproveitar ao máximo seus dados de CUR e evitar confusão ao analisar custos, lembre-se do seguinte.

  • Conta para todos os tipos de token. O Amazon Bedrock cobra separadamente pelos tokens de entrada, saída, leitura em cache e gravação em cache. Cada um tem um preço unitário diferente. Se você observar apenas os tokens de entrada e saída, sua análise subestimará os custos, especialmente para cargas de trabalho que usam muito o cache imediato.

  • Aplique a taxa correta para cada tipo de roteamento. In-region e a inferência entre regiões têm preços unitários diferentes. Se suas cargas de trabalho usarem ambas, certifique-se de usar a taxa correspondente para cada uma ao analisar os custos.

  • Ative as tags antes de esperá-las no CUR. As tags de alocação de custos devem ser ativadas no console de AWS faturamento antes de aparecerem no CUR ou no Cost Explorer. Após a ativação, aguarde até 24 horas para que as tags comecem a ser preenchidas.

  • Use CUR 2.0 para atribuição principal do IAM. A identidade principal e os dados de tag do IAM exigem CUR 2.0 (Exportações AWS de dados). Se você estiver usando o formato CUR legado, os campos principais do IAM não estarão disponíveis. Per-token os detalhamentos de custos estão disponíveis em ambos os formatos CUR. Para obter instruções detalhadas de configuração, consulte Como usar o IAM principal para alocação de custos.