Entendendo os preços do Amazon Bedrock em CUR Exemplos de tipos de uso de CUR Etiquetas de alocação de custos em CUR Coisas importantes que você deve saber ao ler seus dados CUR

Entendendo os dados do relatório de uso e custo do Amazon Bedrock

AWS Os relatórios de custo e uso de exportações de dados (CUR 2.0) são a forma AWS recomendada de receber seus dados detalhados de custo e uso. O CUR 2.0 fornece detalhes do item de linha para cada solicitação de inferência do Amazon Bedrock. Cada solicitação gera itens de linha separados para cada tipo de token, com tipos de uso e preços unitários distintos. Esta página explica como ler as entradas do Amazon Bedrock em CUR e reconciliá-las com seus gastos reais. Para obter mais informações sobre o AWS CUR 2.0, consulte a documentação de exportação AWS de dados.

Entendendo os preços do Amazon Bedrock em CUR

Os preços do Amazon Bedrock em CUR são determinados por três fatores: o tipo de token, o nível de serviço e se a solicitação foi encaminhada por meio de inferência entre regiões. Compreender cada um deles é essencial para uma reconciliação precisa de custos.

Tipos de token

As cobranças do Amazon Bedrock são divididas por quatro tipos de token. Cada um tem um preço unitário diferente.

Tipo de token	Padrão de tipo de uso do CUR	Description
Tokens de entrada	`-input-tokens` ou `-mantle-input-tokens-*`	Tokens enviados no prompt de solicitação
Tokens de saída	`-output-tokens` ou `-mantle-output-tokens-*`	Tokens gerados na resposta
Tokens de leitura em cache	`*-cache-read-input-token-count`	Tokens lidos do cache imediato (significativamente mais baratos do que a entrada)
Tokens de gravação em cache	`*-cache-write-input-token-count`	Tokens gravados no cache de solicitações (mais caros do que a entrada)

Importante

Todos os quatro tipos de token devem ser considerados ao conciliar o uso com os gastos. Se você somar apenas os tokens de entrada e saída, seus totais não corresponderão à sua fatura. Essa é a fonte mais comum de lacunas de reconciliação, especialmente para cargas de trabalho que usam muito o cache imediato.

Níveis de serviço

O Amazon Bedrock oferece suporte a diferentes níveis de serviço que afetam os preços e a disponibilidade. O nível de serviço de uma solicitação é refletido no tipo de uso do CUR. Ao reconciliar custos, certifique-se de aplicar o preço unitário correto para o nível de serviço associado a cada item de linha.

Para obter mais informações sobre os níveis de serviço e como eles afetam os preços de inferência, consulte. Níveis de serviço para otimizar o desempenho e o custo

Exemplos de tipos de uso de CUR

O line_item_usage_type campo identifica o modelo, o tipo de token, o nível de serviço e se a solicitação usou inferência entre regiões. O formato varia de acordo com o endpoint:

{region}-{model}-{token-type}para solicitações de nível bedrock-runtime padrão
{region}-{model}-{token-type}-{tier}para bedrock-runtime solicitações prioritárias ou de nível flexível
{region}-{model}-mantle-{token-type}-standardpara bedrock-mantle solicitações
{region}-{model}-{token-type}-cross-region-globalpara solicitações entre regiões

Tipo de uso	Modelo	Nível de serviço	Tipo de token	Roteamento
`USE1-openai.gpt-oss-120b-mantle-input-tokens-standard`	OpenAI gpt-oss-120b	Standard	Input	In-region
`USE1-gpt-oss-120b-output-tokens-priority`	OpenAI gpt-oss-120b	Prioridade	Output	In-region
`USE1-Nova2.0Lite-input-tokens-flex`	Amazon Nova 2 Lite	Flexionar	Input	In-region
`USE1-Claude4.6Sonnet-input-tokens`	Soneto de Claude 4.6	Standard	Input	In-region
`USE1-Claude4.6Sonnet-cache-read-input-token-count`	Soneto de Claude 4.6	Standard	Leitura de cache	In-region
`USE1-Claude4.6Sonnet-output-tokens-cross-region-global`	Soneto de Claude 4.6	Standard	Output	Cross-region

Etiquetas de alocação de custos em CUR

As tags de alocação de custos dos principais, projetos e perfis de inferência de aplicativos do IAM aparecem como colunas no CUR com o prefixo e. resourceTags/{key} iamPrincipal/{key} Por exemplo, uma tag com chave Team aparece comoresourceTags/Team.

Método de atribuição	Como as tags aparecem no CUR
Tags principais do IAM	Tags do usuário ou função do IAM que está fazendo a solicitação
Tags de sessão	Tags passadas durante a assunção de função ou federação
Tags do projeto	Tags atribuídas a um projeto Amazon Bedrock
Tags de perfil de inferência de aplicativos	Tags atribuídas a um perfil de inferência de aplicativo

As tags devem ser ativadas como etiquetas de alocação de custos no console de AWS faturamento antes de aparecerem no CUR. Para obter mais informações, consulte Ativação de tags de alocação de custos.

Coisas importantes que você deve saber ao ler seus dados CUR

Para aproveitar ao máximo seus dados de CUR e evitar confusão ao analisar custos, lembre-se do seguinte.

Conta para todos os tipos de token. O Amazon Bedrock cobra separadamente pelos tokens de entrada, saída, leitura em cache e gravação em cache. Cada um tem um preço unitário diferente. Se você observar apenas os tokens de entrada e saída, sua análise subestimará os custos, especialmente para cargas de trabalho que usam muito o cache imediato.
Aplique a taxa correta para cada tipo de roteamento. In-region e a inferência entre regiões têm preços unitários diferentes. Se suas cargas de trabalho usarem ambas, certifique-se de usar a taxa correspondente para cada uma ao analisar os custos.
Ative as tags antes de esperá-las no CUR. As tags de alocação de custos devem ser ativadas no console de AWS faturamento antes de aparecerem no CUR ou no Cost Explorer. Após a ativação, aguarde até 24 horas para que as tags comecem a ser preenchidas.
Use CUR 2.0 para atribuição principal do IAM. A identidade principal e os dados de tag do IAM exigem CUR 2.0 (Exportações AWS de dados). Se você estiver usando o formato CUR legado, os campos principais do IAM não estarão disponíveis. Per-token os detalhamentos de custos estão disponíveis em ambos os formatos CUR. Para obter instruções detalhadas de configuração, consulte Como usar o IAM principal para alocação de custos.

Atenção O Javascript está desativado ou não está disponível no seu navegador.

Para usar a documentação da AWS, o Javascript deve estar ativado. Consulte as páginas de Ajuda do navegador para obter instruções.

Convenções do documento

Per-request marcação de metadados

Capacidades adicionais