As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Entendendo os dados do relatório de uso e custo do Amazon Bedrock
AWS Os relatórios de custo e uso de exportações de dados (CUR 2.0) são a forma AWS recomendada de receber seus dados detalhados de custo e uso. O CUR 2.0 fornece detalhes do item de linha para cada solicitação de inferência do Amazon Bedrock. Cada solicitação gera itens de linha separados para cada tipo de token, com tipos de uso e preços unitários distintos. Esta página explica como ler as entradas do Amazon Bedrock em CUR e reconciliá-las com seus gastos reais. Para obter mais informações sobre o AWS CUR 2.0, consulte a documentação de exportação AWS de dados.
Entendendo os preços do Amazon Bedrock em CUR
Os preços do Amazon Bedrock em CUR são determinados por três fatores: o tipo de token, o nível de serviço e se a solicitação foi encaminhada por meio de inferência entre regiões. Compreender cada um deles é essencial para uma reconciliação precisa de custos.
Tipos de token
As cobranças do Amazon Bedrock são divididas por quatro tipos de token. Cada um tem um preço unitário diferente.
| Tipo de token | Padrão de tipo de uso do CUR | Description |
|---|---|---|
| Tokens de entrada | *-input-tokens ou *-mantle-input-tokens-* |
Tokens enviados no prompt de solicitação |
| Tokens de saída | *-output-tokens ou *-mantle-output-tokens-* |
Tokens gerados na resposta |
| Tokens de leitura em cache | *-cache-read-input-token-count |
Tokens lidos do cache imediato (significativamente mais baratos do que a entrada) |
| Tokens de gravação em cache | *-cache-write-input-token-count |
Tokens gravados no cache de solicitações (mais caros do que a entrada) |
Importante
Todos os quatro tipos de token devem ser considerados ao conciliar o uso com os gastos. Se você somar apenas os tokens de entrada e saída, seus totais não corresponderão à sua fatura. Essa é a fonte mais comum de lacunas de reconciliação, especialmente para cargas de trabalho que usam muito o cache imediato.
Níveis de serviço
O Amazon Bedrock oferece suporte a diferentes níveis de serviço que afetam os preços e a disponibilidade. O nível de serviço de uma solicitação é refletido no tipo de uso do CUR. Ao reconciliar custos, certifique-se de aplicar o preço unitário correto para o nível de serviço associado a cada item de linha.
Para obter mais informações sobre os níveis de serviço e como eles afetam os preços de inferência, consulte. Níveis de serviço para otimizar o desempenho e o custo
Exemplos de tipos de uso de CUR
O line_item_usage_type campo identifica o modelo, o tipo de token, o nível de serviço e se a solicitação usou inferência entre regiões. O formato varia de acordo com o endpoint:
-
{region}-{model}-{token-type}para solicitações de nívelbedrock-runtimepadrão -
{region}-{model}-{token-type}-{tier}parabedrock-runtimesolicitações prioritárias ou de nível flexível -
{region}-{model}-mantle-{token-type}-standardparabedrock-mantlesolicitações -
{region}-{model}-{token-type}-cross-region-globalpara solicitações entre regiões
| Tipo de uso | Modelo | Nível de serviço | Tipo de token | Roteamento |
|---|---|---|---|---|
USE1-openai.gpt-oss-120b-mantle-input-tokens-standard |
OpenAI gpt-oss-120b | Standard | Input | In-region |
USE1-gpt-oss-120b-output-tokens-priority |
OpenAI gpt-oss-120b | Prioridade | Output | In-region |
USE1-Nova2.0Lite-input-tokens-flex |
Amazon Nova 2 Lite | Flexionar | Input | In-region |
USE1-Claude4.6Sonnet-input-tokens |
Soneto de Claude 4.6 | Standard | Input | In-region |
USE1-Claude4.6Sonnet-cache-read-input-token-count |
Soneto de Claude 4.6 | Standard | Leitura de cache | In-region |
USE1-Claude4.6Sonnet-output-tokens-cross-region-global |
Soneto de Claude 4.6 | Standard | Output | Cross-region |
Etiquetas de alocação de custos em CUR
As tags de alocação de custos dos principais, projetos e perfis de inferência de aplicativos do IAM aparecem como colunas no CUR com o prefixo e. resourceTags/{key} iamPrincipal/{key} Por exemplo, uma tag com chave Team aparece comoresourceTags/Team.
| Método de atribuição | Como as tags aparecem no CUR |
|---|---|
| Tags principais do IAM | Tags do usuário ou função do IAM que está fazendo a solicitação |
| Tags de sessão | Tags passadas durante a assunção de função ou federação |
| Tags do projeto | Tags atribuídas a um projeto Amazon Bedrock |
| Tags de perfil de inferência de aplicativos | Tags atribuídas a um perfil de inferência de aplicativo |
As tags devem ser ativadas como etiquetas de alocação de custos no console de AWS faturamento antes de aparecerem no CUR. Para obter mais informações, consulte Ativação de tags de alocação de custos.
Coisas importantes que você deve saber ao ler seus dados CUR
Para aproveitar ao máximo seus dados de CUR e evitar confusão ao analisar custos, lembre-se do seguinte.
-
Conta para todos os tipos de token. O Amazon Bedrock cobra separadamente pelos tokens de entrada, saída, leitura em cache e gravação em cache. Cada um tem um preço unitário diferente. Se você observar apenas os tokens de entrada e saída, sua análise subestimará os custos, especialmente para cargas de trabalho que usam muito o cache imediato.
-
Aplique a taxa correta para cada tipo de roteamento. In-region e a inferência entre regiões têm preços unitários diferentes. Se suas cargas de trabalho usarem ambas, certifique-se de usar a taxa correspondente para cada uma ao analisar os custos.
-
Ative as tags antes de esperá-las no CUR. As tags de alocação de custos devem ser ativadas no console de AWS faturamento antes de aparecerem no CUR ou no Cost Explorer. Após a ativação, aguarde até 24 horas para que as tags comecem a ser preenchidas.
-
Use CUR 2.0 para atribuição principal do IAM. A identidade principal e os dados de tag do IAM exigem CUR 2.0 (Exportações AWS de dados). Se você estiver usando o formato CUR legado, os campos principais do IAM não estarão disponíveis. Per-token os detalhamentos de custos estão disponíveis em ambos os formatos CUR. Para obter instruções detalhadas de configuração, consulte Como usar o IAM principal para alocação de custos.