View a markdown version of this page

Comprensione dei dati del report sui costi e sull'utilizzo di Amazon Bedrock - Amazon Bedrock

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Comprensione dei dati del report sui costi e sull'utilizzo di Amazon Bedrock

AWS I report sui costi e sull'utilizzo delle esportazioni di dati (CUR 2.0) sono il metodo AWS consigliato per ricevere dati dettagliati su costi e utilizzo. CUR 2.0 fornisce dettagli sugli elementi di riga per ogni richiesta di inferenza di Amazon Bedrock. Ogni richiesta genera voci separate per ogni tipo di token, con tipi di utilizzo e prezzi unitari distinti. Questa pagina spiega come leggere le voci di Amazon Bedrock in CUR e riconciliarle con la spesa effettiva. Per ulteriori informazioni su AWS CUR 2.0, consulta la documentazione di Data Exports.AWS

Informazioni sui prezzi di Amazon Bedrock in CUR

I prezzi di Amazon Bedrock in CUR sono determinati da tre fattori: il tipo di token, il livello di servizio e se la richiesta è stata instradata tramite inferenza tra regioni. La comprensione di ciascuno di questi elementi è essenziale per una riconciliazione accurata dei costi.

Tipi di token

Le tariffe di Amazon Bedrock sono suddivise per quattro tipi di token. Ciascuno ha un prezzo unitario diverso.

Tipo di token Modello del tipo di utilizzo CUR Description
Token di input *-input-tokens o *-mantle-input-tokens-* Token inviati nel prompt di richiesta
Token di output *-output-tokens o *-mantle-output-tokens-* Token generati nella risposta
Token di lettura nella cache *-cache-read-input-token-count I token vengono letti dalla cache dei comandi (notevolmente più economici dell'input)
Token di scrittura nella cache *-cache-write-input-token-count Token scritti nella cache dei prompt (più costosi dell'input)
Importante

È necessario tenere conto di tutti e quattro i tipi di token quando si riconciliano l'utilizzo e la spesa. Se sommi solo i token di input e output, i totali non corrisponderanno alla fattura. Questa è la fonte più comune di lacune di riconciliazione, in particolare per i carichi di lavoro che utilizzano pesantemente il prompt caching.

Livelli di servizio

Amazon Bedrock supporta diversi livelli di servizio che influiscono su prezzi e disponibilità. Il livello di servizio per una richiesta si riflette nel tipo di utilizzo CUR. Quando riconciliate i costi, assicuratevi di applicare il prezzo unitario corretto per il livello di servizio associato a ciascuna voce.

Per ulteriori informazioni sui livelli di servizio e su come influiscono sui prezzi di inferenza, consulta. Livelli di servizio per l'ottimizzazione delle prestazioni e dei costi

Esempi di tipi di utilizzo CUR

Il line_item_usage_type campo identifica il modello, il tipo di token, il livello di servizio e indica se la richiesta ha utilizzato l'inferenza tra regioni. Il formato varia in base all'endpoint:

  • {region}-{model}-{token-type}per richieste bedrock-runtime di livello standard

  • {region}-{model}-{token-type}-{tier}per bedrock-runtime richieste di livello prioritario o flessibile

  • {region}-{model}-mantle-{token-type}-standardper richieste bedrock-mantle

  • {region}-{model}-{token-type}-cross-region-globalper richieste interregionali

Tipo di utilizzo Modello Livello di servizio Tipo di token Routing
USE1-openai.gpt-oss-120b-mantle-input-tokens-standard OpenAI gpt-oss-120b Standard Input In-region
USE1-gpt-oss-120b-output-tokens-priority OpenAI gpt-oss-120b Priorità Output In-region
USE1-Nova2.0Lite-input-tokens-flex Amazon Nova 2 Lite Flettere Input In-region
USE1-Claude4.6Sonnet-input-tokens Claude Sonnet 4.6 Standard Input In-region
USE1-Claude4.6Sonnet-cache-read-input-token-count Claude Sonnet 4.6 Standard Lettura nella cache In-region
USE1-Claude4.6Sonnet-output-tokens-cross-region-global Claude Sonnet 4.6 Standard Output Cross-region

Tag di allocazione dei costi in CUR

I tag di allocazione dei costi dei principali IAM, dei progetti e dei profili di inferenza delle applicazioni vengono visualizzati come colonne in CUR con il prefisso e. resourceTags/{key} iamPrincipal/{key} Ad esempio, un tag con chiave appare come. Team resourceTags/Team

Metodo di attribuzione Come appaiono i tag in CUR
Tag principali IAM Tag dell'utente o del ruolo IAM che effettua la richiesta
Tag di sessione Tag passati durante l'assunzione del ruolo o la federazione
Tag del progetto Tag assegnati a un progetto Amazon Bedrock
Tag del profilo di inferenza dell'applicazione Tag assegnati a un profilo di inferenza dell'applicazione

I tag devono essere attivati come tag di allocazione dei costi nella console di AWS fatturazione prima di apparire in CUR. Per ulteriori informazioni, consulta Attivazione dei tag di allocazione dei costi.

Aspetti fondamentali da sapere quando si leggono i dati CUR

Per ottenere il massimo dai dati CUR ed evitare confusione nell'analisi dei costi, tieni presente quanto segue.

  • Account per tutti i tipi di token. Amazon Bedrock addebita separatamente i token di input, output, lettura cache e scrittura cache. Ciascuno ha un prezzo unitario diverso. Se si considerano solo i token di input e output, l'analisi sottovaluterà i costi, soprattutto per i carichi di lavoro che utilizzano pesantemente il prompt caching.

  • Applica la tariffa corretta per ogni tipo di routing. In-region e l'inferenza interregionale hanno prezzi unitari diversi. Se i tuoi carichi di lavoro utilizzano entrambi, assicurati di utilizzare la tariffa corrispondente per ciascuno di essi quando analizzi i costi.

  • Attiva i tag prima di aspettarli in CUR. I tag di allocazione dei costi devono essere attivati nella console di AWS fatturazione prima di essere visualizzati in CUR o Cost Explorer. Dopo l'attivazione, attendi fino a 24 ore prima che i tag inizino a essere compilati.

  • Usa CUR 2.0 per l'attribuzione principale IAM. I dati principali dell'identità e dei tag IAM richiedono CUR 2.0 (Esportazioni AWS dati). Se utilizzi il formato CUR legacy, i campi principali IAM non saranno disponibili. Per-token le ripartizioni dei costi sono disponibili in entrambi i formati CUR. Per istruzioni di configurazione dettagliate, consulta Utilizzo del principio IAM per l'allocazione dei costi.