Informazioni sui prezzi di Amazon Bedrock in CUR Esempi di tipi di utilizzo CUR Tag di allocazione dei costi in CUR Aspetti fondamentali da sapere quando si leggono i dati CUR

Comprensione dei dati del report sui costi e sull'utilizzo di Amazon Bedrock

AWS I report sui costi e sull'utilizzo delle esportazioni di dati (CUR 2.0) sono il metodo AWS consigliato per ricevere dati dettagliati su costi e utilizzo. CUR 2.0 fornisce dettagli sugli elementi di riga per ogni richiesta di inferenza di Amazon Bedrock. Ogni richiesta genera voci separate per ogni tipo di token, con tipi di utilizzo e prezzi unitari distinti. Questa pagina spiega come leggere le voci di Amazon Bedrock in CUR e riconciliarle con la spesa effettiva. Per ulteriori informazioni su AWS CUR 2.0, consulta la documentazione di Data Exports.AWS

Informazioni sui prezzi di Amazon Bedrock in CUR

I prezzi di Amazon Bedrock in CUR sono determinati da tre fattori: il tipo di token, il livello di servizio e se la richiesta è stata instradata tramite inferenza tra regioni. La comprensione di ciascuno di questi elementi è essenziale per una riconciliazione accurata dei costi.

Tipi di token

Le tariffe di Amazon Bedrock sono suddivise per quattro tipi di token. Ciascuno ha un prezzo unitario diverso.

Tipo di token	Modello del tipo di utilizzo CUR	Description
Token di input	`-input-tokens` o `-mantle-input-tokens-*`	Token inviati nel prompt di richiesta
Token di output	`-output-tokens` o `-mantle-output-tokens-*`	Token generati nella risposta
Token di lettura nella cache	`*-cache-read-input-token-count`	I token vengono letti dalla cache dei comandi (notevolmente più economici dell'input)
Token di scrittura nella cache	`*-cache-write-input-token-count`	Token scritti nella cache dei prompt (più costosi dell'input)

Importante

È necessario tenere conto di tutti e quattro i tipi di token quando si riconciliano l'utilizzo e la spesa. Se sommi solo i token di input e output, i totali non corrisponderanno alla fattura. Questa è la fonte più comune di lacune di riconciliazione, in particolare per i carichi di lavoro che utilizzano pesantemente il prompt caching.

Livelli di servizio

Amazon Bedrock supporta diversi livelli di servizio che influiscono su prezzi e disponibilità. Il livello di servizio per una richiesta si riflette nel tipo di utilizzo CUR. Quando riconciliate i costi, assicuratevi di applicare il prezzo unitario corretto per il livello di servizio associato a ciascuna voce.

Per ulteriori informazioni sui livelli di servizio e su come influiscono sui prezzi di inferenza, consulta. Livelli di servizio per l'ottimizzazione delle prestazioni e dei costi

Esempi di tipi di utilizzo CUR

Il line_item_usage_type campo identifica il modello, il tipo di token, il livello di servizio e indica se la richiesta ha utilizzato l'inferenza tra regioni. Il formato varia in base all'endpoint:

{region}-{model}-{token-type}per richieste bedrock-runtime di livello standard
{region}-{model}-{token-type}-{tier}per bedrock-runtime richieste di livello prioritario o flessibile
{region}-{model}-mantle-{token-type}-standardper richieste bedrock-mantle
{region}-{model}-{token-type}-cross-region-globalper richieste interregionali

Tipo di utilizzo	Modello	Livello di servizio	Tipo di token	Routing
`USE1-openai.gpt-oss-120b-mantle-input-tokens-standard`	OpenAI gpt-oss-120b	Standard	Input	In-region
`USE1-gpt-oss-120b-output-tokens-priority`	OpenAI gpt-oss-120b	Priorità	Output	In-region
`USE1-Nova2.0Lite-input-tokens-flex`	Amazon Nova 2 Lite	Flettere	Input	In-region
`USE1-Claude4.6Sonnet-input-tokens`	Claude Sonnet 4.6	Standard	Input	In-region
`USE1-Claude4.6Sonnet-cache-read-input-token-count`	Claude Sonnet 4.6	Standard	Lettura nella cache	In-region
`USE1-Claude4.6Sonnet-output-tokens-cross-region-global`	Claude Sonnet 4.6	Standard	Output	Cross-region

Tag di allocazione dei costi in CUR

I tag di allocazione dei costi dei principali IAM, dei progetti e dei profili di inferenza delle applicazioni vengono visualizzati come colonne in CUR con il prefisso e. resourceTags/{key} iamPrincipal/{key} Ad esempio, un tag con chiave appare come. Team resourceTags/Team

Metodo di attribuzione	Come appaiono i tag in CUR
Tag principali IAM	Tag dell'utente o del ruolo IAM che effettua la richiesta
Tag di sessione	Tag passati durante l'assunzione del ruolo o la federazione
Tag del progetto	Tag assegnati a un progetto Amazon Bedrock
Tag del profilo di inferenza dell'applicazione	Tag assegnati a un profilo di inferenza dell'applicazione

I tag devono essere attivati come tag di allocazione dei costi nella console di AWS fatturazione prima di apparire in CUR. Per ulteriori informazioni, consulta Attivazione dei tag di allocazione dei costi.

Aspetti fondamentali da sapere quando si leggono i dati CUR

Per ottenere il massimo dai dati CUR ed evitare confusione nell'analisi dei costi, tieni presente quanto segue.

Account per tutti i tipi di token. Amazon Bedrock addebita separatamente i token di input, output, lettura cache e scrittura cache. Ciascuno ha un prezzo unitario diverso. Se si considerano solo i token di input e output, l'analisi sottovaluterà i costi, soprattutto per i carichi di lavoro che utilizzano pesantemente il prompt caching.
Applica la tariffa corretta per ogni tipo di routing. In-region e l'inferenza interregionale hanno prezzi unitari diversi. Se i tuoi carichi di lavoro utilizzano entrambi, assicurati di utilizzare la tariffa corrispondente per ciascuno di essi quando analizzi i costi.
Attiva i tag prima di aspettarli in CUR. I tag di allocazione dei costi devono essere attivati nella console di AWS fatturazione prima di essere visualizzati in CUR o Cost Explorer. Dopo l'attivazione, attendi fino a 24 ore prima che i tag inizino a essere compilati.
Usa CUR 2.0 per l'attribuzione principale IAM. I dati principali dell'identità e dei tag IAM richiedono CUR 2.0 (Esportazioni AWS dati). Se utilizzi il formato CUR legacy, i campi principali IAM non saranno disponibili. Per-token le ripartizioni dei costi sono disponibili in entrambi i formati CUR. Per istruzioni di configurazione dettagliate, consulta Utilizzo del principio IAM per l'allocazione dei costi.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Per-request etichettatura dei metadati

Funzionalità aggiuntive