Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Comprendre les données de votre rapport sur les coûts et l'utilisation d'Amazon Bedrock
AWS Les rapports sur les coûts et l'utilisation des exportations de données (CUR 2.0) sont la méthode AWS recommandée pour recevoir vos données détaillées sur les coûts et l'utilisation. CUR 2.0 fournit des informations détaillées pour chaque demande d'inférence Amazon Bedrock. Chaque demande génère des rubriques distinctes pour chaque type de jeton, avec des types d'utilisation et des prix unitaires distincts. Cette page explique comment lire les entrées Amazon Bedrock dans CUR et les rapprocher de vos dépenses réelles. Pour plus d'informations sur AWS CUR 2.0, consultez la documentation sur AWS les exportations de données.
Comprendre la tarification d'Amazon Bedrock en CUR
La tarification d'Amazon Bedrock en CUR est déterminée par trois facteurs : le type de jeton, le niveau de service et le fait que la demande ait été acheminée par inférence entre régions. Il est essentiel de comprendre chacun de ces éléments pour un rapprochement précis des coûts.
Types de jetons
Les frais d'Amazon Bedrock sont répartis en quatre types de jetons. Chacun a un prix unitaire différent.
| Type de jeton | Modèle de type d'utilisation CUR | Description |
|---|---|---|
| Jetons d’entrée | *-input-tokens ou *-mantle-input-tokens-* |
Jetons envoyés dans l'invite de demande |
| Jetons de sortie | *-output-tokens ou *-mantle-output-tokens-* |
Jetons générés dans la réponse |
| Jetons de lecture du cache | *-cache-read-input-token-count |
Les jetons sont lus à partir du cache rapide (nettement moins chers que les jetons d'entrée) |
| Jetons d'écriture dans le cache | *-cache-write-input-token-count |
Jetons écrits dans le cache d'invite (plus coûteux que les jetons d'entrée) |
Important
Les quatre types de jetons doivent être pris en compte lors du rapprochement entre l'utilisation et les dépenses. Si vous additionnez uniquement les jetons d'entrée et de sortie, vos totaux ne correspondront pas à votre facture. Il s'agit de la source la plus courante d'écarts de réconciliation, en particulier pour les charges de travail qui utilisent fortement la mise en cache rapide.
Niveaux de service
Amazon Bedrock prend en charge différents niveaux de service qui ont une incidence sur les prix et la disponibilité. Le niveau de service d'une demande est reflété dans le type d'utilisation du CUR. Lorsque vous réconciliez les coûts, assurez-vous d'appliquer le prix unitaire correct pour le niveau de service associé à chaque article.
Pour plus d'informations sur les niveaux de service et leur incidence sur les prix d'inférence, consultezNiveaux de service pour optimiser les performances et les coûts.
Exemples de types d'utilisation du CUR
Le line_item_usage_type champ indique le modèle, le type de jeton, le niveau de service et indique si la demande a utilisé l'inférence entre régions. Le format varie selon le point de terminaison :
-
{region}-{model}-{token-type}pour les demandes de niveaubedrock-runtimestandard -
{region}-{model}-{token-type}-{tier}pour les demandesbedrock-runtimeprioritaires ou flexibles -
{region}-{model}-mantle-{token-type}-standardpour lesbedrock-mantledemandes -
{region}-{model}-{token-type}-cross-region-globalpour les demandes interrégionales
| Type d'utilisation | Modèle | Niveau de service | Type de jeton | Routage |
|---|---|---|---|---|
USE1-openai.gpt-oss-120b-mantle-input-tokens-standard |
OpenAI gpt-oss-120b | Standard | Input | In-region |
USE1-gpt-oss-120b-output-tokens-priority |
OpenAI gpt-oss-120b | Priority | Output | In-region |
USE1-Nova2.0Lite-input-tokens-flex |
Amazon Nova 2 Lite | Flex | Input | In-region |
USE1-Claude4.6Sonnet-input-tokens |
Claude Sonnet 4.6 | Standard | Input | In-region |
USE1-Claude4.6Sonnet-cache-read-input-token-count |
Claude Sonnet 4.6 | Standard | Lecture du cache | In-region |
USE1-Claude4.6Sonnet-output-tokens-cross-region-global |
Claude Sonnet 4.6 | Standard | Output | Cross-region |
Étiquettes de répartition des coûts dans le CUR
Les balises de répartition des coûts issues des principaux IAM, des projets et des profils d'inférence d'applications apparaissent sous forme de colonnes dans le CUR avec le préfixe et. resourceTags/{key} iamPrincipal/{key} Par exemple, une balise avec une clé Team apparaît sous la formeresourceTags/Team.
| Méthode d'attribution | Comment les balises apparaissent dans le CUR |
|---|---|
| Balises principales IAM | Balises de l'utilisateur ou du rôle IAM à l'origine de la demande |
| Balises de session | Balises transmises lors de l'attribution d'un rôle ou de la fédération |
| Balises de projet | Tags attribués à un projet Amazon Bedrock |
| Balises de profil d'inférence d'applications | Balises attribuées à un profil d'inférence d'application |
Les balises doivent être activées en tant que balises de répartition des coûts dans la console AWS de facturation avant d'apparaître dans le CUR. Pour plus d'informations, consultez la section Activation des balises de répartition des coûts.
Points essentiels à savoir lors de la lecture de vos données CUR
Pour tirer le meilleur parti de vos données CUR et éviter toute confusion lors de l'analyse des coûts, gardez les points suivants à l'esprit.
-
Compte pour tous les types de jetons. Amazon Bedrock facture séparément les jetons d'entrée, de sortie, de lecture du cache et d'écriture du cache. Chacun a un prix unitaire différent. Si vous ne considérez que les jetons d'entrée et de sortie, votre analyse sous-estimera les coûts, en particulier pour les charges de travail qui utilisent fortement la mise en cache rapide.
-
Appliquez le taux approprié pour chaque type de routage. In-region et l'inférence entre régions ont des prix unitaires différents. Si vos charges de travail utilisent les deux, assurez-vous d'utiliser le taux correspondant pour chacune lors de l'analyse des coûts.
-
Activez les tags avant de les attendre dans le CUR. Les balises de répartition des coûts doivent être activées dans la console AWS de facturation avant d'apparaître dans CUR ou Cost Explorer. Après l'activation, attendez jusqu'à 24 heures pour que les balises commencent à se remplir.
-
Utilisez CUR 2.0 pour l'attribution principale IAM. Les données d'identité et de balise principales IAM nécessitent CUR 2.0 (AWS Data Exports). Si vous utilisez l'ancien format CUR, les champs principaux IAM ne seront pas disponibles. Per-token les ventilations des coûts sont disponibles dans les deux formats CUR. Pour des instructions de configuration détaillées, voir Utilisation du principal IAM pour la répartition des coûts.