Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Cómo entender los datos del informe de costos y uso de Amazon Bedrock
AWS Los informes de costos y uso de Data Exports (CUR 2.0) son la forma AWS recomendada de recibir los datos detallados de costos y uso. CUR 2.0 proporciona detalles de los artículos de línea para cada solicitud de inferencia de Amazon Bedrock. Cada solicitud genera partidas independientes para cada tipo de token, con distintos tipos de uso y precios unitarios. En esta página se explica cómo leer las entradas de Amazon Bedrock en CUR y cómo conciliarlas con tu gasto real. Para obtener más información sobre AWS CUR 2.0, consulte AWS la documentación de exportación de datos.
Descripción de los precios de Amazon Bedrock en CUR
Los precios de Amazon Bedrock en CUR se determinan en función de tres factores: el tipo de token, el nivel de servicio y si la solicitud se envió mediante inferencia entre regiones. Entender cada uno de ellos es fundamental para conciliar los costes de forma precisa.
Tipos de token
Los cargos de Amazon Bedrock se desglosan en cuatro tipos de fichas. Cada uno tiene un precio unitario diferente.
| Tipo de token | Patrón de tipo de uso de CUR | Description (Descripción) |
|---|---|---|
| Tokens de entrada | *-input-tokens o *-mantle-input-tokens-* |
Los tokens se enviaron en el mensaje de solicitud |
| Tokens de salida | *-output-tokens o *-mantle-output-tokens-* |
Tokens generados en la respuesta |
| Guarda en caché los tokens de lectura | *-cache-read-input-token-count |
Los tokens se leen desde la caché de solicitudes (significativamente más baratos que los de entrada) |
| Guarda en caché los tokens de escritura | *-cache-write-input-token-count |
Los tokens se escriben en la caché de solicitudes (más caros que los de entrada) |
importante
Al conciliar el uso con el gasto, se deben tener en cuenta los cuatro tipos de fichas. Si solo sumas los tokens de entrada y salida, tus totales no coincidirán con los de tu factura. Esta es la fuente más común de brechas en la conciliación, especialmente en el caso de las cargas de trabajo que utilizan mucho el almacenamiento rápido en caché.
Niveles de servicio
Amazon Bedrock admite diferentes niveles de servicio que afectan a los precios y la disponibilidad. El nivel de servicio de una solicitud se refleja en el tipo de uso de CUR. Al conciliar los costos, asegúrese de aplicar el precio unitario correcto para el nivel de servicio asociado a cada artículo de línea.
Para obtener más información sobre los niveles de servicio y cómo afectan a los precios de inferencia, consulte. Niveles de servicio para optimizar el rendimiento y los costes
Ejemplos de tipos de uso de CUR
El line_item_usage_type campo identifica el modelo, el tipo de token, el nivel de servicio y si la solicitud utilizó la inferencia entre regiones. El formato varía según el punto final:
-
{region}-{model}-{token-type}para solicitudesbedrock-runtimede nivel estándar -
{region}-{model}-{token-type}-{tier}para solicitudes de nivelbedrock-runtimeprioritario o flexible -
{region}-{model}-mantle-{token-type}-standardparabedrock-mantlesolicitudes -
{region}-{model}-{token-type}-cross-region-globalpara solicitudes interregionales
| Tipo de uso | Modelo | Nivel de servicio | Tipo de token | Enrutamiento |
|---|---|---|---|---|
USE1-openai.gpt-oss-120b-mantle-input-tokens-standard |
OpenAI gpt-oss-120b | Standard | Input | In-region |
USE1-gpt-oss-120b-output-tokens-priority |
OpenAI gpt-oss-120b | Priority (Prioridad) | Output | In-region |
USE1-Nova2.0Lite-input-tokens-flex |
Amazon Nova 2 Lite | Flexionar | Input | In-region |
USE1-Claude4.6Sonnet-input-tokens |
Claude Sonnet 4.6 | Standard | Input | In-region |
USE1-Claude4.6Sonnet-cache-read-input-token-count |
Soneto de Claude 4.6 | Standard | Lectura en caché | In-region |
USE1-Claude4.6Sonnet-output-tokens-cross-region-global |
Claude Sonnet 4.6 | Standard | Output | Cross-region |
Etiquetas de asignación de costes en CUR
Las etiquetas de asignación de costes de los principales, proyectos y perfiles de inferencia de aplicaciones de IAM aparecen como columnas en CUR con el prefijo y. resourceTags/{key} iamPrincipal/{key} Por ejemplo, una etiqueta con clave aparece como. Team resourceTags/Team
| Método de atribución | Cómo aparecen las etiquetas en CUR |
|---|---|
| Etiquetas principales de IAM | Etiquetas del usuario o rol de IAM que realiza la solicitud |
| Etiquetas de sesión | Etiquetas transferidas durante la asunción del rol o la federación |
| Etiquetas de proyecto | Etiquetas asignadas a un proyecto de Amazon Bedrock |
| Etiquetas de perfil de inferencia de aplicaciones | Etiquetas asignadas a un perfil de inferencia de una aplicación |
Las etiquetas deben activarse como etiquetas de asignación de costes en la consola AWS de facturación antes de que aparezcan en CUR. Para obtener más información, consulte Activar las etiquetas de asignación de costes.
Aspectos clave que debe saber al leer los datos de CUR
Para aprovechar al máximo los datos de CUR y evitar confusiones al analizar los costes, tenga en cuenta lo siguiente.
-
Tenga en cuenta todos los tipos de fichas. Amazon Bedrock cobra por separado los tokens de entrada, salida, lectura y escritura en caché. Cada uno tiene un precio unitario diferente. Si nos fijamos únicamente en los indicadores de entrada y salida, el análisis infravalorará los costes, especialmente en el caso de las cargas de trabajo que utilizan mucho el almacenamiento rápido en caché.
-
Aplica la tarifa correcta para cada tipo de enrutamiento. In-region y la inferencia entre regiones tienen precios unitarios diferentes. Si sus cargas de trabajo utilizan ambos, asegúrese de utilizar la tasa de coincidencia para cada uno al analizar los costos.
-
Active las etiquetas antes de que aparezcan en CUR. Las etiquetas de asignación de costos deben estar activadas en la consola de AWS facturación antes de que aparezcan en CUR o Cost Explorer. Tras la activación, espere hasta 24 horas para que las etiquetas comiencen a rellenarse.
-
Utilice CUR 2.0 para la atribución principal de IAM. La identidad principal y los datos de etiquetas de IAM requieren CUR 2.0 (exportación de datos).AWS Si utiliza el formato CUR anterior, los campos principales de IAM no estarán disponibles. Per-token los desgloses de costes están disponibles en ambos formatos CUR. Para obtener instrucciones de configuración detalladas, consulte Uso del principal de IAM para la asignación de costes.