Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Perfiles de inferencia de aplicaciones
Los perfiles de inferencia de aplicaciones (AIPs) le permiten atribuir los costos de Amazon Bedrock por aplicación, equipo o carga de trabajo para Amazon Bedrock InvokeModely Converse APIs en el punto final. bedrock-runtime Cada AIP es específica del modelo y contiene etiquetas de asignación de costos que fluyen a AWS Cost Explorer y a Cost and AWS Usage Reports (CUR 2.0).
Para las cargas de trabajo que utilizan respuestas y finalizaciones de chat en el punto final, utilícelas en su lugar. bedrock-mantle Proyectos
Cómo funciona la atribución de costes
El perfil de inferencia de una aplicación es un recurso que hace referencia a un modelo específico de Amazon Bedrock. Crea el perfil, adjunta etiquetas de asignación de costes y, a continuación, utiliza el ARN del perfil en lugar del ID del modelo en las llamadas a la API. Las etiquetas del perfil se adjuntan al registro de facturación de cada solicitud.
El siguiente ejemplo muestra cómo usar un ARN del perfil de inferencia de una aplicación en lugar de un ID de modelo al llamar a la API de Converse:
import boto3 client = boto3.client("bedrock-runtime") response = client.converse( modelId="arn:aws:bedrock:us-east-1:123456789012:inference-profile/my-team-profile", messages=[ {"role": "user", "content": [{"text": "Hello"}]} ] )
Para obtener más información sobre la creación de perfiles, consulte. Creación de un perfil de inferencia de aplicaciones
Ver los costos de los perfiles
Tras crear y etiquetar sus perfiles, active las etiquetas como etiquetas de asignación de costes en la consola AWS Billing and Cost Management:
-
Abra la consola AWS de Billing and Cost Management.
-
En el panel de navegación, seleccione Cost Allocation Tags (Etiquetas de asignación de costos).
-
Seleccione las etiquetas que aplicó a sus perfiles.
-
Seleccione Activar.
Las etiquetas pueden tardar hasta 24 horas en aparecer en Cost Explorer y CUR después de la activación. Las etiquetas de asignación de costes no son retroactivas. Solo se etiquetan los costes incurridos después de la activación. Para obtener más información, consulte Activación de etiquetas de asignación de costes definidas por el usuario.
Tras la activación de la etiqueta, puede analizar los costes de Amazon Bedrock por perfil de inferencia de la aplicación en las siguientes herramientas:
-
AWS Cost Explorer: filtre por etiquetas de perfil para ver las tendencias de costos a lo largo del tiempo. Agrupe por etiqueta para comparar los costos de los distintos perfiles.
-
AWS Informes de costo y uso (CUR 2.0): consulte los datos de CUR para obtener un desglose de los costos de las partidas por etiqueta de perfil.
Consideraciones de escalado
El perfil de inferencia de cada aplicación está vinculado a un modelo específico. Esto significa que necesita un perfil independiente para cada combinación única de modelo, equipo y conjunto de etiquetas. A medida que las organizaciones crecen, el número de perfiles puede aumentar rápidamente, especialmente cuando las nuevas versiones de los modelos requieren nuevos perfiles.
Para reducir la proliferación de perfiles:
-
Recomendado: utilícelo Proyectos para mayor flexibilidad y facilidad a la hora de realizar el seguimiento de los costes.
-
Etiquete a nivel de equipo o centro de costos en lugar de por usuario.
-
Para la atribución de costes por usuario sin crear perfiles adicionales, utilice. Atribución principal de IAM El seguimiento principal de IAM funciona junto con los perfiles de inferencia de las aplicaciones y atribuye automáticamente los costes a nivel de identidad.