

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

# Profils d’inférence d’applications
<a name="cost-mgmt-application-inference-profiles"></a>

Les profils d'inférence d'application (AIPs) vous permettent d'attribuer les coûts Amazon Bedrock par application, équipe ou charge de travail pour Amazon Bedrock [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)et [Converse](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) APIs sur le terminal. `bedrock-runtime` Chaque AIP est spécifique au modèle et comporte des balises de répartition des coûts qui sont transmises à AWS Cost Explorer et aux rapports sur les AWS coûts et l'utilisation (CUR 2.0).

Pour les charges de travail utilisant des réponses et des terminaisons de chat sur le `bedrock-mantle` terminal, utilisez [Projets](cost-mgmt-projects.md) plutôt.

## Comment fonctionne l'attribution des coûts
<a name="cost-mgmt-aip-how-it-works"></a>

Un profil d'inférence d'application est une ressource qui fait référence à un modèle Amazon Bedrock spécifique. Vous créez le profil, vous attachez des balises de répartition des coûts, puis vous utilisez l'ARN du profil à la place de l'ID du modèle dans vos appels d'API. Les tags du profil sont joints au dossier de facturation pour chaque demande.

L'exemple suivant montre comment utiliser l'ARN d'un profil d'inférence d'application au lieu d'un ID de modèle lors de l'appel de l'API Converse :

```
import boto3

client = boto3.client("bedrock-runtime")

response = client.converse(
    modelId="arn:aws:bedrock:us-east-1:123456789012:inference-profile/my-team-profile",
    messages=[
        {"role": "user", "content": [{"text": "Hello"}]}
    ]
)
```

Pour plus d'informations sur la création de profils, consultez[Création d’un profil d’inférence d’application](inference-profiles-create.md).

## Coûts de consultation du profil
<a name="cost-mgmt-aip-viewing-costs"></a>

Après avoir créé et étiqueté vos profils, activez les balises en tant que balises de répartition des coûts dans la console AWS Billing and Cost Management :

1. Ouvrez la console AWS Billing and Cost Management.

1. Dans le volet de navigation, choisissez **Cost allocation tags** (Balises de répartition des coûts).

1. Sélectionnez les tags que vous avez appliqués à vos profils.

1. Choisissez **Activer**.

Les balises peuvent prendre jusqu'à 24 heures pour apparaître dans Cost Explorer et CUR après leur activation. Les étiquettes de répartition des coûts ne sont pas rétroactives. Seuls les frais engagés après l'activation sont étiquetés. Pour plus d'informations, consultez la section [Activation des balises de répartition des coûts définies par](https://docs.aws.amazon.com/awsaccountbilling/latest/aboutv2/activating-tags.html) l'utilisateur.

Après l'activation du tag, vous pouvez analyser les coûts d'Amazon Bedrock par profil d'inférence de l'application dans les outils suivants :
+ **AWS Cost Explorer** : filtrez par balises de profil pour visualiser les tendances des coûts au fil du temps. Regroupez par tag pour comparer les coûts entre les profils.
+ **AWS Rapports sur les coûts et l'utilisation (CUR 2.0)** : interrogez les données CUR pour obtenir la ventilation des coûts par article par balise de profil.

## Considérations relatives à la mise à l'échelle
<a name="cost-mgmt-aip-scaling"></a>

Chaque profil d'inférence d'application est lié à un modèle spécifique. Cela signifie que vous avez besoin d'un profil distinct pour chaque combinaison unique de modèle, d'équipe et de tag. À mesure que les entreprises se développent, le nombre de profils peut augmenter rapidement, en particulier lorsque les nouvelles versions du modèle nécessitent de nouveaux profils.

Pour réduire la prolifération des profils :
+ **Recommandé :** à utiliser [Projets](cost-mgmt-projects.md) pour plus de flexibilité et de facilité lors du suivi des coûts.
+ Marquez au niveau de l'équipe ou du centre de coûts plutôt que par utilisateur.
+ Pour l'attribution des coûts par utilisateur sans créer de profils supplémentaires, utilisez[Attribution principale de l'IAM](cost-mgmt-iam-principal-tracking.md). Le suivi principal IAM fonctionne parallèlement aux profils d'inférence des applications et attribue automatiquement les coûts au niveau de l'identité.