Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Creare un profilo di inferenza dell’applicazione
È possibile creare un profilo di inferenza dell’applicazione con una o più Regioni per tenere traccia dell’utilizzo e dei costi quando si invoca un modello.
-
Per creare un profilo di inferenza dell’applicazione per una Regione, è necessario specificare un modello di fondazione. Vengono monitorati l’utilizzo e i costi per le richieste effettuate alla Regione indicata con il modello specifico.
-
Per creare un profilo di inferenza dell’applicazione per più Regioni, specificare un profilo di inferenza tra Regioni (definito dal sistema). Il profilo di inferenza indirizzerà le richieste alle Regioni definite nel profilo di inferenza tra Regioni (definito dal sistema) scelto. Vengono monitorati l’utilizzo e i costi per le richieste effettuate alle Regioni nel profilo di inferenza.
Attualmente, è possibile creare un profilo di inferenza solo utilizzando l’API Amazon Bedrock.
Per creare un profilo di inferenza, invia una CreateInferenceProfilerichiesta con un endpoint del piano di controllo Amazon Bedrock.
I seguenti campi sono obbligatori:
| Campo | Caso d’uso |
|---|---|
| inferenceProfileName | Specificare un nome per il profilo di inferenza. |
| modelSource | Specificare il modello di fondazione o il profilo di inferenza tra Regioni (definito dal sistema) che definisca il modello e le Regioni per cui si desidera tenere traccia dei costi e dell’utilizzo. |
I seguenti campi sono facoltativi:
| Campo | Caso d’uso |
|---|---|
| description | Fornire una descrizione per il profilo di inferenza. |
| tag | Collegare tag al profilo di inferenza. Per ulteriori informazioni, consulta Organizzazione Assegnazione di tag alle risorse Amazon Bedrock e monitoraggio dei costi utilizzando AWS i tag di allocazione dei costi. |
| clientRequestToken | Garantire che la richiesta API venga completata solo una volta. Per ulteriori informazioni, consulta Garanzia di idempotenza. |
La risposta restituisce un elemento inferenceProfileArn che può essere utilizzato in altre azioni relative al profilo di inferenza e con l’invocazione del modello e le risorse Amazon Bedrock.