Creare un profilo di inferenza dell’applicazione

È possibile creare un profilo di inferenza dell’applicazione con una o più Regioni per tenere traccia dell’utilizzo e dei costi quando si invoca un modello.

Per creare un profilo di inferenza dell’applicazione per una Regione, è necessario specificare un modello di fondazione. Vengono monitorati l’utilizzo e i costi per le richieste effettuate alla Regione indicata con il modello specifico.
Per creare un profilo di inferenza dell’applicazione per più Regioni, specificare un profilo di inferenza tra Regioni (definito dal sistema). Il profilo di inferenza indirizzerà le richieste alle Regioni definite nel profilo di inferenza tra Regioni (definito dal sistema) scelto. Vengono monitorati l’utilizzo e i costi per le richieste effettuate alle Regioni nel profilo di inferenza.

Puoi creare un profilo di inferenza dell'applicazione utilizzando la console Amazon Bedrock o l'API Amazon Bedrock.

Per creare un profilo di inferenza utilizzando l'API, invia una CreateInferenceProfilerichiesta con un endpoint del piano di controllo Amazon Bedrock.

I seguenti campi sono obbligatori:

Campo	Caso d’uso
inferenza ProfileName	Specificare un nome per il profilo di inferenza.
modelSource	Specificare il modello di fondazione o il profilo di inferenza tra Regioni (definito dal sistema) che definisca il modello e le Regioni per cui si desidera tenere traccia dei costi e dell’utilizzo.

I seguenti campi sono facoltativi:

Campo	Caso d’uso
description	Fornire una descrizione per il profilo di inferenza.
tag	Collegare tag al profilo di inferenza. Per ulteriori informazioni, vedere Organizzazione Assegnazione di tag alle risorse Amazon Bedrock e monitoraggio dei costi utilizzando i tag di allocazione AWS dei costi.
cliente RequestToken	Per garantire che la richiesta API venga completata solo una volta. Per ulteriori informazioni, consulta Garanzia di idempotenza.

La risposta restituisce un elemento inferenceProfileArn che può essere utilizzato in altre azioni relative al profilo di inferenza e con l’invocazione del modello e le risorse Amazon Bedrock.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Prerequisiti

Modificare i tag per un profilo di inferenza dell’applicazione