Prerequisiti per i profili di inferenza

Prima di utilizzare un profilo di inferenza, verifica di soddisfare i seguenti prerequisiti:

Il tuo ruolo ha accesso alle azioni dell’API del profilo di inferenza. Se al tuo ruolo è AmazonBedrockFullAccess AWS allegata la policy gestita, puoi saltare questo passaggio. In caso contrario, eseguire le seguenti operazioni:

Segui i passaggi descritti in Creazione di policy IAM e crea la policy seguente, che consente a un ruolo di eseguire azioni relative al profilo di inferenza e di eseguire l’inferenza del modello utilizzando tutti i modelli di fondazione e tutti i profili di inferenza.

(Facoltativo) Puoi limitare l’accesso del ruolo nei modi seguenti:

Per limitare le azioni API che il ruolo può eseguire, modifica l’elenco nel campo Action in modo che contenga solo le operazioni API a cui desideri consentire l’accesso.
Per limitare l'accesso del ruolo a profili di inferenza specifici, modifica l'Resourceelenco in modo che contenga solo i profili di inferenza e i modelli di base a cui desideri consentire l'accesso. System-defined i profili di inferenza iniziano con inference-profile e i profili di inferenza delle applicazioni iniziano con. application-inference-profile

Importante
Quando si specifica un profilo di inferenza nel campo Resource della prima istruzione, è necessario specificare anche il modello di fondazione in ogni Regione associata.
Per limitare l’accesso degli utenti in modo che possano invocare un modello di fondazione solo tramite un profilo di inferenza, aggiungi un campo Condition e usa la chiave di condizione aws:InferenceProfileArn. Specifica il profilo di inferenza in base al quale filtrare l’accesso. Questa condizione può essere inclusa in un’istruzione che si riferisce alle risorse foundation-model.

Ad esempio, puoi allegare la seguente politica a un ruolo per consentirgli di richiamare il Anthropic Claude 3 Haiku modello solo tramite il profilo di Anthropic Claude 3 Haiku inferenza statunitense nell'account in 111122223333 us-west-2:

Ad esempio, è possibile collegare la policy seguente a un ruolo per consentirgli di invocare il modello Anthropic Claude Sonnet 4 solo tramite il profilo di inferenza Claude Sonnet 4 globale nell’account 111122223333 in us-east-2, Stati Uniti orientali (Ohio).

È inoltre possibile limitare l’uso del profilo di inferenza Claude Sonnet 4 globale aggiungendo un’opzione Deny esplicita con una condizione StringEquals che verifichi che il valore della chiave di contesto della richiesta aws:RequestedRegion sia “unspecified”. Poiché il valore corrispondeStringEquals, l’opzione sovrascrive qualsiasi opzione Allow e blocca il routing globale delle richieste di inferenza.
```
{
    "Effect": "Deny",
    "Action": [
        "bedrock:InvokeModel*"
    ],
    "Resource": "*",
    "Condition": {
        "StringEquals": {
            "aws:RequestedRegion": "unspecified"
        }
    }
},

                                    
                                
```

Segui i passaggi indicati in Aggiunta e rimozione delle autorizzazioni di identità IAM per collegare la policy a un ruolo e concedere al ruolo le autorizzazioni per visualizzare e utilizzare tutti i profili di inferenza.

Hai richiesto l’accesso al modello definito nel profilo di inferenza che desideri utilizzare nella Regione da cui desideri chiamare il profilo di inferenza stesso.

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Regioni e modelli supportati

Creare un profilo di inferenza dell’applicazione

Prerequisiti per i profili di inferenza

Importante