

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Aumentare il throughput con l’inferenza tra Regioni
<a name="cross-region-inference"></a>

L’inferenza tra Regioni consente di scegliere un profilo di inferenza tra Regioni legato a un’area geografica specifica (come Stati Uniti o UE) oppure un profilo di inferenza globale. Quando scegli un profilo di inferenza legato a un'area geografica specifica, Amazon Bedrock seleziona automaticamente la pubblicità ottimale Regione AWS all'interno di tale area geografica per elaborare la tua richiesta di inferenza. Con i profili di inferenza globali, Amazon Bedrock seleziona automaticamente la Regione AWS commerciale migliore per elaborare la richiesta, ottimizzando le risorse disponibili e aumentando il throughput del modello.

Entrambi i tipi di inferenza interregionale funzionano attraverso [profili](inference-profiles.md) di inferenza, che definiscono un modello di base (FM) e il quale le richieste possono essere indirizzate. Regioni AWS Quando si esegui l’inferenza del modello in modalità on demand, le richieste potrebbero essere limitate dalle quote di servizio o durante i periodi di picco di utilizzo. L'inferenza interregionale consente di gestire senza problemi i picchi di traffico non pianificati utilizzando l'elaborazione tra diversi sistemi. Regioni AWS

Per aumentare il throughput per un modello, è possibile acquistare [Throughput allocato](prov-throughput.md). I profili di inferenza attualmente non supportano throughput allocato.

Per visualizzare le Regioni e i modelli con cui è possibile utilizzare i profili di inferenza per eseguire l’inferenza tra Regioni, consulta [Regioni e modelli supportati per i profili di inferenza](inference-profiles-support.md).

**Topics**
+ [Scelta tra inferenza geografica e globale tra regioni](#cross-region-inference-comparison)
+ [Considerazioni generali](#cross-region-inference-general-considerations)
+ [Inferenza geografica interregionale](geographic-cross-region-inference.md)
+ [Inferenza globale tra regioni](global-cross-region-inference.md)

## Scelta tra inferenza geografica e globale tra regioni
<a name="cross-region-inference-comparison"></a>

Amazon Bedrock offre due tipi di profili di inferenza interregionali, ciascuno progettato per diversi casi d'uso e requisiti di conformità:


| Funzionalità | Inferenza geografica tra regioni | Inferenza globale tra regioni | Raccomandazione | 
| --- | --- | --- | --- | 
| Residenza dei dati | Entro i confini geografici (Stati Uniti, UE, APAC, ecc.) | Qualsiasi regione AWS commerciale supportata in tutto il mondo | Scegli Geographic per i requisiti di conformità | 
| Throughput | Superiore a quello di una singola regione | Il più alto disponibile | Scegli Global per le massime prestazioni | 
| Costo | Prezzi standard | Risparmio di circa il 10% | Scegli Global per l'ottimizzazione dei costi | 
| Requisiti SCP | Consenti tutte le regioni di destinazione nel profilo | Consenti "aws:RequestedRegion": "unspecified" | Configura in base alle tue politiche organizzative | 
| Ideale per | Organizzazioni con normative sulla residenza dei dati | Organizzazioni che danno priorità a costi e prestazioni | Valuta le tue esigenze di conformità e prestazioni | 

Scegli l'inferenza geografica tra regioni quando hai requisiti di residenza dei dati e devi garantire che l'elaborazione dei dati rimanga entro limiti geografici specifici. Scegli l'inferenza globale tra regioni se desideri la massima produttività e risparmi sui costi senza restrizioni geografiche.

## Considerazioni generali
<a name="cross-region-inference-general-considerations"></a>

Tieni in considerazione i seguenti concetti chiave durante l’inferenza tra Regioni:
+ L’utilizzo dell’inferenza tra Regioni non prevede costi aggiuntivi. Il prezzo viene calcolato in base alla Regione da cui si chiama il profilo. Per informazioni sui prezzi, consulta [Prezzi di Amazon Bedrock](https://aws.amazon.com/bedrock/pricing/).
+ L'inferenza interregionale può indirizzare richieste Regioni AWS che non sono abilitate manualmente nel tuo. Account AWS L'abilitazione manuale delle regioni non è necessaria per il funzionamento dell'inferenza tra regioni.
+ Tutti i dati trasmessi durante le operazioni interregionali rimangono sulla AWS rete e non attraversano la rete Internet pubblica. I dati vengono crittografati durante il transito tra. Regioni AWS
+ Tutte le richieste di inferenza tra regioni vengono registrate CloudTrail nella regione di origine. Cerca il `additionalEventData.inferenceRegion` campo per identificare dove sono state elaborate le richieste.
+ AWS Anche i servizi forniti da Amazon Bedrock possono utilizzare CRIS. Per ulteriori informazioni, consulta la documentazione per il servizio specifico.

# Inferenza geografica interregionale
<a name="geographic-cross-region-inference"></a>

L'inferenza geografica interregionale mantiene l'elaborazione dei dati entro limiti geografici specifici (Stati Uniti, UE, APAC, ecc.), fornendo al contempo un throughput più elevato rispetto all'inferenza a regione singola. Questa opzione è ideale per le organizzazioni con requisiti di residenza dei dati e normative di conformità.

## Considerazioni sull'inferenza geografica interregionale
<a name="geographic-cris-considerations"></a>

Tieni presente le seguenti informazioni sull'inferenza geografica tra regioni:
+ Le richieste di inferenza interregionale relative a un profilo di inferenza legato a un'area geografica (ad esempio Stati Uniti, UE e APAC) vengono conservate all'interno della parte geografica in Regioni AWS cui risiedono originariamente i dati. Ad esempio, una richiesta effettuata negli Stati Uniti viene conservata negli Stati Uniti. Regioni AWS Sebbene i dati rimangano archiviati solo nella Regione di origine, durante l’inferenza tra Regioni i prompt di input e i risultati di output potrebbero spostarsi al di fuori della Regione di origine. Tutti i dati verranno trasmessi crittografati attraverso la rete sicura di Amazon.
+ Per visualizzare le quote predefinite per il throughput tra Regioni quando si utilizzano profili di inferenza legati a un’area geografica (ad esempio Stati Uniti, UE e APAC), consulta i valori in **Richieste di inferenza del modello tra Regioni al minuto per \$1\$1Model\$1** e **Token di inferenza del modello tra Regioni al minuto per \$1\$1Model\$1** in [Quote di servizio di Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock) in *Riferimenti generali AWS *.

## Requisiti delle policy IAM per l'inferenza geografica tra regioni
<a name="geographic-cris-iam-setup"></a>

Per consentire a un utente o un ruolo IAM di richiamare un profilo di inferenza geografico interregionale, devi consentire l'accesso alle seguenti risorse:

1. Il profilo di inferenza interregionale specifico per ogni area geografica (questi profili hanno prefissi geografici come,,) `us` `eu` `apac`

1. Il modello di base nella regione di origine

1. Il modello di base in tutte le regioni di destinazione elencate nel profilo geografico

La seguente politica di esempio concede le autorizzazioni necessarie per utilizzare il modello di base Claude Sonnet 4.5 con un profilo di inferenza geografica interregionale per gli Stati Uniti, dove si trova la regione di origine e le regioni di destinazione, `us-east-1` e: `us-east-1` `us-east-2` `us-west-2`

```
{
    "Version": "2012-10-17"		 	 	 ,
    "Statement": [
        {
            "Sid": "GrantGeoCrisInferenceProfileAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0"
            ]
        },
        {
            "Sid": "GrantGeoCrisModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:us-east-1::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
                "arn:aws:bedrock:us-east-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0",
                "arn:aws:bedrock:us-west-2::foundation-model/anthropic.claude-sonnet-4-5-20250929-v1:0"
            ],
            "Condition": {
                "StringEquals": {
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:us-east-1:<ACCOUNT_ID>:inference-profile/us.anthropic.claude-sonnet-4-5-20250929-v1:0"
                }
            }
        }
    ]
}
```

La prima istruzione concede all'`bedrock:InvokeModel`API l'accesso al profilo di inferenza geografica interregionale per le richieste provenienti dalla regione richiedente. La seconda istruzione concede all'`bedrock:InvokeModel`API l'accesso al modello di base sia nella regione richiedente che in tutte le regioni di destinazione elencate nel profilo di inferenza.

## Requisiti della policy di controllo dei servizi per l'inferenza geografica tra regioni
<a name="geographic-cris-scp-setup"></a>

Molte organizzazioni implementano controlli di accesso regionali tramite Service Control Policies in AWS Organizations for security and compliance. Se la politica di sicurezza dell'organizzazione prevede il blocco delle regioni non utilizzate, è necessario assicurarsi che le condizioni SCP specifiche della regione consentano l'accesso a tutte le regioni di destinazione elencate nel profilo di inferenza geografica interregionale per la regione di origine. SCPs 

Per l'inferenza geografica interregionale, devi comprendere la relazione tra la tua regione di origine (dove effettui la chiamata API) e le regioni di destinazione (dove possono essere instradate le richieste). Consulta la documentazione del profilo di inferenza per identificare tutte le regioni di destinazione per la regione di origine, quindi assicurati di SCPs consentire l'accesso a tutte quelle regioni di destinazione.

Ad esempio, se chiami da us-east-1 (regione di origine) utilizzando il profilo geografico US Anthropic Claude Sonnet 4.5, le richieste possono essere indirizzate a us-east-1, us-east-2 e us-west-2 (regioni di destinazione). Se un SCP limita l'accesso solo a us-east-1, l'inferenza tra regioni fallirà quando si tenta di effettuare il routing verso us-east-2 o us-west-2. Pertanto, è necessario consentire l'accesso a tutte e tre le regioni di destinazione nel proprio SCP, indipendentemente dalla regione da cui si sta chiamando.

Quando SCPs configuri l'esclusione tra regioni, ricorda che il blocco di qualsiasi regione di destinazione nel profilo di inferenza impedirà il corretto funzionamento dell'inferenza tra regioni, anche se la regione di origine rimane accessibile. Per i requisiti SCP per l'inferenza globale tra regioni, vedi. [Requisiti della politica di controllo dei servizi per l'inferenza globale tra regioni](global-cross-region-inference.md#global-cris-scp-setup)

Per migliorare la sicurezza, prendi in considerazione l'utilizzo della `bedrock:InferenceProfileArn` condizione per limitare l'accesso a profili di inferenza specifici. Ciò consente di concedere l'accesso alle regioni richieste limitando al contempo i profili di inferenza che è possibile utilizzare.

## Usa l'inferenza geografica tra regioni
<a name="geographic-cris-usage"></a>

Per utilizzare l'inferenza geografica interregionale, è necessario includere un [profilo di inferenza quando si esegue l'inferenza del](inference-profiles.md) modello nei seguenti modi:
+ **Inferenza del modello su richiesta**[: specifica l'ID del profilo di inferenza da utilizzare `modelId` quando si invia una,, Converse o una [InvokeModel](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModel.html)richiesta. [InvokeModelWithResponseStream[ConverseStream](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_ConverseStream.html)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_InvokeModelWithResponseStream.html)](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_runtime_Converse.html) Un profilo di inferenza definisce una o più Regioni verso le quali può instradare le richieste di inferenza provenienti dalla Regione di origine. L’uso dell’inferenza tra Regioni aumenta il throughput e le prestazioni instradando dinamicamente le richieste di invocazione del modello tra le Regioni definite nel profilo di inferenza. Fattori di routing nel traffico degli utenti, nella domanda e nell’utilizzo delle risorse. Per ulteriori informazioni, consulta [Invio di prompt e generazione di risposte con l’inferenza del modello](inference.md)
+ **Inferenza in batch**: invia le richieste in modo asincrono con inferenza batch specificando l'ID del profilo di inferenza come quando si invia una richiesta. `modelId` [CreateModelInvocationJob](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_CreateModelInvocationJob.html) L’uso di un profilo di inferenza consente di utilizzare il calcolo su più Regioni AWS e di ottenere tempi di elaborazione più rapidi per i processi batch. Al termine del processo, puoi recuperare i file di output dal bucket Amazon S3 nella Regione di origine.
+ **Agenti**: specifica l’ID del profilo di inferenza nel campo `foundationModel` di una richiesta [https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateAgent.html](https://docs.aws.amazon.com/bedrock/latest/APIReference/API_agent_CreateAgent.html). Per ulteriori informazioni, consulta [Creazione e configurazione manuale dell’agente](agents-create.md).
+ **Generazione di risposte della knowledge base**: è possibile utilizzare l’inferenza tra Regioni per generare una risposta dopo aver eseguito una query su una knowledge base. Per ulteriori informazioni, consulta [Test della knowledge base con query e risposte](knowledge-base-test.md).
+ **Valutazione del modello**: è possibile inviare un profilo di inferenza come modello da valutare quando si invia un processo di valutazione del modello. Per ulteriori informazioni, consulta [Valutare le prestazioni delle risorse Amazon Bedrock](evaluation.md).
+ **Gestione prompt**: è possibile utilizzare un profilo di inferenza per generare una risposta a un prompt creato in Gestione prompt. Per ulteriori informazioni, consulta [Creare e archiviare prompt riutilizzabili con Gestione dei prompt in Amazon Bedrock](prompt-management.md).
+ **Flussi di prompt**: è possibile utilizzare un profilo di inferenza quando si genera una risposta per un prompt definito in linea in un nodo prompt in un flusso di prompt. Per ulteriori informazioni, consulta [Crea un flusso di lavoro AI end-to-end generativo con Amazon Bedrock Flows](flows.md).

Per informazioni su come utilizzare un profilo di inferenza per inviare richieste di invocazione del modello tra Regioni, consulta [Utilizzare un profilo di inferenza nell’invocazione del modello](inference-profiles-use.md).

Per ulteriori informazioni sull’inferenza tra Regioni, consulta [Introduzione all’inferenza tra Regioni in Amazon Bedrock](https://aws.amazon.com/blogs/machine-learning/getting-started-with-cross-region-inference-in-amazon-bedrock/).

Per informazioni dettagliate sull'inferenza globale tra regioni, inclusa la configurazione IAM e la gestione delle quote di servizio, vedere. [Inferenza globale tra regioni](global-cross-region-inference.md)

# Inferenza globale tra regioni
<a name="global-cross-region-inference"></a>

L'inferenza globale tra regioni estende l'inferenza interregionale oltre i confini geografici, abilitando l'instradamento delle richieste di inferenza verso le aziende commerciali supportate in tutto il Regioni AWS mondo, ottimizzando le risorse disponibili e garantendo una maggiore produttività del modello.

## Vantaggi dell'inferenza globale tra regioni
<a name="global-cris-benefits"></a>

L'inferenza globale interregionale per Claude Sonnet 4.5 di Anthropic offre molteplici vantaggi rispetto ai tradizionali profili di inferenza geografica interregionale:
+ **Produttività migliorata durante i picchi di domanda**: l'inferenza globale tra regioni offre una maggiore resilienza durante i periodi di picco della domanda indirizzando automaticamente le richieste verso la capacità disponibile. Regioni AWS Questo routing dinamico avviene senza problemi senza configurazioni o interventi aggiuntivi da parte degli sviluppatori. A differenza degli approcci tradizionali che potrebbero richiedere un complesso bilanciamento del carico sul lato client Regioni AWS, l'inferenza globale interregionale gestisce automaticamente i picchi di traffico. Ciò è particolarmente importante per le applicazioni aziendali critiche in cui i tempi di inattività o il peggioramento delle prestazioni possono avere impatti finanziari o reputazionali significativi.
+ **Efficienza in termini di costi: l'**inferenza globale interregionale per Claude Sonnet 4.5 di Anthropic offre un risparmio di circa il 10% sui prezzi dei token di input e output rispetto all'inferenza geografica interregionale. Il prezzo viene calcolato in base alla fonte Regione AWS da cui viene effettuata la richiesta (fonte). Regione AWS Ciò significa che le organizzazioni possono trarre vantaggio da una maggiore resilienza con costi ancora inferiori. Questo modello di prezzo rende l'inferenza globale interregionale una soluzione conveniente per le organizzazioni che desiderano ottimizzare le proprie implementazioni di intelligenza artificiale generativa. Migliorando l'utilizzo delle risorse e permettendo un throughput più elevato senza costi aggiuntivi, aiuta le organizzazioni a massimizzare il valore del loro investimento in Amazon Bedrock.
+ **Monitoraggio semplificato**: quando si utilizza l'inferenza globale tra regioni, si CloudTrail continua a registrare le voci di registro nella fonte, semplificando l'osservabilità CloudWatch e la gestione. Regione AWS Anche se le vostre richieste vengono elaborate in tutto Regioni AWS il mondo, mantenete una visione centralizzata delle prestazioni e dei modelli di utilizzo dell'applicazione attraverso i vostri strumenti di monitoraggio familiari. AWS 
+ **Flessibilità delle quote su richiesta**: con l'inferenza globale tra regioni, i carichi di lavoro non sono più limitati dalla capacità regionale individuale. Invece di limitarsi alla capacità disponibile in uno specifico ambito Regione AWS, le richieste possono essere instradate dinamicamente attraverso l'infrastruttura globale. AWS Ciò fornisce l'accesso a un pool di risorse molto più ampio, rendendo meno complicata la gestione di carichi di lavoro ad alto volume e picchi di traffico improvvisi.

## Considerazioni sull'inferenza globale tra regioni
<a name="global-cris-considerations"></a>

Notate le seguenti informazioni sull'inferenza globale tra regioni:
+ I profili di inferenza globali tra Regioni offrono un throughput più elevato rispetto a un profilo di inferenza legato a una particolare area geografica. Un profilo di inferenza legato a una particolare area geografica offrono un throughput più elevato rispetto a un’inferenza a Regione singola.
+ Per visualizzare le quote predefinite per il throughput tra Regioni quando si utilizzano profili di inferenza globali, consulta i valori in **Richieste di inferenza del modello tra Regioni al minuto per \$1\$1Model\$1** e **Token di inferenza del modello tra Regioni al minuto per \$1\$1Model\$1** in [Quote di servizio di Amazon Bedrock](https://docs.aws.amazon.com/general/latest/gr/bedrock.html#limits_bedrock) in *Riferimenti generali AWS *.

  **È possibile richiedere, visualizzare e gestire le quote per il Global Cross-Region Inference Profile dalla console [Service Quotas o](https://console.aws.amazon.com/servicequotas/home/services/bedrock/quotas) utilizzando i comandi AWS CLI nella regione di origine.**

## Requisiti delle policy IAM per l'inferenza globale tra regioni
<a name="global-cris-iam-setup"></a>

Per abilitare l'inferenza globale tra regioni per i tuoi utenti, devi applicare una policy IAM in tre parti al ruolo. Di seguito è riportato un esempio di policy IAM per fornire un controllo granulare. È possibile sostituire `<REQUESTING REGION>` la politica di esempio con quella in Regione AWS cui si opera.

```
{
    "Version": "2012-10-17"		 	 	 ,
    "Statement": [
        {
            "Sid": "GrantGlobalCrisInferenceProfileRegionAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:<REQUESTING REGION>:<ACCOUNT>:inference-profile/global.<MODEL NAME>"
            ],
            "Condition": {
                "StringEquals": {
                    "aws:RequestedRegion": "<REQUESTING REGION>"
                }
            }
        },
        {
            "Sid": "GrantGlobalCrisInferenceProfileInRegionModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:<REQUESTING REGION>::foundation-model/<MODEL NAME>"
            ],
            "Condition": {
                "StringEquals": {
                    "aws:RequestedRegion": "<REQUESTING REGION>",
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:<REQUESTING REGION>:<ACCOUNT>:inference-profile/global.<MODEL NAME>"
                }
            }
        },
        {
            "Sid": "GrantGlobalCrisInferenceProfileGlobalModelAccess",
            "Effect": "Allow",
            "Action": "bedrock:InvokeModel",
            "Resource": [
                "arn:aws:bedrock:::foundation-model/<MODEL NAME>"
            ],
            "Condition": {
                "StringEquals": {
                    "aws:RequestedRegion": "unspecified",
                    "bedrock:InferenceProfileArn": "arn:aws:bedrock:<REQUESTING REGION>:<ACCOUNT>:inference-profile/global.<MODEL NAME>"
                }
            }
        }
    ]
}
```

La prima parte della politica consente l'accesso al profilo di inferenza regionale nella richiesta. Regione AWS La seconda parte fornisce l'accesso alla risorsa FM regionale. La terza parte consente l'accesso alla risorsa FM globale, che abilita la funzionalità di routing interregionale.

Quando implementi queste politiche, assicurati che tutte e tre le risorse Amazon Resource Names (ARNs) siano incluse nelle tue istruzioni IAM:
+ Il profilo di inferenza regionale ARN segue lo schema. `arn:aws:bedrock:REGION:ACCOUNT:inference-profile/global.MODEL-NAME` Viene utilizzato per dare accesso al profilo di inferenza globale nell'origine. Regione AWS
+ Il Regional FM utilizza`arn:aws:bedrock:REGION::foundation-model/MODEL-NAME`. Viene utilizzato per dare accesso alla FM nella sorgente Regione AWS.
+ La FM globale richiede`arn:aws:bedrock:::foundation-model/MODEL-NAME`. Viene utilizzato per consentire l'accesso alla FM in diverse aree globali Regioni AWS.

L'ARN FM globale non ha alcun Regione AWS account specificato, il che è intenzionale e richiesto per la funzionalità Cross-region.

### Disabilita l'inferenza globale tra regioni
<a name="global-cris-iam-disable"></a>

Puoi scegliere tra due approcci principali per implementare le politiche di negazione in CRIS globale per ruoli IAM specifici, ciascuno con casi d'uso e implicazioni diversi:
+ **Rimuovere una policy IAM**: il primo metodo prevede la rimozione di una o più delle tre policy IAM richieste dalle autorizzazioni degli utenti. Poiché CRIS globale richiede che tutte e tre le politiche funzionino, la rimozione di una politica comporterà il rifiuto dell'accesso.
+ **Implementazione di una politica di negazione** — Il secondo approccio consiste nell'implementare una politica di negazione esplicita che si rivolga specificamente ai profili di inferenza CRIS globali. Questo metodo fornisce una documentazione chiara dell'intento di sicurezza e assicura che, anche se qualcuno aggiungesse accidentalmente le politiche di autorizzazione richieste in un secondo momento, la negazione esplicita abbia la precedenza. La politica di negazione deve utilizzare una condizione corrispondente allo schema. `StringEquals` `"aws:RequestedRegion": "unspecified"` Questo modello si rivolge specificamente ai profili di inferenza con il `global` prefisso.

Quando si implementano politiche di negazione, è fondamentale comprendere che il CRIS globale modifica il comportamento del campo. `aws:RequestedRegion` Le politiche di rifiuto Regione AWS tradizionali che utilizzano `StringEquals` condizioni con Regione AWS nomi specifici, ad esempio non `"aws:RequestedRegion": "us-west-2"` funzioneranno come previsto con CRIS globale, perché il servizio imposta questo campo sulla destinazione effettiva `global` anziché sulla destinazione effettiva. Regione AWS Tuttavia, come accennato in precedenza, `"aws:RequestedRegion": "unspecified"` produrrà l'effetto negazione.

## Requisiti della politica di controllo dei servizi per l'inferenza globale tra regioni
<a name="global-cris-scp-setup"></a>

Per l'inferenza globale tra regioni, se la politica di sicurezza dell'organizzazione prevede il blocco delle regioni non utilizzate, è necessario aggiornare le condizioni SCP specifiche della regione per consentire l'accesso con. SCPs `"aws:RequestedRegion": "unspecified"` Questa condizione è specifica dell'inferenza interregionale di Amazon Bedrock Global e garantisce che le richieste possano essere instradate verso tutte le regioni commerciali supportate. AWS 

L'esempio seguente SCP blocca tutte le chiamate AWS API al di fuori delle regioni approvate, consentendo al contempo le chiamate di inferenza interregionali di Amazon Bedrock che vengono utilizzate `"unspecified"` come regione per il routing globale:

```
{
    "Version": "2012-10-17"		 	 	 ,
    "Statement": [
        {
            "Sid": "DenyAllOutsideApprovedRegions",
            "Effect": "Deny",
            "Action": "*",
            "Resource": "*",
            "Condition": {
                "StringNotEquals": {
                    "aws:RequestedRegion": [
                        "us-east-1",
                        "us-east-2",
                        "us-west-2",
                        "unspecified"
                    ]
                }
            }
        }
    ]
}
```

### Disattiva l'inferenza globale tra regioni
<a name="global-cris-disable"></a>

Le organizzazioni con requisiti di residenza o conformità dei dati devono valutare se l'inferenza globale interregionale si adatta al proprio framework di conformità, poiché le richieste possono essere elaborate in altre aree commerciali supportate AWS . Per disabilitare in modo esplicito l'inferenza globale tra regioni, implementa la seguente politica SCP:

```
{
    "Effect": "Deny",
    "Action": "bedrock:*",
    "Resource": "*",
    "Condition": {
        "StringEquals": {
            "aws:RequestedRegion": "unspecified"
        },
        "ArnLike": {
            "bedrock:InferenceProfileArn": "arn:aws:bedrock:*:*:inference-profile/global.*"
        }
    }
}
```

Questo SCP nega esplicitamente l'inferenza globale tra regioni perché `"aws:RequestedRegion"` is `"unspecified"` e the `"ArnLike"` condition hanno come target i profili di inferenza con il prefisso nell'ARN. `global`

### AWS Implementazione Control Tower
<a name="control-tower-scp"></a>

La modifica manuale SCPs gestita da AWS Control Tower è fortemente sconsigliata in quanto può causare deviazioni. Utilizza invece i meccanismi forniti da Control Tower per gestire queste eccezioni. I principi fondamentali prevedono l'estensione dei controlli regionali esistenti o l'abilitazione delle regioni e quindi l'applicazione di una politica di blocco condizionale personalizzata.

Per step-by-step indicazioni dettagliate sull'implementazione dell'inferenza interregionale con Control Tower, consulta il post del blog Enable [Amazon Bedrock Cross-region inference in ambienti multi-account](https://aws.amazon.com/blogs/machine-learning/enable-amazon-bedrock-cross-region-inference-in-multi-account-environments/). Ciò include l'estensione delle aree Region Deny esistenti SCPs, l'abilitazione delle aree negate con funzionalità personalizzate SCPs e l'utilizzo di Customizations for AWS Control Tower (cFCT) per implementare come infrastruttura personalizzata SCPs come codice.

## Aumenta il limite di richiesta per l'inferenza globale tra regioni
<a name="global-cris-quotas"></a>

Quando si utilizzano profili di inferenza CRIS globali, è possibile utilizzare CRIS globali da oltre 20 fonti supportate. Regioni AWS Poiché si tratterà di un limite globale, le richieste di visualizzazione, gestione o aumento delle quote per i profili di inferenza globali interregionali devono essere effettuate tramite la console Service Quotas o l'interfaccia a AWS riga di comando (AWS CLI) nell'origine richiesta. Regione AWS

Completa i seguenti passaggi per richiedere un aumento del limite:

1. Accedi alla console Service Quotas del tuo AWS account.

1. Nel pannello di navigazione, scegliere **servizi AWS **.

1. Dall'elenco dei servizi, trova e scegli **Amazon Bedrock**.

1. Nell'elenco delle quote per Amazon Bedrock, utilizza il filtro di ricerca per trovare le quote CRIS globali specifiche. Esempio:
   + Token di inferenza del modello globale interregionale al minuto per Anthropic Claude Sonnet 4.5 V1

1. Seleziona la quota che desideri aumentare.

1. Scegli **Richiedi un aumento a livello di account**.

1. Inserisci il nuovo valore di quota desiderato.

1. Scegli **Richiesta** per inviare la richiesta.

Nel calcolare l'aumento di quota richiesto, ricordati di tenere conto del burndown rate, definito come la velocità con cui i token di input e output vengono convertiti in utilizzo della quota di token per il sistema di throttling. I seguenti modelli hanno un **burn-down rate pari a 5x per i token di output (1 token di output consuma 5 token delle quote**):
+ Claude Anthropic Opus 4
+ Claude Sonnet antropico 4.5
+ Claude Sonnet antropico 4
+ Sonetto antropico di Claude 3.7

Per tutti gli altri modelli, il tasso di consumo è di **1:1** (1 token di output consuma 1 token della quota). Per i token di input, il rapporto tra token e quota è 1:1. Il calcolo del numero totale di token per richiesta è il seguente:

`Input token count + Cache write input tokens + (Output token count x Burndown rate)`

## Usa l'inferenza globale tra regioni
<a name="global-cris-usage"></a>

Per utilizzare l'inferenza globale tra regioni con Claude Sonnet 4.5 di Anthropic, gli sviluppatori devono completare i seguenti passaggi chiave:
+ **Usa l'ID del profilo di inferenza globale**: quando effettui chiamate API ad Amazon Bedrock, specifica l'ID del profilo di inferenza Claude Sonnet 4.5 globale di Anthropic (`global.anthropic.claude-sonnet-4-5-20250929-v1:0`) anziché un ID modello specifico. Regione AWS
+ **Configura le autorizzazioni IAM: concedi le autorizzazioni** IAM appropriate per accedere al profilo di inferenza e nella potenziale destinazione. FMs Regioni AWS

L'inferenza globale tra regioni è supportata per:
+ Inferenza del modello su richiesta
+ Inferenza in batch
+ Agents (Agenti)
+ Valutazione del modello
+ gestione dei prompt
+ Flussi rapidi

**Nota**  
Il profilo di inferenza globale è supportato per l’inferenza del modello on demand, l’inferenza in batch, gli agenti, la valutazione del modello, la gestione dei prompt e i flussi di prompt.

## Implementa l'inferenza globale tra regioni
<a name="global-cris-implementation"></a>

L'implementazione dell'inferenza globale tra regioni con Claude Sonnet 4.5 di Anthropic è semplice e richiede solo poche modifiche al codice dell'applicazione esistente. Di seguito è riportato un esempio di come aggiornare il codice in Python:

```
import boto3
import json
bedrock = boto3.client('bedrock-runtime', region_name='us-east-1')
model_id = "global.anthropic.claude-sonnet-4-5-20250929-v1:0"  
response = bedrock.converse(
    messages=[{"role": "user", "content": [{"text": "Explain cloud computing in 2 sentences."}]}],
    modelId=model_id,
)

print("Response:", response['output']['message']['content'][0]['text'])
print("Token usage:", response['usage'])
print("Total tokens:", response['usage']['totalTokens'])
```