Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Livelli di servizio per l'ottimizzazione delle prestazioni e dei costi
Amazon Bedrock offre quattro livelli di servizio per l'inferenza dei modelli: Reserved, Priority, Standard e Flex. Con i livelli di servizio, puoi ottimizzare la disponibilità, i costi e le prestazioni.
Livello riservato
Il livello riservato offre la possibilità di riservare capacità di elaborazione prioritaria per le applicazioni mission-critical che non possono tollerare alcun downtime. Hai la flessibilità di allocare diverse tokens-per-minute capacità di input e output per soddisfare i requisiti esatti del tuo carico di lavoro e controllare i costi. Quando l'applicazione richiede una tokens-per-minute capacità superiore a quella prenotata, il servizio passa automaticamente al livello Standard, garantendo operazioni ininterrotte. Il livello riservato prevede un uptime del 99,5% per la risposta dei modelli. I clienti possono prenotare la capacità per 1 o 3 mesi. I clienti pagano un prezzo fisso per 1.000 dollari tokens-per-minute e vengono fatturati mensilmente.
Per accedere al livello riservato, contatta il team del tuo account AWS.
Livello prioritario
Il livello Priority offre i tempi di risposta più rapidi a fronte di un sovrapprezzo rispetto ai prezzi standard on demand. È la soluzione ideale per applicazioni mission critical con flussi di lavoro aziendali rivolti ai clienti che non garantiscono la prenotazione della capacità 24 ore su 24, 7 giorni su 7. Il livello prioritario non richiede la prenotazione preventiva. Puoi semplicemente impostare il parametro opzionale «service_tier» su «priority» per usufruire della prioritizzazione a livello di richiesta. Le richieste di livello prioritario hanno la priorità rispetto alle richieste di livello Standard e Flex.
Livello Standard
Il livello Standard offre prestazioni costanti per le attività di intelligenza artificiale quotidiane come la generazione di contenuti, l'analisi del testo e l'elaborazione di routine dei documenti. Per impostazione predefinita, tutte le richieste di inferenza vengono indirizzate al livello Standard quando manca il parametro «service_tier». Puoi anche impostare il parametro opzionale «service_tier» su «default» per soddisfare la tua richiesta di inferenza con il livello Standard.
Flex Tier
Per i carichi di lavoro in grado di gestire tempi di elaborazione più lunghi, il livello Flex offre un'elaborazione conveniente a un prezzo scontato. Ciò consente di ottimizzare i costi per carichi di lavoro come la valutazione dei modelli, il riepilogo dei contenuti e i flussi di lavoro agentici. Puoi impostare il parametro opzionale «service_tier» su «flex» per far sì che la tua richiesta di inferenza venga soddisfatta con il livello Flex e usufruire dello sconto sui prezzi.
Utilizzo della funzionalità del livello di servizio
Per accedere alla funzionalità del livello di servizio, puoi impostare il parametro opzionale «service_tier» su «reserved», «priority», «default» o «flex» mentre chiami l'API di runtime Amazon Bedrock.
"service_tier" : "reserved | priority | default | flex"
La tua quota su richiesta per un modello è condivisa tra i livelli di servizio «priority», «default» e «flex». La prenotazione della capacità del livello «riservato» è separata dalla quota su richiesta. La configurazione del livello di servizio per una richiesta servita è visibile in API Response e AWS CloudTrail Events. Puoi anche visualizzare i parametri del livello di servizio in Amazon CloudWatch Metrics in ModelId, e ServiceTier ResolvedServiceTier, dove ResolvedServiceTier mostra il livello effettivo che ha soddisfatto le tue richieste.
Per ulteriori informazioni sui prezzi, consulta la pagina sui prezzi
Modelli e regioni supportati dal livello di servizio riservato:
| Provider | Modello | Modello IDs | Regioni |
| Anthropic | Claude Sonnet 4.5 | global.anthropic.claude-sonnet-4-5-20250929-v 1:0 it.anthropic.claude-sonnet-4-5-20250929-v 1:0 |
ap-northeast-1 |
| ap-northeast-2 | |||
| ap-northeast-3 | |||
| ap-southeast-1 | |||
| ap-southeast-2 | |||
| ap-south-1 | |||
| ap-southeast-3 | |||
| ap-south-2 | |||
| ap-southeast-4 | |||
| ca-central-1 | |||
| Europa-west-1 | |||
| Europa-centrale-1 | |||
| Europa-central-2 | |||
| Europa-nord-1 | |||
| Europa-sud-1 | |||
| Europa-sud-2 | |||
| Europa-ovest-2 | |||
| Europa-ovest-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-1 | |||
| us-west-2 |
Nota
La lunghezza del contesto di 1 m per Sonnet 4.5 non è supportata dal livello Reserved.
Modelli e aree supportati dai livelli di servizio Priority e Flex:
| Provider | Modello | ID del modello | Regioni |
| OpenAI | gpt-oss-120b | apri.gpt-oss-120b-1:0 | us-east-1 |
| us-east-2 | |||
| us-west-2 | |||
| ap-northeast-1 | |||
| ap-south-1 | |||
| ap-southeast-3 | |||
| eu-central-1 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| sa-east-1 | |||
| OpenAI | gpt-oss-20b | aprire i.gpt-oss-20b-1:0 | us-east-1 |
| us-east-2 | |||
| us-west-2 | |||
| ap-northeast-1 | |||
| ap-south-1 | |||
| ap-southeast-3 | |||
| eu-central-1 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| sa-east-1 | |||
| OpenAI | GPT OSS Safeguard 20B | apri. gpt-oss-safeguard-20 g | ap-northeast-1 |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| OpenAI | GPT OSS Safeguard 120 B | apri. gpt-oss-safeguard-120 b | ap-northeast-1 |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| Qwen | Qwen3 235 B A22B 2507 | qwen.qwen3-235b-a22b-2507-v 1:0 | us-east-2 |
| us-west-2 | |||
| ap-northeast-1 | |||
| ap-south-1 | |||
| ap-southeast-3 | |||
| eu-central-1 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-west-2 | |||
| Qwen | Istruzioni Qwen3 Coder 480B A35B | qwen.qwen3-coder-480b-a35b-v 1:0 | us-east-2 |
| us-west-2 | |||
| ap-northeast-1 | |||
| ap-south-1 | |||
| ap-southeast-3 | |||
| eu-north-1 | |||
| eu-west-2 | |||
| Qwen | Qwen3-Coder-30B-A3B-Istruzione | qwen.qwen3-coder-30b-a3b-v1:0 | us-east-1 |
| us-east-2 | |||
| us-west-2 | |||
| ap-northeast-1 | |||
| ap-south-1 | |||
| ap-southeast-3 | |||
| eu-central-1 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| sa-east-1 | |||
| Qwen | Qwen3 32B (denso) | qwen.qwen3-32b-v 1:0 | us-east-1 |
| us-east-2 | |||
| us-west-2 | |||
| ap-northeast-1 | |||
| ap-south-1 | |||
| ap-southeast-3 | |||
| eu-central-1 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| sa-east-1 | |||
| Qwen | Qwen3 Next 80B A3B | qwen.qwen3-next-80b-a3b | ap-northeast-1 |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| Qwen | Qwen3 VL 235B A22B | qwen.qwen3-vl-235b-a22b | ap-northeast-1 |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| DeepSeek | DeepSeek-V 3.1 | deepseek.v3-v 1:0 | us-east-2 |
| us-west-2 | |||
| ap-northeast-1 | |||
| ap-south-1 | |||
| ap-southeast-3 | |||
| eu-north-1 | |||
| eu-west-2 | |||
| Amazon | Nova Premier | amazzone. nova-premier-v1:0 | us-east-1* |
| us-east-2* | |||
| us-west-2* | |||
| Amazon | Nova Pro | amazzone. nova-pro-v1:0 | us-east-1 |
| us-east-2* | |||
| Stati Uniti occidentali-1* | |||
| us-west-2* | |||
| ap-est-2* | |||
| ap-nord-est-1* | |||
| ap-nord-est-2* | |||
| ap-south-1* | |||
| ap-sud-est-1* | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ap-sud-est-4* | |||
| ap-sud-est-5* | |||
| ap-sud-est-7* | |||
| eu-central-1* | |||
| eu-nord-1* | |||
| eu-sud-1* | |||
| eu-sud-2* | |||
| eu-west-1* | |||
| eu-west-2 | |||
| eu-west-3* | |||
| il-central-1* | |||
| me-central-1 | |||
| Amazon | Nova 2 Lite | amazon.nova-2-lite-v1:0 | ap-east-2 |
| ap-northeast-1 | |||
| ap-northeast-2 | |||
| ap-south-1 | |||
| ap-southeast-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ap-southeast-4 | |||
| ap-southeast-5 | |||
| ap-southeast-7 | |||
| ca-central-1 | |||
| ca-west-1 | |||
| eu-central-1 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| il-central-1 | |||
| me-central-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-1 | |||
| us-west-2 | |||
| Amazon | Anteprima di Nova 2 Pro | amazon.nova-2-pro-preview-20251202-v 1:0 | ap-east-2 |
| ap-northeast-1 | |||
| ap-northeast-2 | |||
| ap-south-1 | |||
| ap-southeast-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ap-southeast-4 | |||
| ap-southeast-5 | |||
| ap-southeast-7 | |||
| ca-central-1 | |||
| ca-west-1 | |||
| eu-central-1 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| il-central-1 | |||
| me-central-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-1 | |||
| us-west-2 | |||
| Amazon | Nova Lite 2 Omni | amazon.nova-2- 1 lite-omni-v | ap-east-2 |
| ap-northeast-1 | |||
| ap-northeast-2 | |||
| ap-south-1 | |||
| ap-southeast-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ap-southeast-4 | |||
| ap-southeast-5 | |||
| ap-southeast-7 | |||
| ca-central-1 | |||
| ca-west-1 | |||
| eu-central-1 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| il-central-1 | |||
| me-central-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-1 | |||
| us-west-2 | |||
| Gemma 3 4B | google.gemma-3-4b-it | ap-northeast-1 | |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| Gemma 3 12B | google.gemma-3-12b-it | ap-northeast-1 | |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| Gemma 3 27B | google.gemma-3-27b-it | ap-northeast-1 | |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| Minimax AI | Minimax M2 | minimax.minimax-m2 | ap-northeast-1 |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| Mistral | Magistral Small 1.2 | mistral.magistral-small-2509 | ap-northeast-1 |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| Mistral | Voxtral Mini 1.0 | mistral.voxtral-mini-3b-2507 | ap-northeast-1 |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| Mistral | Voxtral Small 1.0 | mistral.voxtral-small-24b-2507 | ap-northeast-1 |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| Mistral | Ministry 3B 3.0 | mistral.ministral-3-3b-istruisci | ap-northeast-1 |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| Mistral | Ministeral 8B 3.0 | mistral.ministral-3-8b-istruisci | ap-northeast-1 |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| Mistral | Ministry 14B 3.0 | mistral.ministral-3-14b-istruisci | ap-northeast-1 |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| Mistral | Mistral Large 3 | mistral.mistral-large-3-675b-instruct | ap-northeast-1 |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| Kimi AI | Il pensiero di Kimi K2 | moonshot.kimi-k2-thinking | ap-northeast-1 |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| Nvidia | NVIDIA Nemotron Nano 2 | nvidia.nemotron-nano-9b-v2 | ap-northeast-1 |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 | |||
| Nvidia | NVIDIA Nemotron Nano 2 VL | nvidia.nemotron-nano-12b-v2 | ap-northeast-1 |
| ap-south-1 | |||
| ap-southeast-2 | |||
| ap-southeast-3 | |||
| ca-central-1 | |||
| eu-central-1 | |||
| eu-central-2 | |||
| eu-north-1 | |||
| eu-south-1 | |||
| eu-south-2 | |||
| eu-west-1 | |||
| eu-west-2 | |||
| eu-west-3 | |||
| sa-east-1 | |||
| us-east-1 | |||
| us-east-2 | |||
| us-west-2 |
*L'inferenza del modello può essere fornita utilizzando più regioni.
Per controllare l'accesso ai livelli di servizio, fare riferimento Controlla l'accesso ai livelli di servizio