Regioni e modelli supportati Vantaggi Router di prompt predefiniti e configurati Considerazioni e limitazioni Criteri del router di prompt e modello di fallback Come funziona il routing di prompt intelligente Come utilizzare il routing di prompt intelligente

Comprendere il routing di prompt intelligente in Amazon Bedrock

Amazon Bedrock Intelligent Prompt Routing fornisce un unico endpoint serverless per eseguire il routing delle richieste in modo efficiente tra diversi modelli di fondazione nella stessa famiglia di modelli. Può prevedere dinamicamente la qualità della risposta di ogni modello per ogni richiesta e poi instradare la richiesta al modello con la migliore qualità di risposta. In questo modo consente di ottimizzare sia la qualità della risposta che i costi.

Argomenti

Regioni e modelli supportati per il routing di prompt intelligente
Vantaggi
Router di prompt predefiniti e configurati
Considerazioni e limitazioni
Criteri del router di prompt e modello di fallback
Come funziona il routing di prompt intelligente
Come utilizzare il routing di prompt intelligente

Regioni e modelli supportati per il routing di prompt intelligente

Il prompt routing intelligente può essere utilizzato con diversi tipi di modelli. L'elenco seguente descrive il supporto per diversi tipi di modelli Amazon Bedrock:

Supporto per modelli a regione singola: elenca le regioni che supportano l'invio di richieste di inferenza a un modello base in una regione. AWS Per una tabella completa dei modelli disponibili su Amazon Bedrock, consultaModelli di fondazione supportati in Amazon Bedrock.
Supporto per profili di inferenza interregionali: elenca le regioni che supportano l'utilizzo di un profilo di inferenza interregionale, che supporta l'invio di richieste di inferenza a un modello di base in più AWS regioni all'interno di un'area geografica. Un profilo di inferenza ha un prefisso che precede l'ID del modello che ne indica l'area geografica (ad esempio,). us. apac Per ulteriori informazioni sui profili di inferenza disponibili su Amazon Bedrock, consulta. Regioni e modelli supportati per i profili di inferenza

La tabella seguente mostra i modelli supportati per il routing intelligente dei prompt:

Provider	Modello	ID modello	Supporto per modelli a regione singola	Supporto per profili di inferenza tra regioni
Amazon	Nova Lite	amazon. nova-lite-v1:0	us-east-1 us-gov-west-1	ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-2 eu-central-1 eu-west-1 eu-west-3 us-east-1 us-east-2 us-west-2
Amazon	Nova Pro	amazzone. nova-pro-v1:0	us-east-1 us-gov-west-1	ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-2 eu-central-1 eu-west-1 eu-west-3 us-east-1 us-east-2 us-west-2
Anthropic	Claude 3 Haiku	anthropic.claude-3-haiku-20240307-v1:0	ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-2 eu-central-1 eu-west-1 eu-west-3 us-east-1 us-gov-west-1 us-west-2	ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-2 eu-central-1 eu-west-1 eu-west-3 us-east-1 us-east-2 us-gov-east-1 us-west-2
Anthropic	Claude 3.5 Haiku	anthropic.claude-3-5-haiku-20241022-v1:0	us-west-2	us-east-1 us-east-2 us-west-2
Anthropic	Claude 3.5 Sonetto	anthropic.claude-3-5-sonnet-20240620-v1:0	ap-northeast-1 ap-northeast-2 eu-central-1 us-east-1 us-gov-west-1 us-west-2	ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-2 eu-central-1 eu-west-1 eu-west-3 us-east-1 us-east-2 us-gov-east-1 us-west-2
Anthropic	Claude 3.5 Sonnet v2	anthropic.claude-3-5-sonnet-20241022-v2:0	ap-southeast-2 us-west-2	ap-northeast-1 ap-south-1 ap-southeast-2 eu-west-3 us-east-1 us-east-2 us-west-2
Meta	Llama 3.1 70B Instruct	meta.llama3-1-70 1:0 b-instruct-v	us-west-2	us-east-1 us-east-2 us-west-2
Meta	Llama 3.1 8B Instruct	b-instruct-vmeta.llama3-1-8 1:0	us-west-2	us-east-1 us-east-2 us-west-2
Meta	Llama 3.2 11B Instruct	meta.llama3-2-11 1:0 b-instruct-v	N/D	us-east-1 us-east-2 us-west-2
Meta	Llama 3.2 90B Instruct	meta.llama3-2-90 1:0 b-instruct-v	N/D	us-east-1 us-east-2 us-west-2
Meta	Llama 3.3 70B Instruct	meta.llama3-3-70 1:0 b-instruct-v	us-east-2	us-east-1 us-east-2 us-west-2

Vantaggi

Qualità e costi di risposta ottimizzati: indirizza i prompt a diversi modelli di fondazione per ottenere la migliore qualità di risposta al minor costo.
Gestione semplificata: elimina la necessità di una logica di orchestrazione complessa.
A prova di futuro: incorpora nuovi modelli non appena diventano disponibili.

Router di prompt predefiniti e configurati

Quando si utilizza il routing di prompt intelligente, è possibile utilizzare i router prompt predefiniti forniti da Amazon Bedrock o configurare i tuoi router di prompt.

I router di prompt predefiniti sono sistemi di routing preconfigurati forniti da Amazon Bedrock. Questi router sono dotati di impostazioni predefinite e sono progettati per funzionare con modelli fondamentali specifici. out-of-the-box Forniscono una ready-to-use soluzione semplice senza la necessità di configurare alcuna impostazione di routing. Quando si inizia a utilizzare il routing di prompt intelligente, consigliamo di provare a utilizzare i router predefiniti forniti da Amazon Bedrock. Durante l’anteprima, è possibile scegliere di utilizzare modelli selezionati delle famiglie Anthropic e Meta.

I router di prompt configurati consentono di definire configurazioni di routing personalizzate in base a esigenze e preferenze specifiche. Sono più adatti quando è necessario un maggiore controllo sui criteri di routing e sui modelli da utilizzare. I router configurati consentono l’ottimizzazione in base alle metriche di qualità della risposta e ai casi d’uso. Dopo aver provato i router predefiniti, è possibile configurare router personalizzati adatti alle proprie applicazioni, valutare la qualità della risposta nel playground e utilizzarli per applicazioni di produzione se soddisfano i requisiti.

Considerazioni e limitazioni

Di seguito sono riportate alcune considerazioni e limitazioni per il routing di prompt intelligente in Amazon Bedrock.

Il routing di prompt intelligente è ottimizzato solo per i prompt in inglese.
Il routing di prompt intelligente non è in grado di regolare le decisioni o le risposte di routing in base a dati sulle prestazioni specifici dell’applicazione.
Il routing di prompt intelligente potrebbe non fornire sempre il routing più ottimale per casi d’uso unici o specializzati. L’efficacia del routing dipende dai dati di addestramento iniziali.

Criteri del router di prompt e modello di fallback

Quando si configurano i router di prompt, è possibile specificare i criteri di routing, utilizzati per determinare quale modello selezionare per l’elaborazione di una richiesta in base alla differenza di qualità della risposta. Utilizzare questi criteri per determinare in che misura le risposte del modello di fallback devono avvicinarsi alle risposte fornite dagli altri modelli.

Modelli di fallback

Scegliere un modello di fallback che funzioni bene per le richieste. Questo modello funge da base affidabile. Poi è possibile scegliere un altro modello per migliorare la precisione o ridurre i costi rispetto al modello di fallback. Il modello di fallback funge da ancoraggio e i criteri di routing stabiliscono quando passare all’altro modello in base alla differenza di qualità della risposta.

Differenza di qualità della risposta

La differenza di qualità della risposta misura la disparità tra le risposte del modello di fallback e gli altri modelli. Un valore inferiore indica che le risposte sono simili. Un valore più alto indica una differenza significativa nelle risposte tra il modello di fallback e gli altri modelli.

Ad esempio, una differenza di qualità della risposta del 10% significa che, ad esempio, la qualità della risposta del modello di fallback, Claude Haiku3, è del 10%, quindi il router passerà a un altro modello, ad esempio Claude Sonnet3, solo se le sue risposte sono migliori del 10% rispetto alle risposte di Claude Haiku3.

Come funziona il routing di prompt intelligente

Selezione del modello e configurazione del router

Scegliere la famiglia di modelli che si desidera utilizzare per l’applicazione. Se si utilizzano router di prompt predefiniti, è possibile scegliere tra modelli delle famiglie Anthropic o Meta. Se si utilizzano router di prompt configurati, è possibile scegliere tra modelli aggiuntivi e configurare i criteri di routing. Per ulteriori informazioni, consulta Come utilizzare il routing di prompt intelligente.
Analisi delle richieste in entrata

Per ogni richiesta in entrata, il sistema analizza il prompt per comprenderne il contenuto e il contesto.
Previsione della qualità della risposta

Amazon Bedrock prevede la qualità di risposta di ogni modello specificato nella famiglia scelta in base al prompt. Se configurato, il router di prompt tiene conto dei criteri di routing, ossia della differenza di qualità della risposta, e indirizza le richieste al modello di fallback specificato se i criteri non sono soddisfatti.
Selezione del modello e inoltro delle richieste

In base alla previsione della qualità della risposta, Amazon Bedrock sceglie dinamicamente il modello che offre la migliore combinazione di qualità di risposta e costo per la richiesta specifica. La richiesta viene quindi inoltrata al modello scelto per l’elaborazione.
Gestione delle risposte

La risposta del modello scelto viene recuperata e restituita all’utente. La risposta include informazioni sul modello utilizzato per elaborare la richiesta.

Come utilizzare il routing di prompt intelligente

Per iniziare a usare il prompt routing intelligente, usa la console Amazon Bedrock o l'SDK. AWS CLI AWS

Nota

Per utilizzare al meglio il routing di prompt intelligente, sarebbe necessario controllare regolarmente le prestazioni per sfruttare i nuovi modelli. Per ottimizzare l’utilizzo, monitorare le metriche di prestazioni e costi disponibili.

Le seguenti sezioni illustrano come utilizzare questa funzionalità dalla console e dalla CLI. Dopo aver configurato il router di prompt, Amazon Bedrock esegue la procedura descritta in Come funziona il routing di prompt intelligente per generare una risposta da uno dei modelli del router scelto.

console

Per utilizzare il routing di prompt intelligente dalla Console di gestione AWS:

Vai all’hub Router di prompt nella console Amazon Bedrock. Usa le tue credenziali AWS per accedere alla console.
Scegli il modello do famiglia che vuoi utilizzare. Se utilizzi la funzionalità per la prima volta, puoi provare i router di prompt predefiniti. Durante l’anteprima, puoi scegliere tra i modelli delle famiglie Anthropic e Meta. Potrai quindi aprire il playground per fare esperimenti con i tuoi prompt.

Nota
Devi scegliere esattamente due modelli nella stessa famiglia.
Dopo aver provato i router predefiniti, puoi configurare il tuo router. Devi fornire un nome univoco per il router e una descrizione facoltativa.
Definisci le regole di routing per indirizzare i prompt a modelli diversi. Specifica i modelli di routing, i criteri di routing e un modello di fallback da utilizzare nel caso in cui i criteri di routing non siano soddisfatti.
Ora puoi aprire il playground e provare diverse istruzioni per monitorare le prestazioni del router di prompt. Analizzando il modo in cui vengono instradati i prompt e le prestazioni di ciascun modello, puoi modificare i criteri e i modelli di routing in base alle esigenze per ottimizzare prestazioni e costi.

API

Per utilizzare il routing di prompt intelligente dalla AWS CLI:

Dopo aver provato i router di prompt predefiniti, puoi creare un router in grado di gestire il routing di prompt intelligente utilizzando l’API CreatePromptRouter o il comando della CLI create-prompt-router.

Il seguente comando mostra un esempio di creazione del router di prompt, in cui:
- <router-name>è un nome univoco per il router.
- <region>è il Regione AWS punto in cui si desidera creare il router.
- <modelA>e <modelB> sono i modelli tra cui scegliere per il routing. Ad esempio, anthropic.claude-3-5-sonnet-20240620-v1:0.
```
aws bedrock create-prompt-router \
    --prompt-router-name <router-name> \
    --models '[{"modelArn": "arn:aws:bedrock:<region>::foundation-model/<modelA>"}]' \ 
    --fallback-model '[{"modelArn": "arn:aws:bedrock:<region>::foundation-model/<modelB>"}]' \ 
    --routing-criteria '{"responseQualityDifference": 0.5}'
```
Invia i prompt al router di prompt intelligente utilizzando la AWS CLI. Il router può prevedere dinamicamente la qualità della risposta di ogni modello e poi instradare la richiesta al modello con la migliore qualità di risposta.
Rivedi la risposta alla tua richiesta. Conterrà informazioni sul modello utilizzato e sui criteri di routing.
Mentre lavori con i router di prompt, puoi anche utilizzare queste operazioni API aggiuntive:

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Che cos'è la progettazione dei prompt?

Progettare un prompt

Comprendere il routing di prompt intelligente in Amazon Bedrock

Argomenti

Regioni e modelli supportati per il routing di prompt intelligente

Vantaggi

Router di prompt predefiniti e configurati

Considerazioni e limitazioni

Criteri del router di prompt e modello di fallback

Modelli di fallback

Differenza di qualità della risposta

Come funziona il routing di prompt intelligente

Selezione del modello e configurazione del router

Analisi delle richieste in entrata

Previsione della qualità della risposta

Selezione del modello e inoltro delle richieste

Gestione delle risposte

Come utilizzare il routing di prompt intelligente

Nota

Nota