Comprendere il routing di prompt intelligente in Amazon Bedrock - Amazon Bedrock

Comprendere il routing di prompt intelligente in Amazon Bedrock

Amazon Bedrock Intelligent Prompt Routing fornisce un unico endpoint serverless per eseguire il routing delle richieste in modo efficiente tra diversi modelli di fondazione nella stessa famiglia di modelli. Può prevedere dinamicamente la qualità della risposta di ogni modello per ogni richiesta e poi instradare la richiesta al modello con la migliore qualità di risposta. In questo modo consente di ottimizzare sia la qualità della risposta che i costi.

Regioni e modelli supportati per il routing di prompt intelligente

Il routing di prompt intelligente è supportato dai seguenti modelli:

Provider Modello Regioni che supportano il modello di fondazione Regioni che supportano il profilo di inferenza
Amazon Nova Lite

us-east-1

us-gov-west-1

us-east-1

us-east-2

us-west-2

ap-northeast-1

ap-northeast-2

ap-south-1

ap-southeast-2

eu-central-1

eu-west-1

eu-west-3

Amazon Nova Pro

us-east-1

us-gov-west-1

us-east-1

us-east-2

us-west-2

ap-northeast-1

ap-northeast-2

ap-south-1

ap-southeast-2

eu-central-1

eu-west-1

eu-west-3

Anthropic Claude 3.5 Haiku

us-west-2

us-east-1

us-east-2

us-west-2

Anthropic Claude 3.5 Sonnet

us-east-1

us-west-2

us-gov-west-1

ap-northeast-1

ap-northeast-2

eu-central-1

us-east-1

us-east-2

us-west-2

us-gov-east-1

ap-northeast-1

ap-northeast-2

ap-south-1

ap-southeast-2

eu-central-1

eu-west-1

eu-west-3

Anthropic Claude 3.5 Sonnet v2

us-west-2

ap-southeast-2

us-east-1

us-east-2

us-west-2

ap-northeast-1

ap-south-1

ap-southeast-2

eu-west-3

Anthropic Claude 3 Haiku

us-east-1

us-west-2

us-gov-west-1

ap-northeast-1

ap-northeast-2

ap-south-1

ap-southeast-2

eu-central-1

eu-west-1

eu-west-3

us-east-1

us-east-2

us-west-2

us-gov-east-1

ap-northeast-1

ap-northeast-2

ap-south-1

ap-southeast-2

eu-central-1

eu-west-1

eu-west-3

Meta Llama 3.1 70B Instruct

us-west-2

us-east-1

us-east-2

us-west-2

Meta Llama 3.1 8B Instruct

us-west-2

us-east-1

us-east-2

us-west-2

Meta Llama 3.2 11B Instruct

N/A

us-east-1

us-east-2

us-west-2

Meta Llama 3.2 90B Instruct

N/A

us-east-1

us-east-2

us-west-2

Meta Llama 3.3 70B Instruct

us-east-2

us-east-1

us-east-2

us-west-2

Vantaggi

  • Qualità e costi di risposta ottimizzati: indirizza i prompt a diversi modelli di fondazione per ottenere la migliore qualità di risposta al minor costo.

  • Gestione semplificata: elimina la necessità di una logica di orchestrazione complessa.

  • A prova di futuro: incorpora nuovi modelli non appena diventano disponibili.

Router di prompt predefiniti e configurati

Quando si utilizza il routing di prompt intelligente, è possibile utilizzare i router prompt predefiniti forniti da Amazon Bedrock o configurare i tuoi router di prompt.

I router di prompt predefiniti sono sistemi di routing preconfigurati forniti da Amazon Bedrock. Questi router sono dotati di impostazioni predefinite e sono progettati per funzionare immediatamente con modelli di fondazione specifici. Forniscono una soluzione semplice e pronta all’uso senza la necessità di configurare le impostazioni di routing. Quando si inizia a utilizzare il routing di prompt intelligente, consigliamo di provare a utilizzare i router predefiniti forniti da Amazon Bedrock. Durante l’anteprima, è possibile scegliere di utilizzare modelli selezionati delle famiglie Anthropic e Meta.

I router di prompt configurati consentono di definire configurazioni di routing personalizzate in base a esigenze e preferenze specifiche. Sono più adatti quando è necessario un maggiore controllo sui criteri di routing e sui modelli da utilizzare. I router configurati consentono l’ottimizzazione in base alle metriche di qualità della risposta e ai casi d’uso. Dopo aver provato i router predefiniti, è possibile configurare router personalizzati adatti alle proprie applicazioni, valutare la qualità della risposta nel playground e utilizzarli per applicazioni di produzione se soddisfano i requisiti.

Considerazioni e limitazioni

Di seguito sono riportate alcune considerazioni e limitazioni per il routing di prompt intelligente in Amazon Bedrock.

  • Il routing di prompt intelligente è ottimizzato solo per i prompt in inglese.

  • Il routing di prompt intelligente non è in grado di regolare le decisioni o le risposte di routing in base a dati sulle prestazioni specifici dell’applicazione.

  • Il routing di prompt intelligente potrebbe non fornire sempre il routing più ottimale per casi d’uso unici o specializzati. L’efficacia del routing dipende dai dati di addestramento iniziali.

Criteri del router di prompt e modello di fallback

Quando si configurano i router di prompt, è possibile specificare i criteri di routing, utilizzati per determinare quale modello selezionare per l’elaborazione di una richiesta in base alla differenza di qualità della risposta. Utilizzare questi criteri per determinare in che misura le risposte del modello di fallback devono avvicinarsi alle risposte fornite dagli altri modelli.

Modelli di fallback

Scegliere un modello di fallback che funzioni bene per le richieste. Questo modello funge da base affidabile. Poi è possibile scegliere un altro modello per migliorare la precisione o ridurre i costi rispetto al modello di fallback. Il modello di fallback funge da ancoraggio e i criteri di routing stabiliscono quando passare all’altro modello in base alla differenza di qualità della risposta.

Differenza di qualità della risposta

La differenza di qualità della risposta misura la disparità tra le risposte del modello di fallback e gli altri modelli. Un valore inferiore indica che le risposte sono simili. Un valore più alto indica una differenza significativa nelle risposte tra il modello di fallback e gli altri modelli.

Ad esempio, una differenza di qualità della risposta del 10% significa che, ad esempio, la qualità della risposta del modello di fallback, Claude Haiku3, è del 10%, quindi il router passerà a un altro modello, ad esempio Claude Sonnet3, solo se le sue risposte sono migliori del 10% rispetto alle risposte di Claude Haiku3.

Come funziona il routing di prompt intelligente

  1. Selezione del modello e configurazione del router

    Scegliere la famiglia di modelli che si desidera utilizzare per l’applicazione. Se si utilizzano router di prompt predefiniti, è possibile scegliere tra modelli delle famiglie Anthropic o Meta. Se si utilizzano router di prompt configurati, è possibile scegliere tra modelli aggiuntivi e configurare i criteri di routing. Per ulteriori informazioni, consulta Come utilizzare il routing di prompt intelligente.

  2. Analisi delle richieste in entrata

    Per ogni richiesta in entrata, il sistema analizza il prompt per comprenderne il contenuto e il contesto.

  3. Previsione della qualità della risposta

    Amazon Bedrock prevede la qualità di risposta di ogni modello specificato nella famiglia scelta in base al prompt. Se configurato, il router di prompt tiene conto dei criteri di routing, ossia della differenza di qualità della risposta, e indirizza le richieste al modello di fallback specificato se i criteri non sono soddisfatti.

  4. Selezione del modello e inoltro delle richieste

    In base alla previsione della qualità della risposta, Amazon Bedrock sceglie dinamicamente il modello che offre la migliore combinazione di qualità di risposta e costo per la richiesta specifica. La richiesta viene quindi inoltrata al modello scelto per l’elaborazione.

  5. Gestione delle risposte

    La risposta del modello scelto viene recuperata e restituita all’utente. La risposta include informazioni sul modello utilizzato per elaborare la richiesta.

Come utilizzare il routing di prompt intelligente

Per iniziare a utilizzare il routing di prompt intelligente, utilizzare la console Amazon Bedrock, AWS CLI o l’SDK AWS.

Nota

Per utilizzare al meglio il routing di prompt intelligente, sarebbe necessario controllare regolarmente le prestazioni per sfruttare i nuovi modelli. Per ottimizzare l’utilizzo, monitorare le metriche di prestazioni e costi disponibili.

Le seguenti sezioni illustrano come utilizzare questa funzionalità dalla console e dalla CLI. Dopo aver configurato il router di prompt, Amazon Bedrock esegue la procedura descritta in Come funziona il routing di prompt intelligente per generare una risposta da uno dei modelli del router scelto.

console

Per utilizzare il routing di prompt intelligente dalla Console di gestione AWS:

  1. Vai all’hub Router di prompt nella console Amazon Bedrock. Usa le tue credenziali AWS per accedere alla console.

  2. Scegli il modello do famiglia che vuoi utilizzare. Se utilizzi la funzionalità per la prima volta, puoi provare i router di prompt predefiniti. Durante l’anteprima, puoi scegliere tra i modelli delle famiglie Anthropic e Meta. Potrai quindi aprire il playground per fare esperimenti con i tuoi prompt.

    Nota

    Devi scegliere esattamente due modelli nella stessa famiglia.

  3. Dopo aver provato i router predefiniti, puoi configurare il tuo router. Devi fornire un nome univoco per il router e una descrizione facoltativa.

  4. Definisci le regole di routing per indirizzare i prompt a modelli diversi. Specifica i modelli di routing, i criteri di routing e un modello di fallback da utilizzare nel caso in cui i criteri di routing non siano soddisfatti.

  5. Ora puoi aprire il playground e provare diverse istruzioni per monitorare le prestazioni del router di prompt. Analizzando il modo in cui vengono instradati i prompt e le prestazioni di ciascun modello, puoi modificare i criteri e i modelli di routing in base alle esigenze per ottimizzare prestazioni e costi.

API

Per utilizzare il routing di prompt intelligente dalla AWS CLI:

  1. Dopo aver provato i router di prompt predefiniti, puoi creare un router in grado di gestire il routing di prompt intelligente utilizzando l’API CreatePromptRouter o il comando della CLI create-prompt-router.

    Il seguente comando mostra un esempio di creazione del router di prompt, in cui:

    • <router-name> è un nome univoco per il router.

    • <region> è la Regione AWS in cui si vuole creare il router.

    • <modelA> e <modelB> sono i modelli tra cui scegliere per il routing. Ad esempio, anthropic.claude-3-5-sonnet-20240620-v1:0.

    aws bedrock create-prompt-router \ --prompt-router-name <router-name> \ --models '[{"modelArn": "arn:aws:bedrock:<region>::foundation-model/<modelA>"}]' \ --fallback-model '[{"modelArn": "arn:aws:bedrock:<region>::foundation-model/<modelB>"}]' \ --routing-criteria '{"responseQualityDifference": 0.5}'
  2. Invia i prompt al router di prompt intelligente utilizzando la AWS CLI. Il router può prevedere dinamicamente la qualità della risposta di ogni modello e poi instradare la richiesta al modello con la migliore qualità di risposta.

  3. Rivedi la risposta alla tua richiesta. Conterrà informazioni sul modello utilizzato e sui criteri di routing.

  4. Mentre lavori con i router di prompt, puoi anche utilizzare queste operazioni API aggiuntive: