Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Grundlegendes zum intelligenten Prompt Routing in Amazon Bedrock
Das intelligente Prompt Routing für Amazon Bedrock bietet einen einzigen Serverless-Endpunkt, um Anforderungen effizient zwischen verschiedenen Basismodellen innerhalb derselben Modellfamilie weiterzuleiten. Es kann die Antwortqualität jedes Modells für jede Anforderung dynamisch vorhersagen und die Anforderung dann an das Modell mit der besten Antwortqualität weiterleiten. Dies trägt zur Optimierung sowohl der Antwortqualität als auch der Kosten bei.
Themen
Unterstützte Regionen und Modelle für intelligentes Prompt Routing
Intelligentes Prompt-Routing kann mit verschiedenen Modelltypen verwendet werden. In der folgenden Liste wird die Unterstützung für verschiedene Typen von Amazon Bedrock-Modellen beschrieben:
Modellunterstützung für einzelne Regionen — Listet Regionen auf, die das Senden von Inferenzanfragen an ein Foundation-Modell in einer Region unterstützen. AWS Eine vollständige Tabelle der in Amazon Bedrock verfügbaren Modelle finden Sie unterUnterstützte Basismodelle in Amazon Bedrock.
Unterstützung für regionsübergreifende Inferenzprofile — Listet Regionen auf, die die Verwendung eines regionsübergreifenden Inferenzprofils unterstützen, das das Senden von Inferenzanfragen an ein Basismodell in mehreren AWS Regionen innerhalb eines geografischen Gebiets unterstützt. Ein Inferenzprofil hat vor der Modell-ID ein Präfix, das das geografische Gebiet angibt (z. B.,).
us.apacWeitere Informationen zu verfügbaren Inferenzprofilen in Amazon Bedrock finden Sie unter. Unterstützte Regionen und Modelle für Inferenzprofile
Die folgende Tabelle zeigt Modelle, die für intelligentes Prompt-Routing unterstützt werden:
| Anbieter | Modell | Modell-ID | Unterstützung für Modelle mit nur einer Region | Unterstützung für regionsübergreifende Inferenzprofile |
|---|---|---|---|---|
| Amazon | Nova Lite | Amazon. nova-lite-v1:0 |
us-east-1 us-gov-west-1 |
ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-2 eu-central-1 eu-west-1 eu-west-3 us-east-1 us-east-2 us-west-2 |
| Amazon | Nova Pro | Amazonas. nova-pro-v1:0 |
us-east-1 us-gov-west-1 |
ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-2 eu-central-1 eu-west-1 eu-west-3 us-east-1 us-east-2 us-west-2 |
| Anthropic | Claude 3 Haiku | anthropic.claude-3-haiku-20240307-v1:0 |
ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-2 eu-central-1 eu-west-1 eu-west-3 us-east-1 us-gov-west-1 us-west-2 |
ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-2 eu-central-1 eu-west-1 eu-west-3 us-east-1 us-east-2 us-gov-east-1 us-west-2 |
| Anthropic | Claude 3.5 Haiku | anthropic.claude-3-5-haiku-20241022-v1:0 |
us-west-2 |
us-east-1 us-east-2 us-west-2 |
| Anthropic | Claude 3.5 Sonett | anthropic.claude-3-5-sonnet-20240620-v1:0 |
ap-northeast-1 ap-northeast-2 eu-central-1 us-east-1 us-gov-west-1 us-west-2 |
ap-northeast-1 ap-northeast-2 ap-south-1 ap-southeast-2 eu-central-1 eu-west-1 eu-west-3 us-east-1 us-east-2 us-gov-east-1 us-west-2 |
| Anthropic | Claude 3.5 Sonnet v2 | anthropic.claude-3-5-sonnet-20241022-v2:0 |
ap-southeast-2 us-west-2 |
ap-northeast-1 ap-south-1 ap-southeast-2 eu-west-3 us-east-1 us-east-2 us-west-2 |
| Meta | Llama 3.1 70B Instruct | meta.lama3-1-70 1:0 b-instruct-v |
us-west-2 |
us-east-1 us-east-2 us-west-2 |
| Meta | Llama 3,1 8B Instruct | meta.lama3-1-8 1:0 b-instruct-v |
us-west-2 |
us-east-1 us-east-2 us-west-2 |
| Meta | Llama 3.2 11B Instruct | meta.lama3-2-11 1:0 b-instruct-v | – |
us-east-1 us-east-2 us-west-2 |
| Meta | Llama 3.2 90B Instruct | meta.lama3-2-90 1:0 b-instruct-v | – |
us-east-1 us-east-2 us-west-2 |
| Meta | Llama 3.3 70B Instruct | meta.lama3-3-70 1:0 b-instruct-v |
us-east-2 |
us-east-1 us-east-2 us-west-2 |
Vorteile
-
Optimierte Antwortqualität und Kosten: Prompts werden an verschiedene Basismodelle weitergeleitet, um die beste Antwortqualität zu den niedrigsten Kosten zu erzielen.
-
Vereinfachte Verwaltung: Eine komplexe Orchestrierungslogik ist nicht mehr erforderlich.
-
Zukunftssicher: Neue Modelle werden integriert, sobald sie verfügbar sind.
Standard- und konfigurierte Prompt-Router
Wenn Sie intelligentes Prompt Routing verwenden, können Sie entweder die von Amazon Bedrock bereitgestellten Standard-Prompt-Router verwenden oder Ihre eigenen Prompt-Router konfigurieren.
Standard-Prompt-Router sind vorkonfigurierte Routing-Systeme, die von Amazon Bedrock bereitgestellt werden. Diese Router verfügen über vordefinierte Einstellungen und sind so konzipiert, dass sie mit bestimmten Basismodellen funktionieren. out-of-the-box Sie bieten eine unkomplizierte ready-to-use Lösung, ohne dass Routing-Einstellungen konfiguriert werden müssen. Wenn Sie mit dem intelligenten Prompt Routing beginnen, empfehlen wir, mit den von Amazon Bedrock bereitgestellten Standardroutern zu experimentieren. In der Vorschauversion können Sie wählen, ob Sie ausgewählte Modelle der Anthropic- und Meta-Familien verwenden möchten.
Mit konfigurierten Prompt-Routern können Sie Ihre eigenen Routing-Konfigurationen definieren, die auf bestimmte Bedürfnisse und Präferenzen zugeschnitten sind. Sie eignen sich besser, wenn Sie mehr Kontrolle darüber benötigen, wie Ihre Anfragen weitergeleitet werden und welche Modelle verwendet werden sollen. Konfigurierte Router ermöglichen eine Optimierung auf der Grundlage von Metriken zur Antwortqualität und Anwendungsfällen. Nachdem Sie mit Standardroutern experimentiert haben, können Sie Ihre eigenen Router konfigurieren, die für Ihre Anwendungen geeignet sind, die Antwortqualität im Playground bewerten und für Produktionsanwendungen nutzen, sofern sie die Anforderungen erfüllen.
Überlegungen und Einschränkungen
Im Folgenden finden Sie Überlegungen und Einschränkungen in Bezug auf intelligentes Prompt Routing in Amazon Bedrock.
-
Intelligentes Prompt Routing ist nur für Prompts in englischer Sprache optimiert.
-
Durch intelligentes Prompt Routing können Routing-Entscheidungen oder Antworten nicht auf der Grundlage anwendungsspezifischer Leistungsdaten angepasst werden.
-
Intelligentes Prompt-Routing bietet möglicherweise nicht immer die optimale Weiterleitung für einzigartige oder spezielle Anwendungsfälle. Wie effektiv das Routing ist, hängt von den anfänglichen Trainingsdaten ab.
Prompt-Router-Kriterien und das Fallback-Modell
Bei der Konfiguration Ihrer Prompt-Router können Sie die Routing-Kriterien angeben, mit denen anhand der unterschiedlichen Antwortqualität bestimmt wird, welches Modell für die Bearbeitung einer Anfrage ausgewählt werden soll. Verwenden Sie diese Kriterien, um zu bestimmen, wie viel näher die Antwortvariablen des Ersatzmodells an den Antwortvariablen der anderen Modelle liegen sollten.
Fallback-Modelle
Wählen Sie ein Fallback-Modell aus, das für Ihre Anforderungen gut geeignet ist. Dieses Modell dient als zuverlässige Ausgangsbasis. Sie können dann ein anderes Modell auswählen, um entweder die Korrektheit zu verbessern oder die Kosten im Vergleich zum Fallback-Modell zu senken. Das Fallback-Modell fungiert als Anker und die Routing-Kriterien legen fest, wann auf der Grundlage von Unterschieden in der Antwortqualität zum anderen Modell gewechselt werden muss.
Unterschied der Antwortqualität
Der Unterschied der Antwortqualität misst die Disparität zwischen den Antworten des Fallback-Modells und denen der anderen Modelle. Ein kleinerer Wert gibt an, dass die Antworten ähnlich sind. Ein höherer Wert weist auf einen signifikanten Unterschied bei den Antworten zwischen dem Fallback-Modell und den anderen Modellen hin.
Beispielsweise bedeutet ein Unterschied der Antwortqualität von 10 %: Wenn etwa die Antwortqualität des Fallback-Modells, Claude Haiku3, 10 % beträgt, wechselt der Router nur dann zu einem anderen Modell, beispielsweise Claude Sonnet3, wenn dessen Antworten um 10 % besser sind als die Antworten von Claude Haiku3.
So funktioniert intelligentes Prompt Routing
-
Modellauswahl und Router-Konfiguration
Wählen Sie die Modellfamilie aus, die Sie für Ihre Anwendung verwenden möchten. Wenn Sie Standard-Prompt-Router verwenden, können Sie zwischen Modellen der Anthropic- oder Meta-Familie wählen. Wenn Sie konfigurierte Prompt-Router verwenden, können Sie aus zusätzlichen Modellen wählen und die Routing-Kriterien konfigurieren. Weitere Informationen finden Sie unter So wird intelligentes Prompt Routing eingesetzt.
-
Analyse eingehender Anfragen
Für jede eingehende Anfrage analysiert das System den Prompt, um dessen Inhalt und Kontext zu verstehen.
-
Vorhersage der Antwortqualität
Amazon Bedrock prognostiziert auf der Grundlage des Prompts die Antwortqualität jedes angegebenen Modells in der ausgewählten Familie. Wenn Sie Ihren Prompt-Router konfiguriert haben, berücksichtigt er die Routing-Kriterien, d. h. den Unterschied in der Antwortqualität, und leitet Anfragen an das angegebene Fallback-Modell weiter, wenn die Kriterien nicht erfüllt sind.
-
Modellauswahl und Anforderungsweiterleitung
Basierend auf der Prognose der Antwortqualität wählt Amazon Bedrock dynamisch das Modell aus, das die beste Kombination aus Antwortqualität und Kosten für die spezifische Anfrage bietet. Die Anfrage wird dann zur Bearbeitung an das ausgewählte Modell weitergeleitet.
-
Umgang mit Antworten
Die Antwort des ausgewählten Modells wird abgerufen und an den Benutzer zurückgegeben. Die Antwort enthält Informationen über das Modell, das zur Bearbeitung der Anfrage verwendet wurde.
So wird intelligentes Prompt Routing eingesetzt
Verwenden Sie die Amazon Bedrock-Konsole oder das AWS SDK, um mit dem intelligenten Prompt-Routing zu beginnen. AWS CLI
Anmerkung
Damit Sie intelligentes Prompt Routing optimal einsetzen können, sollten Sie die Leistung regelmäßig überprüfen, um die Vorteile neuer Modelle nutzen zu können. Zur Nutzungsoptimierung sollten Sie die verfügbaren Leistungs- und Kostenmetriken überwachen.
In den folgenden Abschnitten sehen Sie, wie Sie dieses Feature über die Konsole und die CLI verwenden. Nachdem Sie Ihren Prompt-Router konfiguriert haben, führt Amazon Bedrock die unter So funktioniert intelligentes Prompt Routing beschriebenen Schritte aus, um eine Antwort von einem der Modelle im ausgewählten Router zu generieren.