Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
So richten Sie eine Modellaufrufressource mithilfe von Inferenzprofilen ein
Inferenzprofile sind eine Ressource in Amazon Bedrock, die ein Modell sowie eine oder mehrere Regionen definieren, an die das Inferenzprofil Modellaufrufe weiterleiten kann. Sie können Inferenzprofile für folgende Aufgaben verwenden:
-
Nutzungsmetriken verfolgen – Richten CloudWatch-Protokolle ein und senden Sie Modellaufrufanforderungen mit einem Anwendungsinferenzprofil, um Nutzungsmetriken für den Modellaufruf zu sammeln. Sie können diese Metriken überprüfen, wenn Sie Informationen zum Inferenzprofil anzeigen, und diese als Grundlage für Ihre Entscheidungen verwenden. Weitere Informationen zum Einrichten von Protokollen in CloudWatch finden Sie unter Überwachen Sie den Modellaufruf mithilfe von CloudWatch Logs und Amazon S3.
-
Verwenden von Tags zur Kostenüberwachung – Fügen Sie Tags an ein Anwendungsinferenzprofil an, um die Kosten nachzuverfolgen, wenn Sie On-Demand-Modellaufrufanfragen senden. Weitere Informationen zur Verwendung von Tags für die Kostenzuordnung finden Sie unter Verwenden von AWS-Kostenzuordnungs-Tags im AWS Billing-Benutzerhandbuch.
-
Regionalübergreifende Inferenz – Erhöhen Sie Ihren Durchsatz, indem Sie ein Inferenzprofil verwenden, das mehrere AWS-Regionen umfasst. Das Inferenzprofil verteilt Modellaufrufanforderungen auf diese Regionen, um Durchsatz und Leistung zu erhöhen. Weitere Informationen zur regionsübergreifenden Inferenz finden Sie unter Erhöhen des Durchsatzes mit regionenübergreifender Inferenz.
Amazon Bedrock bietet die folgenden Arten von Inferenzprofilen:
-
Regionsübergreifende (systemdefinierte) Inferenzprofile – Inferenzprofile, die in Amazon Bedrock vordefiniert sind und mehrere Regionen umfassen, an die Anfragen für ein Modell weitergeleitet werden können.
-
Anwendungsinferenzprofile – Inferenzprofile, die ein Benutzer erstellt, um Kosten und Modellnutzung zu verfolgen. Sie können ein Inferenzprofil erstellen, das Modellaufrufanforderungen an eine Region oder mehrere Regionen weiterleitet:
-
Um ein Inferenzprofil zu erstellen, das Kosten und Nutzung für ein Modell in einer einzelnen Region verfolgt, geben Sie das Basismodell in der Region an, an die das Inferenzprofil Anfragen weiterleiten soll.
-
Um ein Inferenzprofil zu erstellen, das Kosten und Nutzung für ein Modell über mehrere Regionen hinweg verfolgt, geben Sie das regionsübergreifende (systemdefinierte) Inferenzprofil an, das das Modell und die Regionen definiert, an die das Inferenzprofil Anfragen weiterleiten soll.
-
Sie können Inferenzprofile mit den folgenden Features verwenden, um Anfragen an mehrere Regionen weiterzuleiten und um die Nutzung und Kosten von Aufrufanforderungen zu verfolgen, die mit diesen Features gestellt wurden:
-
Modellinferenz – Verwenden Sie ein Inferenzprofil, wenn Sie einen Modellaufruf ausführen, indem Sie ein Inferenzprofil in einem Playground in der Amazon-Bedrock-Konsole auswählen oder indem Sie den ARN des Inferenzprofils angeben, wenn Sie die Operationen InvokeModel, InvokeModelWithResponseStream, Converse und ConverseStream aufrufen. Weitere Informationen finden Sie unter So senden Sie Prompts und generieren Antworten mithilfe der Modellinferenz.
-
Einbettung von Wissensdatenbank-Vektoren und Generierung von Antworten – Verwenden Sie ein Inferenzprofil, wenn Sie nach der Abfrage einer Wissensdatenbank eine Antwort generieren oder wenn Sie Nicht-Text-Informationen in einer Datenquelle parsen. Weitere Informationen finden Sie unter Testen Ihrer Wissensdatenbank mit Abfragen und Antworten und Parsing-Optionen für Ihre Datenquelle.
-
Modellbewertung – Sie können ein Inferenzprofil als Modell zur Bewertung senden, wenn Sie einen Auftrag zur Modellbewertung übermitteln. Weitere Informationen finden Sie unter Die Leistung von Amazon-Bedrock-Ressourcen bewerten.
-
Prompt-Management – Sie können ein regionenübergreifendes Inferenzprofil verwenden, wenn Sie eine Antwort für einen Prompt generieren, den Sie im Prompt-Management erstellt haben. Weitere Informationen finden Sie unter Erstellen und Speichern wiederverwendbarer Prompts mit dem Prompt-Management in Amazon Bedrock.
-
Flows – Sie können ein regionenübergreifendes Inferenzprofil verwenden, wenn Sie eine Antwort für einen Prompt generieren, den Sie inline in einem Prompt-Knoten innerhalb eines Flows definiert haben. Weitere Informationen finden Sie unter Erstellen eines durchgängigen Workflows mit generativer KI mit Amazon Bedrock Flows.
Der Preis für die Verwendung eines Inferenzprofils wird auf Grundlage des Modellpreises in der Region berechnet, aus der Sie das Inferenzprofil aufrufen. Weitere Informationen zur Preisgestaltung finden Sie unter Amazon Bedrock – Preise
Weitere Informationen zum Durchsatz, den ein regionsübergreifendes Inferenzprofil bieten kann, finden Sie unter Erhöhen des Durchsatzes mit regionenübergreifender Inferenz.