Verwenden Sie ein Inferenzprofil beim Modellaufruf - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

Verwenden Sie ein Inferenzprofil beim Modellaufruf

Sie können anstelle eines Basismodells ein regionsübergreifendes Inferenzprofil verwenden, um Anfragen an mehrere Regionen weiterzuleiten. Um die Kosten und die Nutzung eines Modells in einer oder mehreren Regionen nachzuverfolgen, können Sie ein Anwendungs-Inferenzprofil verwenden. Um zu erfahren, wie Sie ein Inferenzprofil bei der Ausführung von Modellinferenzen verwenden, wählen Sie die Registerkarte für Ihre bevorzugte Methode und gehen Sie dann wie folgt vor:

Console

Gehen Sie wie folgt vor, um ein Inferenzprofil mit einer Funktion zu verwenden, die es unterstützt:

  1. Melden Sie sich bei der AWS Management Console mit einer IAM-Identität an, die berechtigt ist, die Amazon Bedrock-Konsole zu verwenden. Öffnen Sie dann die Amazon Bedrock-Konsole unter https://console.aws.amazon.com/bedrock/.

  2. Navigieren Sie zu der Seite für die Funktion, für die Sie ein Inferenzprofil verwenden möchten. Wählen Sie beispielsweise im linken Navigationsbereich Chat /Text Playground aus.

  3. Wählen Sie Modell auswählen und wählen Sie dann das Modell aus. Wählen Sie beispielsweise Amazon und dann Nova Premier.

  4. Wählen Sie unter Inferenz die Option Inferenzprofile aus dem Drop-down-Menü aus.

  5. Wählen Sie das zu verwendende Inferenzprofil aus (z. B. US Nova Premier) und klicken Sie dann auf Anwenden.

API

Sie können ein Inferenzprofil verwenden, wenn Sie Inferenzen aus einer beliebigen Region ausführen, die darin enthalten ist, und zwar mit den folgenden API-Vorgängen:

Anmerkung

Wenn Sie ein regionsübergreifendes (systemdefiniertes) Inferenzprofil verwenden, können Sie entweder den ARN oder die ID des Inferenzprofils verwenden.