So verwenden Sie ein Inferenzprofil beim Modellaufruf - Amazon Bedrock

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

So verwenden Sie ein Inferenzprofil beim Modellaufruf

Sie können anstelle eines Basismodells ein regionsübergreifendes Inferenzprofil verwenden, um Anforderungen an mehrere Regionen zu übermitteln. Sie können ein Anwendungsinferenzprofil verwenden, um Kosten und Nutzung eines Modells in einer oder mehreren Regionen nachzuverfolgen. Um zu erfahren, wie Sie ein Inferenzprofil bei der Ausführung von Modellinferenzen verwenden, wählen Sie die Registerkarte für Ihre bevorzugte Methode aus und gehen dann wie folgt vor:

Console

Um ein Inferenzprofil mit einem Feature zu verwenden, das es unterstützt, gehen Sie wie folgt vor:

  1. Melden Sie sich bei der AWS-Managementkonsole mit einer IAM-Identität an, die zur Verwendung der Amazon-Bedrock-Konsole berechtigt ist. Öffnen Sie dann die Amazon-Bedrock-Konsole unter https://console.aws.amazon.com/bedrock.

  2. Navigieren Sie zu der Seite für das Feature, für das Sie ein Inferenzprofil verwenden möchten. Wählen Sie beispielsweise im linken Navigationsbereich Chat /Text Playground aus.

  3. Klicken Sie auf Modell auswählen und wählen Sie dann das Modell aus. Wählen Sie beispielsweise Amazon und dann Nova Premier aus.

  4. Wählen Sie unter Inferenz die Option Inferenzprofile im Dropdownmenü aus.

  5. Wählen Sie das zu verwendende Inferenzprofil aus (z. B. US Nova Premier) und klicken Sie dann auf Anwenden.

API

Sie können ein Inferenzprofil verwenden, wenn Sie Inferenz aus einer beliebigen Region ausführen, die darin enthalten ist, und zwar mit den folgenden API-Operationen:

Anmerkung

Wenn Sie ein regionsübergreifendes (systemdefiniertes) Inferenzprofil verwenden, können Sie entweder den ARN oder die ID des Inferenzprofils verwenden.