Hier erfahren Sie mehr über Anwendungsfälle für verschiedene Modellinferenzmethoden

Sie können Modellinferenzen direkt wie folgt ausführen:

Methode	Anwendungsfall
Playgrounds in der Amazon-Bedrock-Konsole	So führen Sie eine Inferenz in einer benutzerfreundlichen grafischen Benutzeroberfläche aus. Für Erkundungen geeignet.
Converse oder ConverseStream	Implementieren Sie Konversationsanwendungen mit einer einheitlichen API für die Modelleingabe.
InvokeModel oder InvokeModelWithResponseStream	Senden Sie einen einzigen Prompt und generieren Sie synchron eine Antwort. Nützlich für die Generierung von Antworten in Echtzeit oder für Suchanfragen.
StartAsyncInvoke	Senden Sie einen einzigen Prompt und generieren Sie asynchron eine Antwort. Nützlich für die Generierung umfänglicher Antworten.
CreateModelInvocationJob	Bereiten Sie einen Datensatz mit Prompts vor und generieren Sie Antworten stapelweise.

Die folgenden Features von Amazon Bedrock verwenden auch Modellinferenz als Schritt in einem größeren Workflow:

Die Modellbewertung verwendet den Modellaufrufprozess, um die Leistung verschiedener Modelle zu bewerten, nachdem Sie eine CreateEvaluationJob-Anfrage eingereicht haben.
Wissensdatenbanken verwenden den Modellaufruf, wenn sie die RetrieveAndGenerate-API verwenden, um eine Antwort auf Grundlage von Ergebnissen zu generieren, die aus einer Wissensdatenbank abgerufen wurden.
Agenten verwenden den Modellaufruf, um Antworten in verschiedenen Phasen einer InvokeAgent-Anfrage zu generieren.
Flows umfassen Amazon-Bedrock-Ressourcen wie Prompts, Wissensdatenbanken und Agenten, die den Modellaufruf verwenden.

Nachdem Sie verschiedene Basismodelle mit unterschiedlichen Prompts und Inferenzparametern getestet haben, können Sie Ihre Anwendung so konfigurieren, dass sie diese APIs mit Ihren gewünschten Spezifikationen aufruft.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Inferenz: Antworten generieren

Funktionsweise der Inferenz