Benutzerdefinierte Lambda-Funktionen für die Bewertung von Belohnungen Einzelheiten zur Implementierung der Lambda-Funktion

Einrichtung von Belohnungsfunktionen für Modelle mit offenem Gewicht

Belohnungsfunktionen bewerten die Antwortqualität und liefern Feedbacksignale für das Modelltraining. Sie können Belohnungsfunktionen mit benutzerdefinierten Lambda-Funktionen einrichten. Wählen Sie den Ansatz, der Ihren Aufgabenanforderungen entspricht.

Benutzerdefinierte Lambda-Funktionen für die Bewertung von Belohnungen

Sie können Belohnungsfunktionen mit benutzerdefinierten Lambda-Funktionen einrichten. Innerhalb Ihrer Lambda-Funktion haben Sie Flexibilität bei der Implementierung der Bewertungslogik:

Objektive Aufgaben — Verwenden Sie für objektive Aufgaben wie Codegenerierung oder mathematisches Denken überprüfbare regelbasierte Korrektoren, die die Richtigkeit anhand bekannter Standards oder Testfälle überprüfen.
Subjektive Aufgaben — Rufen Sie bei subjektiven Aufgaben wie der Befolgung von Anweisungen oder Chatbot-Interaktionen Amazon Bedrock Foundation-Modelle als Richter innerhalb Ihrer Lambda-Funktion auf, um die Antwortqualität anhand Ihrer Kriterien zu bewerten.

Ihre Lambda-Funktion kann je nach Aufgabenanforderungen komplexe Logik implementieren, externe APIs integrieren, mehrstufige Berechnungen durchführen oder mehrere Bewertungskriterien kombinieren.

Anmerkung

Wenn Sie benutzerdefinierte Lambda-Funktionen verwenden:

Erhöhen Sie das Lambda-Timeout für komplexe Auswertungen von standardmäßig 3 Sekunden auf maximal 15 Minuten.
Die Lambda-Ausführungsrolle benötigt Berechtigungen zum Aufrufen der Lambda-Funktion, wie unter beschrieben. Lambda-Berechtigungen für Belohnungsfunktionen

Einzelheiten zur Implementierung der Lambda-Funktion

Bei der Implementierung benutzerdefinierter Lambda-Belohnungsfunktionen muss Ihre Funktion Daten im folgenden Format akzeptieren und zurückgeben.

Richtlinien für das Design

Antworten einordnen — Geben Sie der besten Antwort eine deutlich höhere Punktzahl
Verwenden Sie konsistente Prüfungen — Beurteilen Sie die Erledigung der Aufgaben, die Einhaltung des Formats, die Sicherheit und die angemessene Dauer
Beibehaltung einer stabilen Skalierung — Sorgen Sie dafür, dass die Punktzahlen normalisiert sind und nicht ausgenutzt werden können

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Vorbereiten von Daten

Erstellen Sie Aufträge zur Feinabstimmung