Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.
Hyperparameter zur Modellanpassung von Anthropic Claude 3
Anthropic Claude 3-Modelle unterstützen die folgenden Hyperparameter für die Modellanpassung. Die Anzahl der Epochen, die Sie angeben, erhöht Ihre Kosten für die Modellanpassung, da mehr Token verarbeitet werden. Jede Epoche verarbeitet den gesamten Trainingsdatensatz einmal. Preisinformationen finden Sie unter Amazon Bedrock — Preise
Name der Konsole | API-Name | Definition | Standard | Minimum | Maximum |
---|---|---|---|---|---|
Anzahl der Epochen | epochCount | Die maximale Anzahl von Iterationen im gesamten Trainingsdatensatz | 2 | 1 | 10 |
Batch-Größe | batchSize | Anzahl der Stichproben, die vor der Aktualisierung der Modellparameter verarbeitet wurden | 32 | 4 | 256 |
Multiplikator für die Lernrate | learningRateMultiplier | Multiplikator, der die Lernrate beeinflusst, mit der Modellparameter nach jeder Charge aktualisiert werden | 1 | 0.1 | 2 |
Schwellenwert für frühes Abbrechen | earlyStoppingThreshold | Minimale Verbesserung des Validierungsverlusts erforderlich, um ein vorzeitiges Abbrechen des Schulungsprozesses zu verhindern | 0.001 | 0 | 0.1 |
Frühzeitiges Aufhören der Geduld | earlyStoppingPatience | Toleranz gegenüber Stagnation bei der Metrik zum Verlust der Validierung, bevor der Trainingsprozess beendet wird | 2 | 1 | 10 |