Hyperparameter zur Anpassung des Anthropic-Claude-3-Modells - Amazon Bedrock

Hyperparameter zur Anpassung des Anthropic-Claude-3-Modells

Anthropic-Claude-3-Modelle unterstützen die folgenden Hyperparameter zur Anpassung des Modells. Durch die Anzahl der angegebenen Epochen erhöhen sich die Kosten für die Modellanpassung, da mehr Token verarbeitet werden. Jede Epoche verarbeitet den gesamten Trainingsdatensatz einmal. Weitere Informationen zur Preisgestaltung finden Sie unter Amazon Bedrock – Preise.

Name der Konsole API-Name Definition Standard Minimum Maximum
Anzahl der Epochen epochCount Die maximale Anzahl der Iterationen im gesamten Trainingsdatensatz 2 1 10
Batch-Größe batchSize Anzahl der Stichproben, die vor der Aktualisierung der Modellparameter verarbeitet wurden 32 4 256
Multiplikator für Lerngeschwindigkeit learningRateMultiplier Der Multiplikator, der die Lerngeschwindigkeit beeinflusst, mit der Modellparameter nach jedem Batch aktualisiert werden 1 0.1 2
Schwellenwert für frühzeitiges Stoppen earlyStoppingThreshold Die mindestens erforderlich Verbesserung des Verlusts, um ein vorzeitiges Abbrechen des Trainingsprozesses zu verhindern 0.001 0 0.1
Frühzeitiges Stoppen earlyStoppingPatience Die Toleranz gegenüber Stagnation in der Verlustmetrik vor dem Abbruch des Trainingsprozesses 2 1 10