Hyperparameter zur Anpassung des Anthropic-Claude-3-Modells
Anthropic-Claude-3-Modelle unterstützen die folgenden Hyperparameter zur Anpassung des Modells. Durch die Anzahl der angegebenen Epochen erhöhen sich die Kosten für die Modellanpassung, da mehr Token verarbeitet werden. Jede Epoche verarbeitet den gesamten Trainingsdatensatz einmal. Weitere Informationen zur Preisgestaltung finden Sie unter Amazon Bedrock – Preise
| Name der Konsole | API-Name | Definition | Standard | Minimum | Maximum |
|---|---|---|---|---|---|
| Anzahl der Epochen | epochCount | Die maximale Anzahl der Iterationen im gesamten Trainingsdatensatz | 2 | 1 | 10 |
| Batch-Größe | batchSize | Anzahl der Stichproben, die vor der Aktualisierung der Modellparameter verarbeitet wurden | 32 | 4 | 256 |
| Multiplikator für Lerngeschwindigkeit | learningRateMultiplier | Der Multiplikator, der die Lerngeschwindigkeit beeinflusst, mit der Modellparameter nach jedem Batch aktualisiert werden | 1 | 0.1 | 2 |
| Schwellenwert für frühzeitiges Stoppen | earlyStoppingThreshold | Die mindestens erforderlich Verbesserung des Verlusts, um ein vorzeitiges Abbrechen des Trainingsprozesses zu verhindern | 0.001 | 0 | 0.1 |
| Frühzeitiges Stoppen | earlyStoppingPatience | Die Toleranz gegenüber Stagnation in der Verlustmetrik vor dem Abbruch des Trainingsprozesses | 2 | 1 | 10 |