MetaLlama 3.2Hyperparameter zur Modellanpassung

Die Modelle Meta Llama 3.2 1B, 3B, 11B und 90B unterstützen die folgenden Hyperparameter für die Modellanpassung. Die Anzahl der Epochen, die Sie angeben, erhöht Ihre Kosten für die Modellanpassung, da mehr Token verarbeitet werden. Jede Epoche verarbeitet den gesamten Trainingsdatensatz einmal. Preisinformationen finden Sie unter Amazon Bedrock — Preise. Weitere Informationen finden Sie unter Passen Sie Ihr Modell an, um seine Leistung für Ihren Anwendungsfall zu verbessern.

Informationen zur Feinabstimmung von Meta Lama-Modellen finden Sie in der Meta Dokumentation unter https://ai.meta.com/llama/get-started/ #fine -tuning.

Hyperparameter (Konsole)	Hyperparameter (API)	Definition	Minimum	Maximum	Standard
Epochen	epochCount	Die Anzahl der Iterationen durch den gesamten Trainingsdatensatz	1	10	5
Batch-Größe	batchSize	Die Anzahl der Stichproben, die vor der Aktualisierung der Modellparameter verarbeitet wurden	1	1	1
Lernrate	learningRate	Die Geschwindigkeit, mit der Modellparameter nach jedem Batch aktualisiert werden	5.00E-6	0.1	1,00E-4

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

MetaLlama 3.1Modelle

Modelllebenszyklus