Iteratives Training

Iteratives Training ist ein systematischer Ansatz zur Feinabstimmung von Modellen durch mehrere Trainingszyklen, wobei jede Runde auf dem vorherigen Checkpoint aufbaut, indem spezifische Schwächen behoben werden, die bei der Bewertung entdeckt wurden. Diese Methode ermöglicht gezielte Verbesserungen der Modellleistung durch die Einbeziehung kuratierter Beispiele, die sich mit Fehlerarten befassen, die Anpassung an sich ändernde Anforderungen und die schrittweise Validierung von Verbesserungen, anstatt sich auf einen einzigen langen Trainingslauf festzulegen. Der Prozess folgt in der Regel Mustern wie SFT (Supervised Fine-Tuning) gefolgt von RFT (Reward-based Fine-Tuning), wobei Checkpoints in S3-Buckets mit AWS verwalteten Escrow-S3-Buckets gespeichert werden, auf die für nachfolgende Trainingsiterationen verwiesen werden kann, wobei die Konsistenz von Modelltyp und Trainingstechnik während der gesamten Pipeline gewahrt bleibt.

Weitere Informationen finden Sie unter Iteratives Training.

Warnung JavaScript ist in Ihrem Browser nicht verfügbar oder deaktiviert.

Zur Nutzung der AWS-Dokumentation muss JavaScript aktiviert sein. Weitere Informationen finden auf den Hilfe-Seiten Ihres Browsers.

Dokumentkonventionen

Bewertung

An SageMaker HyperPod