Treinamento iterativo
O treinamento iterativo é uma abordagem sistemática para ajustar modelos por meio de vários ciclos de treinamento, em que cada rodada se baseia no ponto de verificação anterior, abordando pontos fracos específicos descobertos por meio da avaliação. Esse método permite melhorias direcionadas na performance do modelo, incorporando exemplos selecionados que abordam os modos de falha, adaptando-se às mudanças nos requisitos e validando os aprimoramentos de forma incremental, em vez de se comprometer com uma única execução de treinamento longo. O processo normalmente segue padrões como o SFT (ajuste fino supervisionado) seguido pelo RFT (ajuste fino baseado em recompensa), com pontos de verificação armazenados em buckets de depósito do S3 gerenciados pela AWS que podem ser referenciados para iterações de treinamento subsequentes, mantendo a consistência no tipo de modelo e na técnica de treinamento em todo o pipeline.
Para obter mais detalhes, consulte Treinamento iterativo.