Biblioteca de paralelismo de modelos do SageMaker v2 - SageMaker IA da Amazon

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Biblioteca de paralelismo de modelos do SageMaker v2

nota

Desde o lançamento da biblioteca de paralelismo de modelos do SageMaker (SMP) v2.0.0 em 19 de dezembro de 2023, essa documentação foi renovada para a biblioteca de SMP v2. Para versões anteriores da biblioteca de SMP, consulte Biblioteca de paralelismo de modelos do SageMaker v1.x (arquivada).

A biblioteca de paralelismo de modelos do Amazon SageMaker AI é um recurso do SageMaker AI que permite treinamentos otimizados e de alto desempenho em grande escala em instâncias com computação acelerada do SageMaker AI. O Principais características da biblioteca de paralelismo de SageMaker modelos v2 inclui técnicas e otimizações para acelerar e simplificar o treinamento de grandes modelos, como paralelismo híbrido de dados fragmentados, paralelismo de tensores, pontos de verificação de ativação e descarregamento de ativação. Você pode usar a biblioteca de SMP para acelerar o treinamento e o ajuste de grandes modelos de linguagem (LLMs), modelos de visão ampla (LVMs) e modelos de base (FMs) com centenas de bilhões de parâmetros.

A biblioteca de paralelismo de modelos do SageMaker v2 (SMP v2) alinha as APIs e os métodos da biblioteca com o paralelismo de dados totalmente fragmentados do PyTorch (FSDP) de código aberto, o que oferece o benefício das otimizações de desempenho do SMP com o mínimo de alterações no código. Com a SMP v2, você pode melhorar o desempenho computacional do treinamento de um grande modelo de última geração no SageMaker AI trazendo seus scripts de treinamento de FSDP do PyTorch para o SageMaker AI.

Você pode usar o SMP v2 para os trabalhos gerais do SageMaker Training e workloads de treinamento distribuídas em clusters Amazon SageMaker HyperPod.