SageMaker 模型平行化程式庫 v2
注意
自 2023 年 12 月 19 日發行 SageMaker 模型平行化 (SMP) 程式庫 v2.0.0 以來,此文件已針對 SMP 程式庫 v2 進行了更新。如需 SMP 程式庫的先前版本,請參閱(存檔) SageMaker 模型平行化程式庫 v1.x。
Amazon SageMaker AI 模型平行化程式庫是 SageMaker AI 的功能,可在 SageMaker AI 加速運算執行個體上實現高效能和最佳化的大規模訓練。SageMaker 模型平行化程式庫第 2 版的核心功能 包括加速和簡化大型模型訓練的技術和最佳化,例如混合碎片資料平行化、張量平行化、啟用檢查點和啟用卸載。您可以使用 SMP 程式庫,以數十億個參數加速大型語言模型 (LLM)、大型視覺模型 LVMs) 和基礎模型 (FM) 的訓練和微調。
SageMaker 模型平行化程式庫 v2 (SMP v2) 會將程式庫的 API 和方法與開放原始碼 PyTorch 全碎片資料平行化 (FSDP) 保持一致,讓您只需變更極少的程式碼,就能獲得 SMP 效能最佳化的優勢。透過 SMP v2,您可以將 PyTorch FSDP 訓練指令碼引入 SageMaker AI,進而提高在 SageMaker AI 上訓練最先進的大型模型的運算效能。
您可以針對一般 SageMaker 訓練任務和 Amazon SageMaker HyperPod 叢集上的分散式訓練工作負載使用 SMP v2。