SageMaker モデル並列処理ライブラリ v2 の主要機能 - Amazon SageMaker AI

SageMaker モデル並列処理ライブラリ v2 の主要機能

Amazon SageMaker AI のモデル並列処理ライブラリ v2 (SMP v2) は、シャーディングデータ並列処理、テンソル並列処理、チェックポイントなど、分散処理の戦略とメモリ節約の技術を提供します。SMP v2 によるモデル並列処理の戦略と手法は、大規模なモデルを複数のデバイスに分散させるのに役立ち、それと同時にトレーニング速度とメモリ消費も最適化できます。SMP v2 には、torch.sagemaker という Python パッケージも用意されているので、トレーニングスクリプトを数行のコード変更だけで適応させることができます。

このガイドでは、「SageMaker モデル並列処理ライブラリ v2 を使用する」で紹介している基本的な 2 ステップのフローに沿って説明します。SMP v2 の主要機能とその使用方法の詳細については、以下のトピックを参照してください。

注記

これらの主要機能は、SMP v2.0.0 以降および SageMaker Python SDK v2.200.0 以降で利用できます。また、PyTorch v2.0.1 以降でも動作します。パッケージのバージョンを確認するには、「サポートされるフレームワークと AWS リージョン」を参照してください。