

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

# Amazon SageMaker HyperPod リリースノート
<a name="sagemaker-hyperpod-release-notes"></a>

このトピックでは、Amazon SageMaker HyperPod の更新、修正、新機能を追跡するリリースノートについて説明します。Amazon SageMaker HyperPod の一般的な機能のリリース、更新、改善が必要な場合は、このページが役立つ場合があります。

HyperPod AMI リリースは、一般的な AMI リリース、バージョン、依存関係などの主要なコンポーネントに関する情報を含めるために個別に文書化されています。HyperPod AMI リリースに関連するこれらの情報をお探しの場合は、「[Amazon SageMaker HyperPod AMI](sagemaker-hyperpod-release-ami.md)」を参照してください。

## SageMaker HyperPod リリースノート: 2026 年 4 月 16 日
<a name="sagemaker-hyperpod-release-notes-20260416"></a>

SageMaker HyperPod は、[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md) 用に以下をリリースします。

**新しい特徴**
+ **柔軟なインスタンスグループ** – 新しい`InstanceRequirements`パラメータを使用して、複数のインスタンスタイプを持つインスタンスグループを作成できるようになりました。これにより、優先度ベースのプロビジョニングが可能になり、HyperPod は優先度の高いインスタンスタイプを最初にプロビジョニングしようとし、容量が利用できない場合は優先度の低いインスタンスタイプにフォールバックします。柔軟なインスタンスグループは、必要なインスタンスグループの数を減らすことで、Karpenter 自動スケーリング設定を簡素化します。インスタンスグループごとに最大 20 個のインスタンスタイプを指定できます。詳細については、「[柔軟なインスタンスグループ](sagemaker-hyperpod-scaling-eks.md#sagemaker-hyperpod-scaling-eks-flexible-ig)」を参照してください。

## SageMaker HyperPod リリースノート: 2026 年 1 月 25 日
<a name="sagemaker-hyperpod-release-notes-20260125"></a>

SageMaker HyperPod は、[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md) 用に以下をリリースします。

**新しい特徴**
+ Amazon EKS 1.34 用の新しい SageMaker HyperPod AMI をリリースしました。詳細については、「[Amazon EKS の SageMaker Hyperpod AMI リリース: 2026 年 1 月 25 日](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20260125)」を参照してください。

詳細については、[「Kubernetes v1.34](https://kubernetes.io/blog/2025/08/27/kubernetes-v1-34-release/)」を参照してください。

## SageMaker HyperPod リリースノート: 2025 年 11 月 7 日
<a name="sagemaker-hyperpod-release-notes-20251107"></a>

SageMaker HyperPod は、[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md) 用に以下をリリースします。

**新しい特徴**
+ セキュリティパッチ をアップグレードしました[Amazon EKS の SageMaker HyperPod AMI リリース: 2025 年 11 月 7 日](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20251107)。

## SageMaker HyperPod リリースノート: 2025 年 9 月 29 日
<a name="sagemaker-hyperpod-release-notes-20250929"></a>

SageMaker HyperPod は、[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md) 用に以下をリリースします。

**新しい特徴**
+ Amazon EKS 1.33 用の新しい SageMaker HyperPod AMI をリリースしました。詳細については、[Amazon EKS の SageMaker HyperPod AMI リリース: 2025 年 9 月 29 日](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250929) を参照してください。
**重要**  
動的リソース割り当てベータ Kubernetes API は、このリリースではデフォルトで有効になっています。  
この API は、GPUs。
この API はオープンソースの Kubernetes コミュニティによって開発され、Kubernetes の将来のバージョンで変更される可能性があります。API を使用する前に、[Kubernetes ドキュメント](https://kubernetes.io/docs/concepts/scheduling-eviction/dynamic-resource-allocation/)を確認し、それがワークロードにどのように影響するかを理解してください。
HyperPod は、HyperPod Amazon Linux 2 AMI for Kubernetes 1.33 をリリースしていません。AL2023 に移行 AWS することをお勧めします。詳細については、[「Amazon Linux 2 から AL2023 へのアップグレード](https://docs.aws.amazon.com/eks/latest/userguide/al2023.html)」を参照してください。

詳細については、[「Kubernetes v1.33](https://kubernetes.io/blog/2025/04/23/kubernetes-v1-33-release/)」を参照してください。

## SageMaker HyperPod リリースノート: 2025 年 8 月 4 日
<a name="sagemaker-hyperpod-release-notes-20250804"></a>

SageMaker HyperPod は、EKS オーケストレーション用の新しいパブリック AMI をリリースしました。パブリック AMI は単独で使用することも、カスタム AMI の作成にも使用できます。パブリック AMI の詳細については、「[パブリック AMI リリース](sagemaker-hyperpod-release-public-ami.md)」を参照してください。カスタム AMI の作成の詳細については、「[SageMaker HyperPod クラスター用のカスタム Amazon マシンイメージ (AMI)](hyperpod-custom-ami-support.md)」を参照してください。

## SageMaker HyperPod リリースノート: 2025 年 7 月 31 日
<a name="sagemaker-hyperpod-release-notes-20250731"></a>

SageMaker HyperPod は、[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md) 用に以下をリリースします。

**新しい機能と改善点**
+ EKS クラスターのオペレーティングシステムを Amazon Linux 2 から Amazon Linux 2023 にアップデートする新しい AMI をリリースしました。主なアップグレードには、Linux カーネル 6.1、Python 3.10、NVIDIA ドライバー 560.35.03、YUM に代わる DNF パッケージマネージャーなどがあります。
**重要**  
Amazon Linux 2 から AL2023 へのアップデートでは、AL2 用に設計されたソフトウェアや設定との互換性に影響を与える可能性のある重要な変更が導入されています。クラスターを完全にアップグレードする前に、AL2023 でアプリケーションをテストすることを強くお勧めします。

  新しい AMI とクラスターのアップグレード方法の詳細については、「[Amazon EKS 向け SageMaker HyperPod AMI リリース: 2025 年 7 月 31 日](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250731)」を参照してください。

## SageMaker HyperPod リリースノート: 2025 年 5 月 13 日
<a name="sagemaker-hyperpod-release-notes-20250513"></a>

SageMaker HyperPod は、[Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md) 用に以下をリリースします。

**新しい機能と改善点**
+ Slurm クラスター向け Ubuntu 22.04 LTS をサポートする更新された AMI をリリースしました。このリリースには、パフォーマンスの向上、機能の更新、セキュリティの強化を実現するためのシステムおよびソフトウェアコンポーネントのアップグレードがいくつか含まれています。
**重要**  
Ubuntu 20.04 LTS から Ubuntu 22.04 LTS への更新により、Ubuntu 20.04 用に設計されたソフトウェアと設定との互換性に影響を与える可能性のある変更が導入されました。

  詳細については、以下を参照してください。
  + [Ubuntu 22.04 AMI の主な更新](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-ami-slurm-ubuntu22-updates)
  + [Ubuntu 22.04 AMI へのアップグレード](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-ami-slurm-ubuntu22-upgrade)
  + [アップグレードの失敗のトラブルシューティング](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-ami-slurm-ubuntu22-troubleshoot)

## SageMaker HyperPod リリースノート: 2025 年 5 月 1 日
<a name="sagemaker-hyperpod-release-notes-20250501"></a>

SageMaker HyperPod は、[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md) 用に以下をリリースします。

**新しい特徴**
+ EKS オーケストレーションクラスターの使用状況レポートを追加しました。これにより、組織はチーム、プロジェクト、または部門間で透過的に使用量ベースのコスト配分を実施できます。この機能は、HyperPod の[タスクガバナンス](sagemaker-hyperpod-eks-operate-console-ui-governance.md)機能を補完し、共有マルチテナント AI/ML 環境における公平なコスト配分を実現します。詳細については、「[HyperPod でのコンピューティング使用状況レポート](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-usage-reporting.html)」を参照してください。

## SageMaker HyperPod リリースノート: 2025 年 4 月 28 日
<a name="sagemaker-hyperpod-release-notes-20250428"></a>

SageMaker HyperPod は、[Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md)と [Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md)に関して、以下をリリースします。

**新しい機能と改善点**
+ NVIDIA ドライバーをバージョン 550.144.03 から 550.163.01 にアップグレードしました。このアップグレードは、[2025 年 4 月の NVIDIA GPU ディスプレイセキュリティ情報](https://nvidia.custhelp.com/app/answers/detail/a_id/5630)に記載されている共通脆弱性識別子 (CVE) に対処するためのものです。

AMI のリリースについての詳細は、「[Slurm 向け SageMaker HyperPod AMI リリース: 2025 年 4 月 28 日](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20250428)」および「[Amazon EKS 向け SageMaker HyperPod AMI リリース: 2025 年 4 月 28 日](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250428)」を参照してください。

## SageMaker HyperPod リリースノート: 2025 年 4 月 18 日
<a name="sagemaker-hyperpod-release-notes-20250418"></a>

SageMaker HyperPod は、[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md) 用に以下をリリースします。

**新しい特徴**
+ Amazon EKS 1.32.1 用の新しい SageMaker HyperPod AMI をリリースしました。詳細については、「[Amazon EKS 向け SageMaker HyperPod AMI リリース: 2025 年 4 月 18 日](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250418)」を参照してください。

## SageMaker HyperPod リリースノート: 2025 年 4 月 10 日
<a name="sagemaker-hyperpod-release-notes-20250410"></a>

SageMaker HyperPod は、[Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md) 用に以下をリリースします。

**新しい機能と改善点**
+ Slurm オーケストレーションを使用する SageMaker HyperPod の Direct Preference Optimization (DPO) レシピチュートリアルを追加しました。このファインチューニングのチュートリアルでは、GPU 搭載の SageMaker HyperPod Slurm クラスターで DPO メソッドを使用してモデルの配置を最適化するためのステップバイステップのガイダンスを提供します。詳細については、「[HyperPod Slurm クラスター DPO チュートリアル (GPU)](hyperpod-gpu-slurm-dpo-tutorial.md)」を参照してください。

## SageMaker HyperPod リリースノート: 2025 年 4 月 3 日
<a name="sagemaker-hyperpod-release-notes-20250403"></a>

SageMaker HyperPod は、[Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md)と [Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md)に関して、以下をリリースします。

**新しい機能と改善点**
+ SageMaker HyperPod クラスターをデプロイするための[クイックスタート](sagemaker-hyperpod-quickstart.md)ページを追加しました。このページでは、SageMaker HyperPod の専門ワークショップの効率的なセットアップワークフローを活用し、構築済みの AWS CloudFormation テンプレートを使用してデプロイを自動化します。Slurm や Amazon EKS などのインフラストラクチャ設定をサポートし、ベースラインクラスターの設定とデプロイが容易になります。
+ SageMaker HyperPod は、Slurm クラスターと Amazon EKS クラスターの両方で、次のインスタンスタイプをサポートするようになりました。
  + 新しいインスタンスタイプ: I3en インスタンス、M7i インスタンス、R7i インスタンス。サポートされているインスタンスの完全なリストについては、「`[ClusterInstanceGroupDetails](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupDetails.html)`」の「`InstanceType` フィールド」を参照してください。

## SageMaker HyperPod リリースノート: 2025 年 3 月 16 日
<a name="sagemaker-hyperpod-release-notes-20250316"></a>

SageMaker HyperPod は、[Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md)と [Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md)に関して、以下をリリースします。

**新しい機能と改善点**
+ [https://docs.aws.amazon.com//sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com//sagemaker/latest/APIReference/API_CreateCluster.html) API オペレーションと [https://docs.aws.amazon.com//sagemaker/latest/APIReference/API_UpdateCluster.html](https://docs.aws.amazon.com//sagemaker/latest/APIReference/API_UpdateCluster.html) API オペレーションでより詳細なアクセスコントロールを行うために、次の IAM 条件キーを追加しました。    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/ja_jp/sagemaker/latest/dg/sagemaker-hyperpod-release-notes.html)

## SageMaker HyperPod リリースノート: 2025 年 2 月 20 日
<a name="sagemaker-hyperpod-release-notes-20250220"></a>

SageMaker HyperPod は、[Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md)と [Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md)に関して、以下をリリースします。

**新しい機能と改善点**
+ SageMaker HyperPod クラスターからのインスタンスグループの削除サポートが追加されました。詳細については、「EKS オーケストレーションクラスターから[インスタンスグループを削除する](smcluster-scale-down.md#smcluster-remove-instancegroup)を削除する」と「Slurm オーケストレーションクラスターのクラスターを[クラスターをスケールダウンする](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-scale-down)」を参照してください。

## SageMaker HyperPod リリースノート: 2025 年 2 月 18 日
<a name="sagemaker-hyperpod-release-notes-20250218"></a>

SageMaker HyperPod は、[Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md)と [Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md)に関して、以下をリリースします。

**新しい特徴**
+ SageMaker HyperPod のこのリリースでは、Nvidia コンテナツールキット (バージョン 1.17.3 からバージョン 1.17.4) のセキュリティ更新プログラムが組み込まれています。詳細については、「[v1.17.4 リリースノート](https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4)」を参照してください。
**注記**  
Nvidia コンテナツールキットバージョン 1.17.4 のすべてのコンテナワークロードで、CUDA 互換ライブラリのマウントが無効になりました。コンテナワークフローで複数の CUDA バージョンとの互換性を確保するには、`LD_LIBRARY_PATH` を更新して CUDA 互換性ライブラリを含めます。特定のステップについては、「[CUDA 互換性レイヤーを使用する場合](inference-gpu-drivers.md#collapsible-cuda-compat)」を参照してください。

AMI のリリースについての詳細は、「[Slurm 向け SageMaker HyperPod AMI リリース: 2025 年 2 月 18 日](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20250218)」および「[Amazon EKS 向け SageMaker HyperPod AMI リリース: 2025 年 2 月 18 日](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250218)」を参照してください。

## SageMaker HyperPod リリースノート: 2025 年 2 月 6 日
<a name="sagemaker-hyperpod-release-notes-20250206"></a>

SageMaker HyperPod は、[Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md)と [Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md)に関して、以下をリリースします。

**新しい機能と改善点**
+ SageMaker HyperPod マルチ AZ サポートの強化: クラスター内の個々のインスタンスグループに対して、異なるアベイラビリティーゾーンにまたがって異なるサブネットとセキュリティグループを指定できるようになりました。SageMaker HyperPod のマルチ AZ サポートの詳細については、「[複数の AZ にまたがる SageMaker HyperPod クラスターのセットアップ](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-multiple-availability-zones)」を参照してください。

## SageMaker HyperPod リリースノート: 2025 年 1 月 22 日
<a name="sagemaker-hyperpod-release-notes-20250122"></a>

**AMI リリース**
+ [Amazon EKS 向け SageMaker HyperPod AMI リリース: 2025 年 1 月 22 日](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250122)

## SageMaker HyperPod リリースノート: 2025 年 1 月 9 日
<a name="sagemaker-hyperpod-release-notes-20250109"></a>

SageMaker HyperPod は、[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md)と [Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md)に関して、以下をリリースします。

**新しい機能と改善点**
+ IPv6 サポートの追加: IPv6 対応の VPC とサブネットが設定されている場合、クラスターは IPv6 アドレス指定を使用できます。詳細については、「[カスタム Amazon VPC で SageMaker HyperPod を設定する](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-vpc)」を参照してください。

## SageMaker HyperPod リリースノート: 2024 年 12 月 21 日
<a name="sagemaker-hyperpod-release-notes-20241221"></a>

SageMaker HyperPod は、[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md)と [Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md)に関して、以下をリリースします。

**新しい特徴**
+ SageMaker HyperPod は、Slurm クラスターと Amazon EKS クラスターの両方で、次のインスタンスタイプをサポートするようになりました。
  + 新しいインスタンスタイプ: C6gn、C6i、M6i、R6i。
  + 新しい Trainium インスタンスタイプ: Trn1 と Trn1n。

**改良点**
+ Slurm がジョブを中断する際のエラーログの可視性を強化し、Slurm が開始したジョブのキャンセル中に不要なジョブステップが終了することを防止します。
+ Slurm と Amazon EKS クラスターの両方で、p5en のベース DLAMI を更新しました。

**AMI リリース**
+ [Slurm 向け SageMaker HyperPod AMI リリース: 2024 年 12 月 21 日](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20241221)
+ [Amazon EKS 向け SageMaker HyperPod AMI リリース: 2024 年 12 月 21 日](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241221)

## SageMaker HyperPod リリースノート: 2024 年 12 月 13 日
<a name="sagemaker-hyperpod-release-notes-20241213"></a>

SageMaker HyperPod は、[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md)と [Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md)に関して、以下をリリースします。

**新機能**
+ SageMaker HyperPod は、SageMaker HyperPod Slurm クラスターの健全性とパフォーマンスをモニタリングするための Amazon CloudWatch メトリクスセットをリリースしました。これらは、CPU、GPU、メモリ使用率、ノー​​ド数や障害ノードなどのクラスターインスタンス情報に関連するメトリクスです。このモニタリング機能はデフォルトで有効になっており、メトリクスには `/aws/sagemaker/Clusters` CloudWatch 名前空間でアクセスできます。これらのメトリクスに基づいて CloudWatch アラームを設定し、Slurm ベースの HyperPod クラスター内の潜在的な問題をプロアクティブに検出して対処することもできます。詳細については、「[Amazon SageMaker HyperPod Slurm のメトリクス](smcluster-slurm-metrics.md)」を参照してください。

**AMI リリース**
+ [Amazon EKS 向け SageMaker HyperPod AMI リリース: 2024 年 12 月 13 日](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241213)

## SageMaker HyperPod リリースノート: 2024 年 11 月 24 日
<a name="sagemaker-hyperpod-release-notes-20241124"></a>

SageMaker HyperPod は、[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md)と [Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md)に関して、以下をリリースします。

**新しい特徴**
+ 複数のアベイラビリティーゾーンにまたがる SageMaker HyperPod クラスターの設定のサポートが追加されました。SageMaker HyperPod のマルチ AZ サポートの詳細については、「[複数の AZ にまたがる SageMaker HyperPod クラスターのセットアップ](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-multiple-availability-zones)」を参照してください。

**AMI リリース**
+ [Slurm 向け SageMaker HyperPod AMI リリース: 2024 年 11 月 24 日](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20241124)
+ [Amazon EKS 向け SageMaker HyperPod AMI リリース: 2024 年 11 月 24 日](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241124)

## SageMaker HyperPod リリースノート: 2024 年 11 月 15 日
<a name="sagemaker-hyperpod-release-notes-20241115"></a>

SageMaker HyperPod は、[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md)と [Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md)に関して、以下をリリースします。詳細については、「[Amazon EKS 向け SageMaker HyperPod AMI リリース: 2024 年 11 月 15 日](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241115)」を参照してください。

**新しい機能と改善点**
+ Amazon EKS と Slurm オーケストレーションクラスターの両方で、trn1 インスタンスタイプと trn1n インスタンスタイプのサポートを追加しました。
+ Slurm クラスターのログ管理が改善されました。
  +  ログローテーションを実装: サイズに基づいて毎週または毎日実行できます。
  +  ログの保持期間は 3 週間に設定されています。
  +  ストレージへの影響を軽減するために圧縮ログを使用しています。
  +  長期保存のために、ログの CloudWatch へのアップロードは継続しています。
**注記**  
一部のログは引き続き syslogs に保存されます。
+ 長い行を含むファイルでトラッキングの問題が発生しないように、Fluent Bit の設定を調整しました。

**バグ修正**
+ `slurm.config` 設定ファイル で Slurm コントローラーノードの更新による意図しない切り捨てを防止しています。

**AMI リリース**
+ [Slurm 向け SageMaker HyperPod AMI リリース: 2024 年 11 月 15 日](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20241115)
+ [Amazon EKS 向け SageMaker HyperPod AMI リリース: 2024 年 11 月 15 日](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241115)

## SageMaker HyperPod リリースノート: 2024 年 11 月 11 日
<a name="sagemaker-hyperpod-release-notes-20241111"></a>

SageMaker HyperPod は、[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md)と [Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md)に関して、以下をリリースします。

**新機能**
+ SageMaker HyperPod AMI が G6e インスタンスタイプをサポートするようになりました。

**AMI リリース**
+ [Slurm 向け SageMaker HyperPod AMI リリース: 2024 年 11 月 11 日](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20241111)
+ [Amazon EKS 向け SageMaker HyperPod AMI リリース: 2024 年 11 月 11 日](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241111)

## SageMaker HyperPod リリースノート: 2024 年 10 月 31 日
<a name="sagemaker-hyperpod-release-notes-20241031"></a>

SageMaker HyperPod は、[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md)と [Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md)に関して、以下をリリースします。

**新しい特徴**
+ Amazon EKS と Slurm の両方のオーケストレーションされたクラスターのインスタンスグループレベルとインスタンスレベル、SageMaker HyperPod クラスターのスケールダウン機能を追加しました。Amazon EKS クラスターの詳細については、「[SageMaker HyperPod クラスターのスケールダウン](smcluster-scale-down.md)」を参照してください。Slurm クラスターのスケールダウンの詳細については、「[を使用した SageMaker HyperPod Slurm クラスターの管理 AWS CLI](sagemaker-hyperpod-operate-slurm-cli-command.md)」の「*クラスターをスケールダウンする*」を参照してください。
+ SageMaker HyperPod オーケストレーションクラスターで、P5e インスタンスタイプと P5e インスタンスタイプのサポートを追加しました。

## SageMaker HyperPod リリースノート: 2024 年 10 月 21 日
<a name="sagemaker-hyperpod-release-notes-20241021"></a>

SageMaker HyperPod は、[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md)と [Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md)に関して、以下をリリースします。

**新機能**
+ SageMaker HyperPod は、P5e[n]、G6、Gr6、Trn2[n] のインスタンスタイプをサポートするようになりました。

**AMI リリース**
+ [Slurm 向け SageMaker HyperPod AMI リリース: 2024 年 10 月 21 日](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20241021)
+ [Amazon EKS 向け SageMaker HyperPod AMI リリース: 2024 年 10 月 21 日](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241021)

## SageMaker HyperPod リリースノート: 2024 年 9 月 10 日
<a name="sagemaker-hyperpod-release-notes-20240910"></a>

SageMaker HyperPod は、[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md)と [Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションするSlurm オーケストレーション](sagemaker-hyperpod-slurm.md)に関して、以下をリリースします。

**新しい特徴**
+ SageMaker HyperPod に Amazon EKS サポートを追加しました。詳細については[Amazon EKS を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-eks.md)を参照してください。
+  CloudFormation および Terraform による SageMaker HyperPod クラスターの管理のサポートが追加されました。による HyperPod クラスターの管理の詳細については CloudFormation、「 [の CloudFormation ドキュメント`AWS::SageMaker::Cluster`](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/aws-resource-sagemaker-cluster.html)」を参照してください。Terraform による HyperPod クラスターの管理については、「[`awscc_sagemaker_cluster` の Terraform ドキュメント](https://registry.terraform.io/providers/hashicorp/awscc/latest/docs/data-sources/sagemaker_cluster)」を参照してください。

**AMI リリース**
+ [Slurm 向け SageMaker HyperPod AMI リリース: 2024 年 9 月 10 日](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20240910)
+ [Amazon EKS 向け SageMaker HyperPod AMI リリース: 2024 年 9 月 10 日](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20240910)

## SageMaker HyperPod リリースノート: 2024 年 8 月 20 日
<a name="sagemaker-hyperpod-release-notes-20240820"></a>

SageMaker HyperPod は、[Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-slurm.md) 用に以下をリリースします。

**新しい特徴**
+ [SageMaker HyperPod の自動再開機能](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-resiliency-slurm.html#sagemaker-hyperpod-resiliency-slurm-auto-resume)を強化し、Generic RESources (GRES) がアタッチされた Slurm ノードの回復性機能を拡張しました。

  [汎用リソース (GRES)](https://slurm.schedmd.com/gres.html) が Slurm ノードにアタッチされている場合、Slurm は通常、ノードの置き換えなど、ノード割り当ての変更を許可しないため、失敗したジョブを再開することはできません。明示的に禁止されていない限り、HyperPod 自動再開機能は GRES 対応ノードに関連付けられた障害のあるジョブを自動的にキューに入れ直します。このプロセスでは、ジョブを停止して、ジョブキューに戻した後、最初からジョブを再開します。

**その他の変更**
+ SageMaker HyperPod AMI に [https://slurm.schedmd.com/slurmrestd.html](https://slurm.schedmd.com/slurmrestd.html) をパッケージ化しました。
+ システムの応答性とジョブ処理を改善するため、`slurm.conf` で `ResumeTimeout` および `UnkillableStepTimeout` のデフォルト値を 60 秒から 300 秒に変更しました。
+ NVIDIA Data Center GPU Manager (DCGM) と NVIDIA System Management Interface (nvidia-smi) のヘルスチェックに小規模な改善を加えました。

**バグ修正**
+ HyperPod 自動再開プラグインは、アイドルノードを使用してジョブを再開できます。

## SageMaker HyperPod リリースノート: 2024 年 6 月 20 日
<a name="sagemaker-hyperpod-release-notes-20240620"></a>

SageMaker HyperPod は、[Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-slurm.md) 用に以下をリリースします。

**新しい特徴**
+ SageMaker HyperPod クラスターインスタンスに追加ストレージをアタッチする新しい機能を追加しました。この機能を使用すると、SageMaker HyperPod コンソールまたは [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html) および [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateCluster.html) API を使用して、クラスターの作成または更新プロセス中にインスタンスグループ設定レベルで補足ストレージを設定できます。追加の EBS ボリュームは、SageMaker HyperPod クラスター内の各インスタンスにアタッチされ、`/opt/sagemaker` にマウントされます。SageMaker HyperPod クラスターでの実装の詳細については、以下のページの更新されたドキュメントを参照してください。
  + [SageMaker HyperPod の使用開始](smcluster-getting-started-slurm.md)
  + [SageMaker HyperPod Slurm クラスターオペレーション](sagemaker-hyperpod-operate-slurm.md)

  この機能を使用するには、HyperPod クラスターソフトウェアを更新する必要がある点に注意してください。HyperPod クラスターソフトウェアにパッチを適用した後、2024 年 6 月 20 日より前に作成された既存の SageMaker HyperPod クラスターに新しいインスタンスグループを追加することで、この機能を使用できます。この機能は、2024 年 6 月 20 日以降に作成されたすべての SageMaker HyperPod クラスターに対して完全に有効です。

**アップグレードステップ**
+ 次のコマンドを実行して [UpdateClusterSoftware](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateClusterSoftware.html) API を呼び出し、既存の HyperPod クラスターを最新の HyperPod DLAMI で更新します。手順の詳細については、「[クラスターの SageMaker HyperPod プラットフォームソフトウェアを更新する](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-update-cluster-software)」を参照してください。
**重要**  
この API を実行する前に、作業内容をバックアップしてください。パッチ適用プロセスでは、ルートボリュームが更新された AMI に置き換えられます。つまり、インスタンスのルートボリュームに保存されていた以前のデータは失われます。必ず、インスタンスルートボリュームから Amazon S3 または Amazon FSx for Lustre にデータをバックアップしてください。詳細については、「[SageMaker HyperPod が提供するバックアップスクリプトを使用する](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-update-cluster-software-backup)」を参照してください。

  ```
   aws sagemaker update-cluster-software --cluster-name your-cluster-name
  ```
**注記**  
HyperPod クラスターを更新するには、 AWS CLI コマンドを実行する必要があります。SageMaker HyperPod コンソール UI を介した HyperPod ソフトウェアの更新は現在利用できません。

## SageMaker HyperPod リリースノート: 2024 年 4 月 24 日
<a name="sagemaker-hyperpod-release-notes-20240424"></a>

SageMaker HyperPod は、[Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-slurm.md) 用に以下をリリースします。

**バグ修正**
+ [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html) API の `ThreadsPerCore` パラメータでバグを修正しました。この修正により、[https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html) および [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateCluster.html) API は `ThreadsPerCore` を通じてユーザー入力を適切に取得して適用します。この修正は、2024 年 4 月 24 日以降に作成された HyperPod クラスターで有効です。このバグにより問題が発生したため、この修正をクラスターに適用する場合は、新しいクラスターを作成する必要があります。「[SageMaker HyperPod が提供するバックアップスクリプトを使用する](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-update-cluster-software-backup)」の手順に従って、新しいクラスターに移動しながら、作業内容をバックアップおよび復元してください。

## SageMaker HyperPod リリースノート: 2024 年 3 月 27 日
<a name="sagemaker-hyperpod-release-notes-20240327"></a>

SageMaker HyperPod は、[Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-slurm.md) 用に以下をリリースします。

**HyperPod ソフトウェアパッチ**

HyperPod サービスチームは、[SageMaker HyperPod DLAMI](sagemaker-hyperpod-ref.md#sagemaker-hyperpod-ref-hyperpod-ami) を通じてソフトウェアパッチを配布しています。最新の HyperPod DLAMI の詳細については、以下を参照してください。
+ HyperPod DLAMI のこのリリースでは、Slurm は JSON、YAML、JWT をサポートする REST サービス (`slurmestd`) で構築されます。
+ [Slurm](https://slurm.schedmd.com/documentation.html) を v23.11.3 にアップグレードしました。

**改良点**
+ 自動再開サービスのタイムアウトが 60 分に引き上げられました。
+ Slurm コントローラーを再起動しないようインスタンス置換プロセスを改善しました。
+ インスタンスの起動時のダウンロードエラーやインスタンスヘルスチェックエラーなど、実行中のライフサイクルスクリプトからのエラーメッセージが改善されました。

**バグ修正**
+ 時間同期の問題を引き起こす chrony サービスによるバグを修正しました。
+ `slurm.conf` を解析する際のバグを修正しました。
+ [NVIDIA `go-dcgm`](https://github.com/NVIDIA/go-dcgm) ライブラリの問題を修正しました。

## SageMaker HyperPod リリースノート: 2024 年 3 月 14 日
<a name="sagemaker-hyperpod-release-notes-20240314"></a>

SageMaker HyperPod は、[Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-slurm.md) 用に以下をリリースします。

**改良点**
+ HyperPod では、`provisioning_parameters.json` を通じて提供されたパーティション名を適切に渡し、提供された入力に基づいてパーティションを適切に作成できるようになりました。`provisioning_parameters.json` の詳細については、「[レガシー設定: provisioning\$1parameters.json](sagemaker-hyperpod-ref.md#sagemaker-hyperpod-ref-provisioning-forms)」と「[ライフサイクルスクリプトを使用して SageMaker HyperPod クラスターをカスタマイズする](sagemaker-hyperpod-lifecycle-best-practices-slurm.md)」を参照してください。

**AMI リリース**
+ [Slurm 向け SageMaker HyperPod AMI リリース: 2024 年 3 月 14 日](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20240314)

## SageMaker HyperPod リリースノート: 2024 年 2 月 15 日
<a name="sagemaker-hyperpod-release-notes-20240215"></a>

SageMaker HyperPod は、[Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-slurm.md) 用に以下をリリースします。

**新しい特徴**
+ SageMaker HyperPod セキュリティパッチの新しい `UpdateClusterSoftware` API を追加しました。セキュリティパッチが利用可能になったら、`aws sagemaker update-cluster-software --cluster-name your-cluster-name` を実行して、アカウント内の既存の SageMaker HyperPod クラスターを更新することをお勧めします。今後のセキュリティパッチの最新情報については、この Amazon SageMaker HyperPod リリースノートページを引き続き追跡してください。`UpdateClusterSoftware` API の仕組みについては、「[クラスターの SageMaker HyperPod プラットフォームソフトウェアを更新する](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-update-cluster-software)」を参照してください。

## SageMaker HyperPod リリースノート: 2023 年 11 月 29 日
<a name="sagemaker-hyperpod-release-notes-20231129"></a>

SageMaker HyperPod は、[Slurm を使用して SageMaker HyperPod クラスターをオーケストレーションする](sagemaker-hyperpod-slurm.md) 用に以下をリリースします。

**新しい特徴**
+  AWS re:Invent 2023 で Amazon SageMaker HyperPod を起動しました。

**AMI リリース**
+ [Slurm 向け SageMaker HyperPod AMI リリース: 2023 年 11 月 29 日](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20231129)