

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 更新 SageMaker HyperPod 平台軟體
<a name="sagemaker-hyperpod-eks-operate-cli-command-update-cluster-software"></a>

當您建立 SageMaker HyperPod 叢集時，SageMaker HyperPod 會選取對應至 Amazon EKS 叢集 Kubernetes 版本的 Amazon Machine Image (AMI)。

執行 [update-cluster-software](https://docs.aws.amazon.com/cli/latest/reference/sagemaker/update-cluster-software.html)，以使用 SageMaker HyperPod 服務提供的軟體和安全性修補程式更新現有叢集。針對 `--cluster-name`，指定要更新的叢集名稱或 ARN。

**重要**  
呼叫此 API 時，SageMaker HyperPod 不會耗盡或重新分配節點上執行的任務 (Pod)。呼叫此 API 之前，請務必檢查節點上是否有任何正在執行的任務。
修補程序會將根磁碟區取代為更新的 AMI，這表示先前存放在執行個體根磁碟區中的資料將會遺失。請確定您將資料從執行個體根磁碟區備份至 Amazon S3 或 Amazon FSx for Lustre。
修補進行時，所有叢集節點都會經歷停機 (節點在 `kubectl get node` 的輸出中顯示為 `<NotReady>`)。建議您在修補之前終止所有工作負載，並在修補完成後繼續。  
如果安全性修補程式失敗，您可以依照 [描述叢集](sagemaker-hyperpod-eks-operate-cli-command-cluster-details.md#sagemaker-hyperpod-eks-operate-cli-command-describe-cluster) 的指示執行 [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_DescribeCluster.html) API 來擷取失敗訊息。

```
aws sagemaker update-cluster-software --cluster-name {{your-hyperpod-cluster}}
```

**使用彈性執行個體群組滾動升級**  
對於使用 `InstanceRequirements`搭配多個執行個體類型的執行個體群組，滾動升級會將每個執行個體類型按比例分散到批次。例如，如果執行個體群組有 100 個執行個體 (10 P5 和 90 G6)，而且您設定了 10% 的批次大小，則每個批次包含 1 個 P5 執行個體和 9 個 G6 執行個體。

 呼叫 `UpdateClusterSoftware` API 時，SageMaker HyperPod 會根據 Amazon EKS 叢集的 Kubernetes 版本選取最新的 [SageMaker HyperPod DLAMI](sagemaker-hyperpod-ref.md#sagemaker-hyperpod-ref-hyperpod-ami)，以更新節點的 Kubernetes 版本。然後，它會在叢集建立或更新期間指定的 Amazon S3 儲存貯體中執行生命週期指令碼。

您可以執行 `kubectl describe node` 命令來驗證節點的 kubelet 版本。

當您更新 Amazon EKS 叢集版本時，SageMaker HyperPod 叢集節點的 Kubernetes 版本不會自動更新。更新 Amazon EKS 叢集的 Kubernetes 版本後，您必須使用 `UpdateClusterSoftware` API 將 SageMaker HyperPod 叢集節點更新為相同的 Kubernetes 版本。

 建議您在更新 Amazon EKS 節點之後更新 SageMaker HyperPod 叢集，並避免在 Amazon EKS 叢集版本與 SageMaker HyperPod 叢集節點版本之間具有多個版本差異。

SageMaker HyperPod 服務團隊會定期推出新的 [SageMaker HyperPod DLAMI](sagemaker-hyperpod-ref.md#sagemaker-hyperpod-ref-hyperpod-ami)，以增強安全性並改善使用者體驗。我們建議您一律持續更新至最新的 SageMaker HyperPod DLAMI。如需未來的 SageMaker HyperPod DLAMI 更新進行安全性修補，請追蹤 [Amazon SageMaker HyperPod 版本備註](sagemaker-hyperpod-release-notes.md)。

**注意**  
您只能以程式設計方式執行此 API。修補功能未在 SageMaker HyperPod 主控台 UI 中實作。