

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Notas SageMaker HyperPod de lançamento da Amazon
<a name="sagemaker-hyperpod-release-notes"></a>

Este tópico aborda notas de lançamento que monitoram atualizações, correções e novos recursos da Amazon SageMaker HyperPod. Se você estiver procurando por lançamentos de recursos gerais, atualizações e melhorias para a Amazon SageMaker HyperPod, você pode achar esta página útil.

As versões da HyperPod AMI são documentadas separadamente para incluir informações sobre os principais componentes, incluindo versões, versões e dependências gerais da AMI. Se você estiver procurando por essas informações relacionadas às versões da HyperPod AMI, consulte[Amazon SageMaker HyperPod AMI](sagemaker-hyperpod-release-ami.md).

## SageMaker HyperPod notas de lançamento: 16 de abril de 2026
<a name="sagemaker-hyperpod-release-notes-20260416"></a>

SageMaker HyperPod libera o seguinte para[Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md).

**Novos recursos**
+ **Grupos de instâncias flexíveis** — agora você pode criar grupos de instâncias com vários tipos de instância usando o novo `InstanceRequirements` parâmetro. Isso permite o provisionamento baseado em prioridade, em que HyperPod tenta provisionar primeiro o tipo de instância de maior prioridade e volta para tipos de prioridade mais baixa se a capacidade não estiver disponível. Grupos de instâncias flexíveis simplificam as configurações de auto-scaling do Karpenter ao reduzir o número de grupos de instâncias necessários. Você pode especificar até 20 tipos de instância por grupo de instâncias. Para obter mais informações, consulte [Grupos de instâncias flexíveis](sagemaker-hyperpod-scaling-eks.md#sagemaker-hyperpod-scaling-eks-flexible-ig).

## SageMaker HyperPod notas de lançamento: 25 de janeiro de 2026
<a name="sagemaker-hyperpod-release-notes-20260125"></a>

SageMaker HyperPod libera o seguinte para[Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md).

**Novos recursos**
+ Lançou a nova SageMaker HyperPod AMI para o Amazon EKS 1.34. Para obter mais informações, consulte [SageMaker Lançamentos do Hyperpod AMI para Amazon EKS: 25 de janeiro de 2026](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20260125).

Para obter mais informações, consulte [Kubernetes](https://kubernetes.io/blog/2025/08/27/kubernetes-v1-34-release/) v1.34.

## SageMaker HyperPod notas de lançamento: 07 de novembro de 2025
<a name="sagemaker-hyperpod-release-notes-20251107"></a>

SageMaker HyperPod libera o seguinte para[Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md).

**Novos recursos**
+ Patches [SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 07 de novembro de 2025](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20251107) de segurança atualizados.

## SageMaker HyperPod notas de lançamento: 29 de setembro de 2025
<a name="sagemaker-hyperpod-release-notes-20250929"></a>

SageMaker HyperPod libera o seguinte para[Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md).

**Novos recursos**
+ Lançou a nova SageMaker HyperPod AMI para o Amazon EKS 1.33. Para obter mais informações, [SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 29 de setembro de 2025](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250929).
**Importante**  
A API beta do Kubernetes de alocação dinâmica de recursos está ativada por padrão nesta versão.  
Essa API melhora o agendamento e o monitoramento de cargas de trabalho que exigem recursos como. GPUs
Essa API foi desenvolvida pela comunidade de código aberto do Kubernetes e pode mudar em versões futuras do Kubernetes. Antes de usar a API, revise a [documentação do Kubernetes](https://kubernetes.io/docs/concepts/scheduling-eviction/dynamic-resource-allocation/) e entenda como ela afeta suas cargas de trabalho.
HyperPod não está lançando uma AMI HyperPod Amazon Linux 2 para Kubernetes 1.33. AWS recomenda que você migre para o. AL2023 Para obter mais informações, consulte [Atualizar do Amazon Linux 2 para AL2023](https://docs.aws.amazon.com/eks/latest/userguide/al2023.html).

Para obter mais informações, consulte [Kubernetes](https://kubernetes.io/blog/2025/04/23/kubernetes-v1-33-release/) v1.33.

## SageMaker HyperPod notas de lançamento: 4 de agosto de 2025
<a name="sagemaker-hyperpod-release-notes-20250804"></a>

SageMaker HyperPod lança novo público AMIs para orquestração EKS. O público AMIs pode ser usado sozinho ou pode ser usado para criar itens personalizados AMIs. Para obter mais informações sobre o público AMIs, consulte[Lançamentos de AMIs públicas](sagemaker-hyperpod-release-public-ami.md). Para ter mais informações sobre como criar uma AMI, consulte [Imagens personalizadas da Amazon Machine (AMIs) para SageMaker HyperPod clusters](hyperpod-custom-ami-support.md). 

## SageMaker HyperPod notas de lançamento: 31 de julho de 2025
<a name="sagemaker-hyperpod-release-notes-20250731"></a>

SageMaker HyperPod libera o seguinte para[Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md).

**Novos recursos e melhorias**
+ Lançamento de uma nova AMI que atualiza o sistema operacional do Amazon Linux 2 para o Amazon Linux 2023 para clusters do EKS. As principais atualizações incluem Linux Kernel 6.1, Python 3.10, driver 560.35.03 da NVIDIA e o gerenciador de pacotes DNF, que substitui o YUM.
**Importante**  
A atualização do Amazon Linux 2 AL2023 introduz mudanças significativas que podem afetar a compatibilidade com o software e as configurações projetadas para. AL2 É altamente recomendável testar seus aplicativos AL2023 antes de atualizar totalmente seus clusters.

  Para ter mais informações sobre a nova AMI e como atualizar clusters, consulte [SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 31 de julho de 2025](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250731).

## SageMaker HyperPod notas de lançamento: 13 de maio de 2025
<a name="sagemaker-hyperpod-release-notes-20250513"></a>

SageMaker HyperPod libera o seguinte para[Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md).

**Novos recursos e melhorias**
+ Lançamento de uma AMI atualizada que oferece suporte ao Ubuntu 22.04 LTS para clusters do Slurm. Essa versão inclui várias atualizações de componentes de software e sistema para oferecer melhor desempenho, recursos atualizados e segurança aprimorada.
**Importante**  
A atualização do Ubuntu 20.04 LTS para o Ubuntu 22.04 LTS introduz mudanças que podem afetar a compatibilidade com o software e as configurações projetadas para o Ubuntu 20.04.

  Para obter mais informações, consulte:
  + [Principais atualizações na AMI para o Ubuntu 22.04.](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-ami-slurm-ubuntu22-updates)
  + [Atualização para a AMI do Ubuntu 22.04](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-ami-slurm-ubuntu22-upgrade)
  + [Solução de problemas de falhas de atualização](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-ami-slurm-ubuntu22-troubleshoot)

## SageMaker HyperPod notas de lançamento: 1 de maio de 2025
<a name="sagemaker-hyperpod-release-notes-20250501"></a>

SageMaker HyperPod libera o seguinte para[Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md).

**Novos recursos**
+ Foram adicionados relatórios de uso para clusters orquestrados pelo EKS, permitindo que as organizações implementem uma alocação de custos transparente e baseada no uso entre equipes, projetos ou departamentos. Esse recurso complementa a funcionalidade HyperPod de [governança de tarefas](sagemaker-hyperpod-eks-operate-console-ui-governance.md) para garantir uma distribuição justa de custos em ambientes compartilhados com vários inquilinos AI/ML . Para obter mais informações, consulte [Relatar o uso da computação em HyperPod](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-usage-reporting.html).

## SageMaker HyperPod notas de lançamento: 28 de abril de 2025
<a name="sagemaker-hyperpod-release-notes-20250428"></a>

SageMaker HyperPod libera o seguinte para [Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md) [Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md) e.

**Novos recursos e melhorias**
+ Atualização do driver da NVIDIA da versão 550.144.03 para a 550.163.01. Essa atualização visa abordar vulnerabilidades e exposições comuns (CVEs) presentes no Boletim de [Segurança do NVIDIA GPU Display](https://nvidia.custhelp.com/app/answers/detail/a_id/5630) de abril de 2025.

Para ter mais informações sobre lançamentos de AMI, consulte [SageMaker HyperPod Lançamentos da AMI para o Slurm: 28 de abril de 2025](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20250428) e [SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 28 de abril de 2025](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250428).

## SageMaker HyperPod notas de lançamento: 18 de abril de 2025
<a name="sagemaker-hyperpod-release-notes-20250418"></a>

SageMaker HyperPod libera o seguinte para[Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md).

**Novos recursos**
+ Lançou a nova SageMaker HyperPod AMI para o Amazon EKS 1.32.1. Para obter mais informações, consulte [SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 18 de abril de 2025](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250418).

## SageMaker HyperPod notas de lançamento: 10 de abril de 2025
<a name="sagemaker-hyperpod-release-notes-20250410"></a>

SageMaker HyperPod libera o seguinte para[Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md).

**Novos recursos e melhorias**
+ Foi adicionado um tutorial de receita de Otimização de Preferência Direta (DPO) para SageMaker HyperPod com a orquestração do Slurm. Este tutorial de ajuste fino fornece step-by-step orientação para otimizar o alinhamento do modelo usando o método DPO em clusters Slurm alimentados por GPU. SageMaker HyperPod Para obter mais informações, consulte [HyperPod Tutorial de DPO (GPU) do cluster Slurm](hyperpod-gpu-slurm-dpo-tutorial.md).

## SageMaker HyperPod notas de lançamento: 03 de abril de 2025
<a name="sagemaker-hyperpod-release-notes-20250403"></a>

SageMaker HyperPod libera o seguinte para [Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md) [Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md) e.

**Novos recursos e melhorias**
+ Foi adicionada uma página de [início rápido](sagemaker-hyperpod-quickstart.md) para implantar clusters. SageMaker HyperPod A página aproveita os fluxos de trabalho de configuração simplificados dos SageMaker HyperPod workshops especializados e automatiza a implantação usando modelos pré-criados. AWS CloudFormation Ela permite a escolha de infraestrutura, como Slurm ou Amazon EKS, para facilitar a configuração e a implantação de clusters de referência.
+ SageMaker HyperPod agora oferece suporte aos seguintes tipos de instância para clusters Slurm e Amazon EKS.
  + Novos tipos de instância:: I3en, M7i e R7i. Para ver a lista completa de instâncias compatíveis, consulte o campo `InstanceType` em `[ClusterInstanceGroupDetails](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupDetails.html)`.

## SageMaker HyperPod notas de lançamento: 16 de março de 2025
<a name="sagemaker-hyperpod-release-notes-20250316"></a>

SageMaker HyperPod libera o seguinte para [Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md) [Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md) e.

**Novos recursos e melhorias**
+ Foram adicionadas as chaves de condição do IAM a seguir para oferecer um controle de acesso mais granular nas operações de API [https://docs.aws.amazon.com//sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com//sagemaker/latest/APIReference/API_CreateCluster.html) e [https://docs.aws.amazon.com//sagemaker/latest/APIReference/API_UpdateCluster.html](https://docs.aws.amazon.com//sagemaker/latest/APIReference/API_UpdateCluster.html).    
[\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/pt_br/sagemaker/latest/dg/sagemaker-hyperpod-release-notes.html)

## SageMaker HyperPod notas de lançamento: 20 de fevereiro de 2025
<a name="sagemaker-hyperpod-release-notes-20250220"></a>

SageMaker HyperPod libera o seguinte para [Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md) [Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md) e.

**Novos recursos e melhorias**
+ Foi adicionado suporte para excluir grupos de instâncias do seu SageMaker HyperPod cluster. Para ter mais informações, consulte [Excluir grupos de instâncias](smcluster-scale-down.md#smcluster-remove-instancegroup) de clusters orquestrados pelo EKS e [Reduzir a escala verticalmente do cluster](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-scale-down) para clusters orquestrados pelo Slurm. 

## SageMaker HyperPod notas de lançamento: 18 de fevereiro de 2025
<a name="sagemaker-hyperpod-release-notes-20250218"></a>

SageMaker HyperPod libera o seguinte para [Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md) [Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md) e.

**Novos recursos**
+ Esta versão do SageMaker HyperPod incorpora uma atualização de segurança do kit de ferramentas de contêiner da Nvidia (da versão 1.17.3 para a versão 1.17.4). Para ter mais informações, consulte as [notas de lançamento da v1.17.4](https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4). 
**nota**  
Para todas as workloads de contêineres no NVIDIA Container Toolkit versão 1.17.4, a montagem das bibliotecas compatíveis com CUDA agora está desabilitada. Para garantir a compatibilidade com várias versões do CUDA em fluxos de trabalho de contêineres, atualize o `LD_LIBRARY_PATH` para incluir suas bibliotecas compatíveis com CUDA. Você pode encontrar as etapas específicas em [Se você usar uma camada de compatibilidade CUDA](inference-gpu-drivers.md#collapsible-cuda-compat).

Para ter mais informações sobre lançamentos de AMI, consulte [SageMaker HyperPod Lançamentos da AMI para o Slurm: 18 de fevereiro de 2025](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20250218) e [SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 18 de fevereiro de 2025](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250218).

## SageMaker HyperPod notas de lançamento: 06 de fevereiro de 2025
<a name="sagemaker-hyperpod-release-notes-20250206"></a>

SageMaker HyperPod libera o seguinte para [Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md) [Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md) e.

**Novos recursos e melhorias**
+ Suporte aprimorado para SageMaker HyperPod Multi-AZ: você pode especificar diferentes sub-redes e grupos de segurança, abrangendo diferentes zonas de disponibilidade, para grupos de instâncias individuais em seu cluster. Para obter mais informações sobre o suporte SageMaker HyperPod Multi-AZ, consulte[Configurando SageMaker HyperPod clusters em vários AZs](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-multiple-availability-zones).

## SageMaker HyperPod notas de lançamento: 22 de janeiro de 2025
<a name="sagemaker-hyperpod-release-notes-20250122"></a>

**Lançamentos de AMI**
+ [SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 22 de janeiro de 2025](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20250122)

## SageMaker HyperPod notas de lançamento: 09 de janeiro de 2025
<a name="sagemaker-hyperpod-release-notes-20250109"></a>

SageMaker HyperPod libera o seguinte para [Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md) [Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md) e.

**Novos recursos e melhorias**
+  IPv6 Suporte adicional: os clusters podem usar IPv6 endereçamento quando configurados com VPC e IPv6 sub-redes habilitadas. Para obter mais informações, consulte [Configuração SageMaker HyperPod com uma Amazon VPC personalizada](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-optional-vpc).

## SageMaker HyperPod notas de lançamento: 21 de dezembro de 2024
<a name="sagemaker-hyperpod-release-notes-20241221"></a>

SageMaker HyperPod libera o seguinte para [Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md) [Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md) e.

**Novos recursos**
+ SageMaker HyperPod agora oferece suporte aos seguintes tipos de instância para clusters Slurm e Amazon EKS.
  + Novos tipos de instância: C6gn, C6i, M6i e R6i.
  + Novos tipos de instância Trainium: Trn1 e Trn1n.

**Melhorias**
+ Visibilidade aprimorada do registro de erros em log quando o Slurm interrompe trabalhos e impedimento do encerramento desnecessário de etapas de trabalho durante cancelamentos iniciados pelo Slurm.
+ DLAMI base atualizada para p5en para clusters do Slurm e do Amazon EKS.

**Lançamentos de AMI**
+ [SageMaker HyperPod Lançamentos da AMI para o Slurm: 21 de dezembro de 2024](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20241221)
+ [SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 21 de dezembro de 2024](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241221)

## SageMaker HyperPod notas de lançamento: 13 de dezembro de 2024
<a name="sagemaker-hyperpod-release-notes-20241213"></a>

SageMaker HyperPod libera o seguinte para [Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md) [Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md) e.

**Novo atributo**
+ SageMaker HyperPod lança um conjunto de CloudWatch métricas da Amazon para monitorar a integridade e o desempenho dos clusters do SageMaker HyperPod Slurm. Essas métricas estão relacionadas à CPU, GPU, utilização de memória e informações da instância do cluster, como contagem de nós e nós com falha. Esse recurso de monitoramento é ativado por padrão e as métricas podem ser acessadas no `/aws/sagemaker/Clusters` CloudWatch namespace. Você também pode configurar CloudWatch alarmes com base nessas métricas para detectar e resolver proativamente possíveis problemas em seus clusters baseados em HyperPod SLURM. Para obter mais informações, consulte [Métricas do Amazon SageMaker HyperPod Slurm](smcluster-slurm-metrics.md).

**Lançamentos de AMI**
+ [SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 13 de dezembro de 2024](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241213)

## SageMaker HyperPod notas de lançamento: 24 de novembro de 2024
<a name="sagemaker-hyperpod-release-notes-20241124"></a>

SageMaker HyperPod libera o seguinte para [Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md) [Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md) e.

**Novos recursos**
+ Foi adicionado suporte para configurar SageMaker HyperPod clusters em várias zonas de disponibilidade. Para obter mais informações sobre o suporte SageMaker HyperPod Multi-AZ, consulte[Configurando SageMaker HyperPod clusters em vários AZs](sagemaker-hyperpod-prerequisites.md#sagemaker-hyperpod-prerequisites-multiple-availability-zones).

**Lançamentos de AMI**
+ [SageMaker HyperPod Lançamentos da AMI para o Slurm: 24 de novembro de 2024](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20241124)
+ [SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 24 de novembro de 2024](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241124)

## SageMaker HyperPod notas de lançamento: 15 de novembro de 2024
<a name="sagemaker-hyperpod-release-notes-20241115"></a>

SageMaker HyperPod libera o seguinte para [Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md) [Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md) e. Para obter mais informações, consulte [SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 15 de novembro de 2024](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241115) e.

**Novos recursos e melhorias**
+ Foi adicionado suporte aos tipos de instância trn1 e trn1n para clusters orquestrados pelo Amazon EKS e pelo Slurm.
+ Gerenciamento aprimorado de logs para clusters do Slurm:
  +  Alternância de logs implementada: semanal ou diária com base no tamanho.
  +  Definição de alternância de logs para três semanas.
  +  Logs compactados para reduzir o impacto no armazenamento.
  +  Carregamento contínuo de registros CloudWatch para retenção a longo prazo.
**nota**  
Alguns logs ainda são armazenados em syslogs.
+ Ajuste das configurações do Fluent Bit para evitar problemas de rastreamento em arquivos que contém linhas longas.

**Correções de bugs**
+ Impedimento do truncamento indesejado com atualizações de nó do controlador do Slurm no arquivo de configuração `slurm.config`.

**Lançamentos de AMI**
+ [SageMaker HyperPod Lançamentos da AMI para o Slurm: 15 de novembro de 2024](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20241115)
+ [SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 15 de novembro de 2024](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241115)

## SageMaker HyperPod notas de lançamento: 11 de novembro de 2024
<a name="sagemaker-hyperpod-release-notes-20241111"></a>

SageMaker HyperPod libera o seguinte para [Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md) [Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md) e. 

**Novo atributo**
+ SageMaker HyperPod A AMI agora oferece suporte aos tipos de instância G6e.

**Lançamentos de AMI**
+ [SageMaker HyperPod Lançamentos da AMI para o Slurm: 11 de novembro de 2024](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20241111)
+ [SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 11 de novembro de 2024](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241111)

## SageMaker HyperPod notas de lançamento: 31 de outubro de 2024
<a name="sagemaker-hyperpod-release-notes-20241031"></a>

SageMaker HyperPod libera o seguinte para [Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md) [Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md) e.

**Novos recursos**
+ Foi adicionada redução de SageMaker HyperPod clusters no nível do grupo de instâncias e no nível da instância para os clusters orquestrados Amazon EKS e Slurm. Para ter mais informações sobre como reduzir a escala verticalmente de clusters do Amazon EKS, consulte [Reduzindo a escala de um cluster SageMaker HyperPod](smcluster-scale-down.md). Para ter mais informações sobre como reduzir a escala verticalmente de clusters do Slurm, consulte *Reduzir a escala verticalmente de um cluster* em [Gerenciando clusters SageMaker HyperPod do Slurm usando o AWS CLI](sagemaker-hyperpod-operate-slurm-cli-command.md).
+ SageMaker HyperPod agora oferece suporte ao tipo de instância P5e para clusters orquestrados Amazon EKS e Slurm. 

## SageMaker HyperPod notas de lançamento: 21 de outubro de 2024
<a name="sagemaker-hyperpod-release-notes-20241021"></a>

SageMaker HyperPod libera o seguinte para [Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md) [Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md) e.

**Novo atributo**
+ SageMaker HyperPod agora suporta os tipos de instância P5e [n], G6, Gr6 e Trn2 [n] para clusters Slurm e Amazon EKS.

**Lançamentos de AMI**
+ [SageMaker HyperPod Lançamentos da AMI para o Slurm: 21 de outubro de 2024](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20241021)
+ [SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 21 de outubro de 2024](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20241021)

## SageMaker HyperPod notas de lançamento: 10 de setembro de 2024
<a name="sagemaker-hyperpod-release-notes-20240910"></a>

SageMaker HyperPod libera o seguinte para [Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md) [Orquestrando SageMaker HyperPod clusters com o SlurmOrquestração do Slurm](sagemaker-hyperpod-slurm.md) e.

**Novos recursos**
+ Foi adicionado suporte ao Amazon EKS em SageMaker HyperPod. Para saber mais, consulte [Orquestrando SageMaker HyperPod clusters com o Amazon EKS](sagemaker-hyperpod-eks.md).
+ Foi adicionado suporte para gerenciar SageMaker HyperPod clusters por meio do CloudFormation Terraform. Para obter mais informações sobre como gerenciar HyperPod clusters por meio de CloudFormation, consulte a [CloudFormation documentação](https://docs.aws.amazon.com/AWSCloudFormation/latest/UserGuide/aws-resource-sagemaker-cluster.html) do`AWS::SageMaker::Cluster`. Para saber mais sobre o gerenciamento de HyperPod clusters por meio do Terraform, consulte a [documentação do Terraform](https://registry.terraform.io/providers/hashicorp/awscc/latest/docs/data-sources/sagemaker_cluster) para. `awscc_sagemaker_cluster`

**Lançamentos de AMI**
+ [SageMaker HyperPod Lançamentos da AMI para o Slurm: 10 de setembro de 2024](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20240910)
+ [SageMaker HyperPod Lançamentos da AMI para o Amazon EKS: 10 de setembro de 2024](sagemaker-hyperpod-release-ami-eks.md#sagemaker-hyperpod-release-ami-eks-20240910)

## SageMaker HyperPod notas de lançamento: 20 de agosto de 2024
<a name="sagemaker-hyperpod-release-notes-20240820"></a>

SageMaker HyperPod libera o seguinte para[Orquestrando SageMaker HyperPod clusters com o Slurm](sagemaker-hyperpod-slurm.md).

**Novos recursos**
+ Aprimorou a [funcionalidade de SageMaker HyperPod retomada automática](https://docs.aws.amazon.com/sagemaker/latest/dg/sagemaker-hyperpod-resiliency-slurm.html#sagemaker-hyperpod-resiliency-slurm-auto-resume), ampliando a capacidade de resiliência dos nós Slurm conectados ao Generic (GRES). RESources 

  Quando [recursos genéricos (GRES)](https://slurm.schedmd.com/gres.html) são anexados a um nó do Slurm, o Slurm normalmente não permite alterações na alocação do nó, como a substituição de nós, e, portanto, não permite a retomada de um trabalho com falha. A menos que seja explicitamente proibida, a funcionalidade de HyperPod retomada automática coloca automaticamente em fila novamente qualquer trabalho com defeito associado aos nós habilitados para GRES. Esse processo envolve interromper o trabalho, colocá-lo de volta na fila de trabalhos e reiniciar o trabalho desde o início.

**Outras alterações**
+ Pré-embalado [https://slurm.schedmd.com/slurmrestd.html](https://slurm.schedmd.com/slurmrestd.html)na AMI SageMaker HyperPod .
+ Os valores padrão foram `ResumeTimeout` e `UnkillableStepTimeout` de 60 segundos para 300 segundos em `slurm.conf` para melhorar a capacidade de resposta do sistema e o gerenciamento do trabalho.
+ Fizemos pequenas melhorias nas verificações de integridade do NVIDIA Data Center GPU Manager (DCGM) e da NVIDIA System Management Interface (nvidia-smi).

**Correções de bugs**
+ O plug-in de HyperPod retomada automática pode usar nós ociosos para retomar um trabalho.

## SageMaker HyperPod notas de lançamento: 20 de junho de 2024
<a name="sagemaker-hyperpod-release-notes-20240620"></a>

SageMaker HyperPod libera o seguinte para[Orquestrando SageMaker HyperPod clusters com o Slurm](sagemaker-hyperpod-slurm.md).

**Novos recursos**
+ Foi adicionada uma nova capacidade de anexar armazenamento adicional às instâncias SageMaker HyperPod do cluster. Com esse recurso, você pode configurar o armazenamento suplementar no nível de configuração do grupo de instâncias durante os processos de criação ou atualização do cluster, por meio do SageMaker HyperPod console ou do [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html)e. [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateCluster.html) APIs O volume adicional do EBS é anexado a cada instância dentro de um SageMaker HyperPod cluster e montado em. `/opt/sagemaker` Para saber mais sobre como implementá-lo em seu SageMaker HyperPod cluster, consulte a documentação atualizada nas páginas a seguir.
  + [Começando com SageMaker HyperPod](smcluster-getting-started-slurm.md)
  + [SageMaker HyperPod Operações de cluster do Slurm](sagemaker-hyperpod-operate-slurm.md)

  Observe que você precisa atualizar o software do HyperPod cluster para usar esse recurso. Depois de corrigir o software de HyperPod cluster, você pode utilizar esse recurso para SageMaker HyperPod clusters existentes criados antes de 20 de junho de 2024 adicionando novos grupos de instâncias. Esse recurso é totalmente efetivo para qualquer SageMaker HyperPod cluster criado após 20 de junho de 2024.

**Etapas de atualização**
+ Execute o comando a seguir para chamar a [UpdateClusterSoftware](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateClusterSoftware.html)API e atualizar seus HyperPod clusters existentes com a HyperPod DLAMI mais recente. Para obter mais instruções, consulte [Atualizar o software da SageMaker HyperPod plataforma de um cluster](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-update-cluster-software). 
**Importante**  
Faça backup do seu trabalho antes de executar essa API. O processo de aplicação de patches substitui o volume raiz pela AMI atualizada, o que significa que seus dados anteriores armazenados no volume raiz da instância serão perdidos. Certifique-se de fazer backup dos dados do volume raiz da instância no Amazon S3 ou no Amazon FSx for Lustre. Para obter mais informações, consulte [Use o script de backup fornecido pelo SageMaker HyperPod](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-update-cluster-software-backup).

  ```
   aws sagemaker update-cluster-software --cluster-name your-cluster-name
  ```
**nota**  
Observe que você deve executar o AWS CLI comando para atualizar seu HyperPod cluster. A atualização do HyperPod software por meio da interface do SageMaker HyperPod console não está disponível no momento.

## SageMaker HyperPod notas de lançamento: 24 de abril de 2024
<a name="sagemaker-hyperpod-release-notes-20240424"></a>

SageMaker HyperPod libera o seguinte para[Orquestrando SageMaker HyperPod clusters com o Slurm](sagemaker-hyperpod-slurm.md).

**Correções de bugs**
+ Corrigido um bug com o parâmetro `ThreadsPerCore` na API [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_ClusterInstanceGroupSpecification.html). Com a correção, pegue [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_CreateCluster.html)e aplique [https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateCluster.html](https://docs.aws.amazon.com/sagemaker/latest/APIReference/API_UpdateCluster.html) APIs adequadamente a entrada do usuário`ThreadsPerCore`. Essa correção é efetiva em HyperPod clusters criados após 24 de abril de 2024. Se você teve problemas com esse bug e deseja que essa correção seja aplicada ao seu cluster, precisará criar um novo cluster. Faça backup e restaure seu trabalho ao migrar para um novo cluster, seguindo as instruções em [Use o script de backup fornecido pelo SageMaker HyperPod](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-update-cluster-software-backup).

## SageMaker HyperPod notas de lançamento: 27 de março de 2024
<a name="sagemaker-hyperpod-release-notes-20240327"></a>

SageMaker HyperPod libera o seguinte para[Orquestrando SageMaker HyperPod clusters com o Slurm](sagemaker-hyperpod-slurm.md).

**HyperPod patch de software**

A equipe HyperPod de serviço distribui patches de software por meio de[SageMaker HyperPod DLAMI](sagemaker-hyperpod-ref.md#sagemaker-hyperpod-ref-hyperpod-ami). Veja os detalhes a seguir sobre o HyperPod DLAMI mais recente.
+ Nesta versão do HyperPod DLAMI, o Slurm foi criado com REST service `slurmestd` () com suporte a JSON, YAML e JWT.
+ [Slurm](https://slurm.schedmd.com/documentation.html) atualizado para v23.11.3

**Melhorias**
+ Aumento do tempo limite do serviço de retomada automática para 60 minutos.
+ Processo aprimorado de substituição de instâncias para não reiniciar o controlador Slurm.
+ Mensagens de erro aprimoradas da execução de scripts de ciclo de vida, como erros de download e erros de verificação de integridade da instância na inicialização da instância.

**Correções de bugs**
+ Corrigido um bug com o serviço chrony que causava um problema com a sincronização de horário.
+ Corrigido um bug com a análise `slurm.conf`.
+ Corrigido um problema com a biblioteca [NVIDIA `go-dcgm`](https://github.com/NVIDIA/go-dcgm).

## SageMaker HyperPod notas de lançamento: 14 de março de 2024
<a name="sagemaker-hyperpod-release-notes-20240314"></a>

SageMaker HyperPod libera o seguinte para[Orquestrando SageMaker HyperPod clusters com o Slurm](sagemaker-hyperpod-slurm.md).

**Melhorias**
+ HyperPod agora suporta adequadamente a passagem de nomes de partição fornecidos `provisioning_parameters.json` e cria partições apropriadamente com base nas entradas fornecidas. Para obter mais informações sobre a `provisioning_parameters.json`, consulte [Configuração legada: provisioning\$1parameters.json](sagemaker-hyperpod-ref.md#sagemaker-hyperpod-ref-provisioning-forms) e [Personalização de SageMaker HyperPod clusters usando scripts de ciclo de vida](sagemaker-hyperpod-lifecycle-best-practices-slurm.md).

**Lançamentos de AMI**
+ [SageMaker HyperPod Lançamentos da AMI para o Slurm: 14 de março de 2024](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20240314)

## SageMaker HyperPod notas de lançamento: 15 de fevereiro de 2024
<a name="sagemaker-hyperpod-release-notes-20240215"></a>

SageMaker HyperPod libera o seguinte para[Orquestrando SageMaker HyperPod clusters com o Slurm](sagemaker-hyperpod-slurm.md).

**Novos recursos**
+ Foi adicionada uma nova `UpdateClusterSoftware` API para patches SageMaker HyperPod de segurança. Quando os patches de segurança estiverem disponíveis, recomendamos que você atualize os SageMaker HyperPod clusters existentes em sua conta executando`aws sagemaker update-cluster-software --cluster-name your-cluster-name`. Para acompanhar futuros patches de segurança, continue acompanhando esta página de notas de SageMaker HyperPod lançamento da Amazon. Para saber como a API `UpdateClusterSoftware` funciona, consulte [Atualizar o software da SageMaker HyperPod plataforma de um cluster](sagemaker-hyperpod-operate-slurm-cli-command.md#sagemaker-hyperpod-operate-slurm-cli-command-update-cluster-software).

## SageMaker HyperPod notas de lançamento: 29 de novembro de 2023
<a name="sagemaker-hyperpod-release-notes-20231129"></a>

SageMaker HyperPod libera o seguinte para[Orquestrando SageMaker HyperPod clusters com o Slurm](sagemaker-hyperpod-slurm.md).

**Novos recursos**
+ Lançou a Amazon SageMaker HyperPod no AWS re:Invent 2023.

**Lançamentos de AMI**
+ [SageMaker HyperPod Lançamento da AMI para Slurm: 29 de novembro de 2023](sagemaker-hyperpod-release-ami-slurm.md#sagemaker-hyperpod-release-ami-slurm-20231129)