Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS
Las siguientes notas de la versión incluyen las últimas actualizaciones de las versiones de Amazon SageMaker HyperPod AMI para Amazon EKS Orchestration. Cada nota de la versión incluye una lista resumida de los paquetes preinstalados o preconfigurados para el soporte de SageMaker HyperPod DLAMIs Amazon EKS. Cada DLAMI se basa AL2 en la versión 023 y es compatible con una versión específica de Kubernetes. Para ver las versiones HyperPod de DLAMI para la orquestación de Slurm, consulte. SageMaker HyperPod Lanzamientos de AMI para Slurm Para obtener información sobre las versiones de SageMaker HyperPod funciones de Amazon, consulteNotas de SageMaker HyperPod lanzamiento de Amazon.
SageMaker Lanzamientos de AMI de Hyperpod para Amazon EKS: 22 de noviembre de 2025
Actualizaciones generales de la AMI
-
Se publicaron actualizaciones para la AMI de SageMaker Hyperpod para las versiones 1.28, 1.29, 1.30, 1.31, 1.32 y 1.33 de Amazon EKS.
-
La nota de publicación básica de DLAMI está disponible aquí.
SageMaker Compatibilidad con DLAMI de Hyperpod para Amazon EKS
Esta versión incluye las siguientes actualizaciones:
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 7 de noviembre de 2025
Actualizaciones generales de la AMI
-
Se publicaron actualizaciones de SageMaker HyperPod AMI para las versiones 1.28, 1.29, 1.30, 1.31, 1.32 y 1.33 de Amazon EKS.
-
La nota de publicación básica de DLAMI está disponible aquí.
SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS
Esta versión incluye las siguientes actualizaciones:
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 29 de octubre de 2025
Actualizaciones generales de la AMI
-
Se publicaron actualizaciones de SageMaker HyperPod AMI para las versiones 1.28, 1.29, 1.30, 1.31, 1.32 y 1.33 de Amazon EKS.
-
La nota de publicación básica de DLAMI está disponible aquí.
SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS
Esta versión incluye las siguientes actualizaciones:
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 22 de octubre de 2025
AL2x86
nota
Amazon Linux 2 ya está en desuso. La AMI de Kubernetes se basa en AL2 023.
La nota de publicación básica de DLAMI está disponible aquí.
-
Versiones 1.28 - 1.32 de EKS
-
Esta versión contiene los parches de CVE para los paquetes de controladores NVIDIA afectados que se encuentran en el boletín de seguridad de octubre de Nvidia
. -
NVIDIA SMI
NVIDIA-SMI 570.195.03 Driver Version: 570.195.03 CUDA Version: 12.8 -
Versiones principales
nombre del paquete versión framework_version 70 gdr_copy 2.4.1 instancias ec2_compatibles G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en Versión efa 1.43.3 ebs_volume_type gp3 nvidia_driver 570.195.03 ubicación de python_ /3.10 usr/bin/python nvidia_cuda_stack /-12,4 usr/local/cuda-12.1,/usr/local/cuda-12.2,/usr/local/cuda-12.3,/usr/local/cuda ssm_agent_version 3.3.3050.0 versión_núcleo 5.10.244-240.965.amzn2.x86_64 nvidia_container_toolkit_version 1.17.8 ofi_nccl_version 1.16.3 sistema_operativo Amazon Linux 2 default_cuda /-12.1/ usr/local/cuda arquitectura_computacional x86_64 -
Paquetes agregados: no se agregó ningún paquete en esta versión.
-
Paquetes actualizados
nombre del paquete versión anterior nueva versión boto3 1.40.46 1,40,49 botocore 1,40,46 1,40,49 fastapi 0.118.0 0,118.2 bloqueo de archivos 3.19.1 3.20.0 importar lib_metadata 8.7.0 8.0.0 jaraco.context 6.0.1 5.3.0 jaraco.functools 4.3.0 4.0.1 matplotlib 3.10.6 3.10.7 empaquetado 25 24.2 plataformas dirs 4.4.0 4.5.0 propcache 0.4.0 0.4.1 rica 14.1.0 14.2.0 tomli 2.2.1 2.3.0 types-python-dateutil 2.9.0.20250822 2,90,20251008 virtualenv 20,34,0 20,35,1 cliente websocket 1.8.0 1.9.0 -
Paquetes eliminados: no se eliminó ningún paquete en esta versión.
AL20.23x86
La nota de publicación básica de DLAMI está disponible aquí.
-
Versiones 1.28 - 1.32 de EKS. No se ha publicado la versión 1.33 de EKS.
-
Esta versión contiene parches de CVE para los paquetes de controladores NVIDIA afectados que se encuentran en el boletín de seguridad de octubre de Nvidia
. -
NVIDIA SMI
NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0 -
Versiones principales
nombre del paquete versión gdr_copy 2.5.1 instancias ec2_compatibles G4dn, G5, G6, Gr6, G6e, P4d, P4de, P5, P5e, P5en, P6-B200 Versión efa 1.43.3 ebs_volume_type gp3 nvidia_gds_version 1.15.0.42 nvidia_driver 580,95,05 ubicación de python_ /3.9 usr/bin/python nvidia_cuda_stack /-13,0 usr/local/cuda-12.6,/usr/local/cuda-12.8,/usr/local/cuda-12.9,/usr/local/cuda ssm_agent_version 3.3.3050.0 versión_núcleo 6.1.153-175.280.amzn2023.x86_64 nvidia_container_toolkit_version 1.17.8 dcgm_version 4.4.1 ofi_nccl_version 1.16.3 sistema_operativo Amazon Linux 2023.9.20250929 default_cuda /-12,9/ usr/local/cuda arquitectura_computacional x86_64 -
Paquetes agregados: no se agregó ningún paquete en esta versión.
-
Paquetes actualizados
nombre del paquete versión anterior nueva versión boto3 1.40.46 1,40,49 botocore 1,40,46 1,40,49 fastapi 0.118.0 0,118.2 gecopía 2,5-1 2.5.1-1 gercopy-devel 2.5-1 2.5.1-1 gdrcopy-kmod 2,5-1 dkms 2.5.1-1dkms jaraco.context 6.0.1 5.3.0 jaraco.functools 4.3.0 4.0.1 herramientas de más itertools 10.8.0 10.3.0 empaquetado 25 24,2 propcache 0.4.0 0.4.1 pidántico 2.11.10 2.12.0 pydantic_core 2.33.2 2.41.1 rica 14.1.0 14.2.0 types-python-dateutil 2.9.0.20250822 2,90,20251008 escribien_extensiones 4.12.2 4.15.0 virtualenv 20,34,0 20,35,1 cliente websocket 1.8.0 1.9.0 -
Paquetes eliminados: no se eliminó ningún paquete en esta versión.
AL2023 ARM64
La nota de publicación básica de DLAMI está disponible aquí.
-
Versiones 1.31 - 1.33 de EKS.
-
Esta versión contiene los parches de CVE para los paquetes de controladores NVIDIA afectados que se encuentran en el boletín de seguridad de octubre de Nvidia
. -
NVIDIA SMI
NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0 -
Versiones principales
nombre del paquete versión gdr_copy 2,5 instancias ec2_compatibles G5g, P6e-00 GB2 Versión efa 1.43.3 ebs_volume_type gp3 nvidia_driver 580,95,05 ubicación de python_ /3.9 usr/bin/python nvidia_cuda_stack /-13,0 usr/local/cuda-12.6,/usr/local/cuda-12.8,/usr/local/cuda-12.9,/usr/local/cuda ssm_agent_version 3.3.3050.0 versión_núcleo 6.12.46-66.121.amzn2023.aarch64 nvidia_container_toolkit_version 1.17.8 dcgm_version 4.4.1 ofi_nccl_version 1.16.3 sistema_operativo Amazon Linux 2023.9.20250929 default_cuda /-12,9/ usr/local/cuda arquitectura_computacional aarch64 -
Paquetes agregados: no se agregó ningún paquete en esta versión.
-
Paquetes actualizados
nombre del paquete versión anterior nueva versión aiohttp 3.12.15 3.13.0 atrs 25.3.0 25,4,0 boto3 1,40,45 1,40,49 botocore 1,40,45 1,40,49 gatos 25.2.0 253,0 certifi 2025.8.3 202510,5 té 2.17.2-1.amzn2023 2.17.3-1.amzn2023 fastapi 0.118.0 0,118.2 lista congelada 1.7.0 1.8.0 importar lib_metadata 8.7.0 8.0.0 jaraco.context 5.3.0 6.0.1 multidicto 6.6.4 6.7.0 narvales 2.6.0 2.7.0 nh3 0.3.0 0.3.1 propcache 0.3.2 0.4.1 pidántico 2.11.9 2.12.0 pydantic_core 2.33.2 2.41.1 pylint 3.3.8 3.3.9 python-json-logger 3.3.0 4.0.0 rica 14.1.0 14.2.0 tomli 2.2.1 2.0.1 types-python-dateutil 2.9.0.20250822 2,90,20251008 virtualenv 20,34,0 20,35,1 cliente websocket 1.8.0 1.9.0 yarl 1.20.1 1.22.0 zipp 3.19.2 3,23,0 -
Paquetes eliminados: en esta versión no se ha eliminado ningún paquete.
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 29 de septiembre de 2025
Actualizaciones generales de la AMI
-
Publicó la nueva SageMaker HyperPod AMI para Amazon EKS 1.33. Para obtener más información, consulte las versiones de SageMaker HyperPod AMI para Amazon EKS: 29 de septiembre de 2025.
importante
La versión beta de Kubernetes de la API de asignación dinámica de recursos está habilitada de forma predeterminada en esta versión.
-
Esta API mejora la programación y el monitoreo de las cargas de trabajo que requieren recursos como: GPUs
-
Esta API fue desarrollada por la comunidad de código abierto de Kubernetes y podría cambiar en futuras versiones de Kubernetes. Antes de usar la API, consulta la documentación de Kubernetes
y comprende cómo afecta a tus cargas de trabajo.
-
-
HyperPod no está publicando una AMI de HyperPod Amazon Linux 2 para Kubernetes 1.33. AWSrecomienda migrar a la versión 0.23. AL2 Para obtener más información, consulte Actualización de Amazon Linux 2 a AL2 023.
Para obtener más información, consulte Kubernetes
SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS
Esta versión incluye las siguientes actualizaciones:
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 25 de agosto de 2025
SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS
Esta versión incluye las siguientes actualizaciones:
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 12 de agosto de 2025
La AMI incluye lo siguiente:
-
AWSServicio compatible: Amazon EC2
-
Sistema operativo: Amazon Linux 2023
-
Arquitectura de cómputo: ARM64
-
La última versión disponible está instalada para los siguientes paquetes:
-
Núcleo de Linux: 6.12
-
FSx Lustre
-
Docker
-
AWS CLIv2 en
/usr/bin/aws -
DCGM de NVIDIA
-
Kit de herramientas de contenedor de NVIDIA:
-
Comando de versión:
nvidia-container-cli -V
-
-
Nvidia-Docker2:
-
Comando de versión:
nvidia-docker version
-
-
NVIDIA-IMEX: v570.172.08-1
-
-
Controlador NVIDIA: 570.158.01
-
Pila NVIDIA CUDA 12.4, 12.5, 12.6, 12.8:
-
Directorios de instalación de CUDA, NCCL y CUDDN:
/usr/local/cuda-xx.x/-
Ejemplo:
/usr/local/cuda-12.8/,/usr/local/cuda-12.8/
-
-
Versión NCCL compilada:
-
Para el directorio CUDA de 12.4, compiló la versión 2.22.3+ .4 de NCCL. CUDA12
-
Para el directorio CUDA de 12.5, compiló la versión 2.22.3+ .5 de NCCL CUDA12
-
Para el directorio CUDA de 12.6, compiló la versión 2.24.3+ .6 de NCCL CUDA12
-
Para el directorio CUDA de 12.8, compiló la versión 2.27.5+ .8 de NCCL CUDA12
-
-
CUDA predeterminado: 12.8
-
PATH
/usr/local/cudaapunta a CUDA 12.8 -
Se han actualizado las siguientes variables de entorno:
-
LD_LIBRARY_PATHtener/usr/local/cuda-12.8/lib:/usr/local/cuda-12.8/lib64:/usr/local/cuda-12.8:/usr/local/cuda-12.8/targets/sbsa-linux/lib:/usr/local/cuda-12.8/nvvm/lib64:/usr/local/cuda-12.8/extras/CUPTI/lib64 -
PATHtener/usr/local/cuda-12.8/bin/:/usr/local/cuda-12.8/include/ -
Para cualquier versión de CUDA diferente, actualícela
LD_LIBRARY_PATHen consecuencia.
-
-
-
-
Instalador de EFA: 1.42.0
-
Nvidia: 2.5.1 GDRCopy
-
AWSEl complemento OFI NCCL viene con el instalador EFA
-
Las rutas
/opt/amazon/ofi-nccl/liby/opt/amazon/ofi-nccl/efase añaden a.LD_LIBRARY_PATH
-
-
AWS CLIv2 en
/usr/local/bin/aws -
Tipo de volumen EBS: gp3
-
Python:
/usr/bin/python3.9
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 6 de agosto de 2025
SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS
AMIs Incluyen las siguientes actualizaciones:
importante
-
AMI base con controlador NVIDIA de código abierto para aprendizaje profundo (Amazon Linux 2) versión 70.3
-
AMI de base de aprendizaje profundo de controlador propietario Nvidia (Amazon Linux 2) versión 68.4
-
Compatibilidad con la versión 12.8 de CUA más reciente
-
Se ha actualizado el controlador Nvidia de 570.158.01 a 570.172.08 para corregir los CVE, tal como aparece en el NVIDIA Security Bulletin de julio.
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 31 de julio de 2025
Amazon SageMaker HyperPod ahora admite una nueva AMI para los clústeres de Amazon EKS que actualiza el sistema operativo base a Amazon Linux 2023. Esta versión proporciona varias mejoras con respecto a Amazon Linux 2 (AL2). HyperPod publica nuevas versiones AMIs periódicamente, y le recomendamos que ejecute todos sus HyperPod clústeres en las versiones más recientes y seguras de AMIs para abordar las vulnerabilidades y eliminar gradualmente el software y las bibliotecas obsoletos.
Mejoras clave
-
Sistema operativo: Amazon Linux 2023 (actualizado desde Amazon Linux 2 o AL2)
-
Package Manager: DNF es la herramienta de administración de paquetes predeterminada, que reemplaza a YUM utilizada en AL2
-
Servicio de red:
systemd-networkdadministra las interfaces de red, reemplazando el ISC utilizado endhclientAL2 -
Núcleo de Linux: versión 6.1, actualizada desde el núcleo utilizado en AL2
-
Glibc: versión 2.34, actualizada desde la versión de AL2
-
GCC: versión 11.5.0, actualizada desde la versión de AL2
-
NFS: versión 1:2.6 .1, actualizada desde la versión 1:1.3 .4 en AL2
-
Controlador NVIDIA: versión 570.172.08, una versión más actual del controlador
-
Python: versión 3.9, que reemplaza a Python 2.7 utilizado en AL2
-
NVME: versión 1.11.1, una versión más reciente del controlador NVMe
Antes de la actualización
Hay algunos puntos importantes que debe saber antes de actualizar la versión. Con la AL2 023, se han agregado, actualizado o eliminado varios paquetes en comparación con. AL2 Le recomendamos encarecidamente que pruebe sus aplicaciones con el AL2 023 antes de actualizar los clústeres. Para obtener una lista completa de todos los cambios de paquetes en AL2 023, consulte Package changes in Amazon Linux 2023.
Los siguientes son algunos de los cambios importantes entre el 1 AL2 y el AL2 023:
-
Python 3.10: La actualización más importante, aparte del sistema operativo, es la actualización de la versión Python. Tras la actualización, los clústeres tienen Python 3.10 por defecto. Si bien algunas cargas de trabajo de entrenamiento distribuidas de Python 3.8 pueden ser compatibles con Python 3.10, te recomendamos encarecidamente que pruebes tus cargas de trabajo específicas por separado. Si la migración a Python 3.10 resulta difícil, pero aun así desea actualizar su clúster para incluir otras funciones nuevas, puede instalar una versión anterior de Python mediante el comando
yum install python-xx.xcon scripts de ciclo de vida antes de ejecutar cualquier carga de trabajo. Asegúrese de probar la compatibilidad tanto de los scripts de ciclo de vida existentes como del código de la aplicación. -
Aplicación del entorno de ejecución de NVIDIA: el AL2 023 aplica estrictamente los requisitos de tiempo de ejecución de los contenedores de NVIDIA, lo que provoca que los contenedores con variables de entorno NVIDIA codificadas (por ejemplo
NVIDIA_VISIBLE_DEVICES: "all") fallen en los nodos que solo funcionan con CPU (mientras que AL2 ignora esta configuración cuando no hay controladores de GPU). Puede anular la aplicación configurando las especificaciones de su pod o utilizando imágenes solo deNVIDIA_VISIBLE_DEVICES: "void"la CPU. -
cgroup v2: AL2 023 presenta la siguiente generación de jerarquías unificadas de grupos de control (cgroup v2). cgroup v2 se usa para tiempos de ejecución de contenedores y también lo usa.
systemdSi bien AL2 023 sigue incluyendo código que puede hacer que el sistema funcione con cgroup v1, no se recomienda esta configuración. -
El CNI de Amazon VPC y sus
eksctlversiones: AL2 023 también requiere que la versión del CNI de Amazon VPC sea 1.16.2 o superior y que la versión sea 0.176.0 o superior.eksctl -
EFA on FSx for Lustre: ahora puede usar EFA on FSx for Lustre, que le permite lograr un rendimiento de aplicaciones comparable al de los clústeres locales AI/ML o de HPC (computación de alto rendimiento) y, al mismo tiempo, beneficiarse de la escalabilidad, flexibilidad y elasticidad de la computación en nube.
Además, la actualización a AL2 023 requiere como mínimo la versión 1.0.643.0_1.0.192.0 de Health Monitoring Agent. Complete el siguiente procedimiento para actualizar el Health Monitoring Agent:
-
Si utiliza scripts de HyperPod ciclo de vida del GitHub repositorio awsome-distributed-training
, asegúrese de obtener la versión más reciente. Las versiones anteriores no son compatibles con la AL2 023. El nuevo script de ciclo de vida garantiza que se containerdutilice el almacenamiento adicional montado para extraer las imágenes de los contenedores de la AL2 023. -
Obtenga la última versión del repositorio git de HyperPod CLI
. -
Actualice las dependencias con el siguiente comando:
helm dependencies update helm_chart/HyperPodHelmChart -
Como se menciona en el paso 4 del archivo README de HyperPodHelmChart
, ejecuta el siguiente comando para actualizar la versión de las dependencias que se ejecutan en el clúster: helm upgrade dependencies helm_chart/HyperPodHelmChart -namespace kube-system
Cargas de trabajo que se han probado en clústeres EKS actualizados
Los siguientes son algunos casos de uso en los que se probó la actualización:
-
Compatibilidad con versiones anteriores: los trabajos de formación distribuidos más populares que implican PyTorch deberían ser compatibles con versiones anteriores en la nueva AMI. Sin embargo, dado que sus cargas de trabajo pueden depender de bibliotecas específicas de Python o Linux, le recomendamos que primero realice pruebas en una escala más pequeña o en un subconjunto de nodos antes de actualizar los clústeres más grandes.
-
Pruebas de aceleración: se han probado trabajos en varios tipos de instancias, utilizando aceleradores NVIDIA (para las familias de instancias P y G) y aceleradores AWS Neuron (para las instancias Trn).
Cómo actualizar la AMI y las cargas de trabajo asociadas
Puede crear una AMI personalizada utilizando uno de los métodos siguientes:
-
Utilice la API create-cluster para crear un clúster nuevo con la AMI más reciente.
-
Usa la update-cluster-softwareAPI para actualizar tu clúster actual. Tenga en cuenta que esta opción vuelve a ejecutar cualquier script de ciclo de vida.
El clúster no está disponible durante la actualización. Recomendamos planificar este tiempo de inactividad y reiniciar la carga de trabajo de entrenamiento desde un punto de comprobación existente una vez finalizada la actualización. Como práctica recomendada, le recomendamos que realice pruebas en un clúster más pequeño antes de actualizar los clústeres más grandes.
Si el comando update falla, identifique primero la causa del error. En caso de errores en los scripts del ciclo de vida, efectúe las correcciones necesarias en los scripts y vuelva a intentarlo. Para cualquier otro problema que no se pueda resolver, póngase en contacto con AWS Support
Resolución de problemas
Usa la siguiente sección como ayuda para solucionar cualquier problema que surja al actualizar a la versión AL2 023.
¿Cómo puedo corregir errores, por ejemplo, "nvml error: driver
not loaded: unknown" en los nodos de un clúster que solo utilizan CPU?
Si los contenedores que funcionaban en los nodos AL2 Amazon EKS de la CPU ahora fallan en AL2 023, es posible que la imagen del contenedor tenga variables de entorno NVIDIA codificadas de forma rígida. Puede comprobarlo si hay variables de entorno codificadas de forma rígida con el siguiente comando:
docker inspect image:tag | grep -i nvidia
AL2El 023 aplica estrictamente estos requisitos, mientras que es más indulgente con los nodos que AL2 solo utilizan CPU. Una solución consiste en anular la aplicación AL2 023 configurando determinadas variables de entorno de NVIDIA en la especificación del pod de Amazon EKS, como se muestra en el siguiente ejemplo:
yaml containers: - name: your-container image: your-image:tag env: - name: NVIDIA_VISIBLE_DEVICES value: "void" - name: NVIDIA_DRIVER_CAPABILITIES value: ""
Otra alternativa es utilizar imágenes de contenedor que solo estén en la CPU (por ejemplopytorch/pytorch:latest-cpu) o crear imágenes personalizadas sin depender de NVIDIA.
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 15 de julio de 2025
SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS
AMIs Incluyen las siguientes actualizaciones:
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 9 de junio de 2025
SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 22 de mayo de 2025
Actualizaciones generales de la AMI
SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 7 de mayo de 2025
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 28 de abril de 2025
Mejoras de K8s
-
Se ha actualizado el controlador NVIDIA de la versión 550.144.03 a la 550.163.01. Esta actualización tiene como objetivo abordar las vulnerabilidades y exposiciones comunes (CVEs) presentes en el boletín de seguridad de las pantallas de las GPU de NVIDIA de abril de 2025
.
SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 18 de abril de 2025
Actualizaciones generales de la AMI
-
Nueva SageMaker HyperPod AMI para Amazon EKS 1.32.1.
SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS
AMIs Entre ellas se incluyen las siguientes:
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 18 de febrero de 2025
Mejoras de K8s
-
Se ha actualizado el kit de herramientas de contenedores de Nvidia de la versión 1.17.3 a la versión 1.17.4.
-
Se ha solucionado el problema por el que los clientes no podían conectarse a los nodos después de reiniciar.
-
Actualización de la versión del Elastic Fabric Adapter (EFA) de 1.37.0 a 1.38.0.
-
La EFA ahora incluye el complemento AWS OFI NCCL, que se encuentra en el
/opt/amazon/ofi-nccldirectorio en lugar de en la ruta original./opt/aws-ofi-nccl/Si necesita actualizar la variable de entornoLD_LIBRARY_PATH, asegúrese de modificar la ruta para que apunte hacia la nueva ubicación/opt/amazon/ofi-nccldel complemento OFI NCCL. -
Se ha eliminado el paquete emacs de estos. DLAMIs Puede instalar emacs desde emac GNU.
SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 22 de enero de 2025
Actualizaciones generales de la AMI
-
Nueva SageMaker HyperPod AMI para Amazon EKS 1.31.2.
SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS
AMIs Entre ellas se incluyen las siguientes:
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 21 de diciembre de 2024
SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS
AMIs Entre ellas se incluyen las siguientes:
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 13 de diciembre de 2024
SageMaker HyperPod Actualización de DLAMI para Amazon EKS
-
Se ha actualizado el agente SSM a la versión
3.3.1311.0.
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 24 de noviembre de 2024
Actualizaciones generales de la AMI
-
Publicado en la región
MEL(Melbourne). -
Se actualizó el DLAMI SageMaker HyperPod base a las siguientes versiones:
-
Kubernetes: 1/11/2024
-
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 15 de noviembre de 2024
SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS
AMIs Entre ellas se incluyen las siguientes:
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 11 de noviembre de 2024
Actualizaciones generales de la AMI
-
SageMaker HyperPod DLAMI actualizado con las versiones 1.28.13, 1.29.8 y 1.30.4 de Amazon EKS.
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 21 de octubre de 2024
Actualizaciones generales de la AMI
-
Se actualizó el DLAMI SageMaker HyperPod base a las siguientes versiones:
-
Amazon EKS: 1.28.11, 1.29.6 y 1.30.2.
-
SageMaker HyperPod Lanzamientos de AMI para Amazon EKS: 10 de septiembre de 2024
SageMaker HyperPod Compatibilidad con DLAMI para Amazon EKS
AMIs Entre ellas se incluyen las siguientes: