发布说明存档 - AWS Deep Learning AMIs

发布说明存档

发布日期:2025-09-19

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250919

更新
  • 在 CUDA12.8 中,编译的 NCCL 版本从 2.26.5 更新为 2.27.7

发布日期:2025-08-08

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250808

增加
  • 增加了对 P5.4xLarge 实例的支持

更新
  • EFA 升级到 1.43.1

发布日期:2025-07-22

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250722

更新
发布日期:2025-05-16

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250516

增加
  • 增加了对 P6-B200 EC2 实例的支持

更新
  • EFA 安装程序版本从 1.39.0 升级到 1.40.0

  • AWS OFI NCCL 插件版本从 1.13.0-aws 升级到 1.14.2-aws

  • 编译的 NCCL 版本从 2.22.3 更新为 2.26.5

  • 默认 CUDA 版本从 12.6 更新为 12.8

  • Nvidia DCGM 版本从 3.3.9 更新为 4.4.3

发布日期:2025-05-05

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250503

更新
  • GDRCopy 版本从 2.4.1 升级到 2.5.1

发布日期:2025-04-24

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250424

更新
发布日期:2025-02-17

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250214

更新
删除
发布日期:2025-02-07

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250205

增加
  • 在 /usr/local/cuda-12.6 目录中增加了 CUDA Toolkit 版本 12.6

删除
发布日期:2025-01-31

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250131

更新
  • EFA 版本从 1.37.0 升级到 1.38.0

    • EFA 现在捆绑了 AWS OFI NCCL 插件,现在可以在 /opt/amazon/ofi-nccl 而非原来的 /opt/aws-ofi-nccl/ 中找到该插件。如果更新 LD_LIBRARY_PATH 变量,请确保正确修改 OFI NCCL 位置。

  • Nvidia Container Toolkit 版本从 1.17.3 升级到 1.17.4

发布日期:2025-01-17

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250117

更新
发布日期:2024-11-18

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20241115

增加
  • 增加了支持适用于 Lustre 的 Amazon FSx 的软件包。

修改
  • 由于 Ubuntu 内核为解决内核地址空间布局随机化(KASLR)功能中的缺陷而进行了更改,导致 G4Dn/G5 实例无法在 OSS NVIDIA 驱动程序上正常初始化 CUDA。为缓解此问题,该 DLAMI 包括了一项功能,可为 G4Dn 和 G5 实例动态加载专有驱动程序。为了确保您的实例能够正常工作,请为此加载预留一段短暂的初始化时间。

    要查看此服务的状态和运行情况,可以使用以下命令:

sudo systemctl is-active dynamic_driver_load.service active
发布日期:2024-10-23

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20241023

更新
发布日期:2024-10-01

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 20.04)20240930

更新
  • Nvidia 驱动程序和 Fabric Manager 版本从 535.183.01 升级到 550.90.07

  • Nvidia Container Toolkit 版本从 1.16.1 升级到 1.16.2,旨在解决安全漏洞 CVE-2024-0133

  • EFA 版本从 1.32.0 升级到 1.34.0

  • 针对所有 CUDA 版本将 NCCL 升级到最新版本 2.22.3

    • CUDA 12.1、12.2 从 NCCL 版本 2.18.5(基于 CUDA12.2 构建)升级

    • CUDA 12.3 从 NCCL 版本 2.21.5(基于 CUDA12.4 构建)升级

增加
  • 在 /usr/local/cuda-12.4 目录中增加了 CUDA Toolkit 版本 12.4

  • 增加了对 P5e EC2 实例的支持。

发布日期:2024-08-19

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20240816

增加
发布日期:2024-06-06

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20240606

更新
  • Nvidia 驱动程序版本从 535.183.01 更新为 535.161.08

发布日期:2024-05-15

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20240513

删除
  • 由于与最新 Ubuntu 22.04 内核版本不兼容,此次发布中移除了对适用于 Lustre 的 Amazon FSx 的支持。一旦该最新内核版本获得兼容性支持,对于 FSx for Lustre 的支持将被恢复。需要 FSx for Lustre 的客户应继续使用深度学习基础 GPU AMI(Ubuntu 20.04)

发布日期:2024-04-29

AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20240429

增加
  • 适用于 Ubuntu 22.04 的深度学习基础 OSS DLAMI 初始版本