发布说明存档
发布日期:2025-09-19
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250919
更新
在 CUDA12.8 中,编译的 NCCL 版本从 2.26.5 更新为 2.27.7
发布日期:2025-08-08
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250808
增加
增加了对 P5.4xLarge 实例的支持
更新
EFA 升级到 1.43.1
发布日期:2025-07-22
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250722
更新
Nvidia 驱动程序从 570.158.01 升级到 570.172.08 以修复 Nvidia 7 月版安全公告
中披露的 CVE 漏洞
发布日期:2025-05-16
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250516
增加
增加了对 P6-B200 EC2 实例的支持
更新
EFA 安装程序版本从 1.39.0 升级到 1.40.0
AWS OFI NCCL 插件版本从 1.13.0-aws 升级到 1.14.2-aws
编译的 NCCL 版本从 2.22.3 更新为 2.26.5
默认 CUDA 版本从 12.6 更新为 12.8
Nvidia DCGM 版本从 3.3.9 更新为 4.4.3
发布日期:2025-05-05
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250503
更新
GDRCopy 版本从 2.4.1 升级到 2.5.1
发布日期:2025-04-24
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250424
更新
Nvidia 驱动程序版本从 570.124.06 升级到 570.133.20,以解决 2025 年 4 月版 NVIDIA GPU 显示器驱动程序安全公告
中披露的 CVE 漏洞
发布日期:2025-02-17
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250214
更新
NVIDIA Container Toolkit 版本从 1.17.3 更新为 1.17.4
有关更多信息,请查看此处的发布说明页面:https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4
在 Container Toolkit 版本 1.17.4 中,现在禁用挂载 CUDA 兼容性库。为了确保与容器工作流中的多个 CUDA 版本兼容,请确保更新 LD_LIBRARY_PATH 以包含您的 CUDA 兼容性库,如如果您使用 CUDA 兼容层教程中所示。
删除
删除了 NVIDIA CUDA Toolkit
提供的用户空间库 cuobj 和 nvdisasm,以解决 2025 年 2 月 18 日版 NVIDIA CUDA Toolkit 安全公告 中披露的 CVE 漏洞
发布日期:2025-02-07
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250205
增加
在 /usr/local/cuda-12.6 目录中增加了 CUDA Toolkit 版本 12.6
删除
已将 CUDA 版本 12.1 和 12.2 从此 DLAMI 中删除。客户可以使用以下链接从 NVIDIA 安装这些版本
发布日期:2025-01-31
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250131
更新
EFA 版本从 1.37.0 升级到 1.38.0
EFA 现在捆绑了 AWS OFI NCCL 插件,现在可以在 /opt/amazon/ofi-nccl 而非原来的 /opt/aws-ofi-nccl/ 中找到该插件。如果更新 LD_LIBRARY_PATH 变量,请确保正确修改 OFI NCCL 位置。
Nvidia Container Toolkit 版本从 1.17.3 升级到 1.17.4
发布日期:2025-01-17
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20250117
更新
Nvidia 驱动程序版本从 550.127.05 升级到 550.144.03,以解决 2025 年 1 月版 NVIDIA GPU 显示器驱动程序安全公告
中披露的 CVE 漏洞
发布日期:2024-11-18
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20241115
增加
增加了支持适用于 Lustre 的 Amazon FSx 的软件包。
修改
-
由于 Ubuntu 内核为解决内核地址空间布局随机化(KASLR)功能中的缺陷而进行了更改,导致 G4Dn/G5 实例无法在 OSS NVIDIA 驱动程序上正常初始化 CUDA。为缓解此问题,该 DLAMI 包括了一项功能,可为 G4Dn 和 G5 实例动态加载专有驱动程序。为了确保您的实例能够正常工作,请为此加载预留一段短暂的初始化时间。
要查看此服务的状态和运行情况,可以使用以下命令:
sudo systemctl is-active dynamic_driver_load.serviceactive
发布日期:2024-10-23
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20241023
更新
Nvidia 驱动程序版本从 550.90.07 升级到 550.127.05,以解决 2024 年 10 月版 NVIDIA GPU 显示器安全公告
中披露的 CVE 漏洞
发布日期:2024-10-01
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 20.04)20240930
更新
Nvidia 驱动程序和 Fabric Manager 版本从 535.183.01 升级到 550.90.07
Nvidia Container Toolkit 版本从 1.16.1 升级到 1.16.2,旨在解决安全漏洞 CVE-2024-0133
。 EFA 版本从 1.32.0 升级到 1.34.0
针对所有 CUDA 版本将 NCCL 升级到最新版本 2.22.3
CUDA 12.1、12.2 从 NCCL 版本 2.18.5(基于 CUDA12.2 构建)升级
CUDA 12.3 从 NCCL 版本 2.21.5(基于 CUDA12.4 构建)升级
增加
在 /usr/local/cuda-12.4 目录中增加了 CUDA Toolkit 版本 12.4
增加了对 P5e EC2 实例的支持。
发布日期:2024-08-19
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20240816
增加
增加了对 G6e EC2 实例
的支持。
发布日期:2024-06-06
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20240606
更新
Nvidia 驱动程序版本从 535.183.01 更新为 535.161.08
发布日期:2024-05-15
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20240513
删除
由于与最新 Ubuntu 22.04 内核版本不兼容,此次发布中移除了对适用于 Lustre 的 Amazon FSx 的支持。一旦该最新内核版本获得兼容性支持,对于 FSx for Lustre 的支持将被恢复。需要 FSx for Lustre 的客户应继续使用深度学习基础 GPU AMI(Ubuntu 20.04)
。
发布日期:2024-04-29
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Ubuntu 22.04)20240429
增加
适用于 Ubuntu 22.04 的深度学习基础 OSS DLAMI 初始版本