发布说明存档
发布日期:2025-09-19
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Amazon Linux 2023)20250919
更新
在 CUDA12.8 中,编译的 NCCL 版本从 2.26.5 更新为 2.27.7
发布日期:2025-08-08
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Amazon Linux 2023)20250808
增加
增加了对 P5.4xLarge 实例的支持
更新
EFA 升级到 1.43.1
发布日期:2025-07-22
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Amazon Linux 2023)20250722
更新
Nvidia 驱动程序从 570.158.01 升级到 570.172.08 以修复 Nvidia 7 月版安全公告
中披露的 CVE 漏洞
发布日期:2025-05-15
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Amazon Linux 2023)20250515
增加
增加了对 P6-B200 EC2 实例
的支持
更新
EFA 安装程序版本从 1.38.1 升级到 1.40.0
GDRCopy 版本从 2.4 升级到 2.5
AWS OFI NCCL 插件版本从 1.13.0-aws 升级到 1.14.2-aws
编译的 NCCL 版本从 2.25.1 更新为 2.26.5
默认 CUDA 版本从 12.6 更新为 12.8
Nvidia DCGM 版本从 3.3.9 更新为 4.4.3
发布日期:2025-04-22
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Amazon Linux 2023)20250421
更新
Nvidia 驱动程序版本从 570.124.06 升级到 570.133.20,以解决 2025 年 4 月版 NVIDIA GPU 显示器驱动程序安全公告
中披露的 CVE 漏洞
发布日期:2025-03-31
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Amazon Linux 2023)20250328
增加
增加了对 NVIDIA GPU 直接存储(GDS)
的支持
发布日期:2025-02-17
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Amazon Linux 2023)20250215
更新
NVIDIA Container Toolkit 版本从 1.17.3 更新为 1.17.4
有关更多信息,请查看此处的发布说明页面:https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4
在 Container Toolkit 版本 1.17.4 中,现在禁用挂载 CUDA 兼容性库。为了确保与容器工作流中的多个 CUDA 版本兼容,请确保更新 LD_LIBRARY_PATH 以包含您的 CUDA 兼容性库,如如果您使用 CUDA 兼容层教程中所示。
删除
删除了 NVIDIA CUDA Toolkit
提供的用户空间库 cuobj 和 nvdisasm,以解决 2025 年 2 月 18 日版 NVIDIA CUDA Toolkit 安全公告 中披露的 CVE 漏洞
发布日期:2025-02-05
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Amazon Linux 2023)20250205
增加
在 /usr/local/cuda-12.6 目录中增加了 CUDA Toolkit 版本 12.6
增加了对 G5 EC2 实例的支持
删除
已将 CUDA 版本 12.1 和 12.2 从此 DLAMI 中删除。需要这些 CUDA Toolkit 版本的客户可以使用以下链接直接从 NVIDIA 安装它们
发布日期:2025-02-03
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Amazon Linux 2023)20250131
更新
EFA 版本从 1.37.0 升级到 1.38.0
EFA 现在捆绑了 AWS OFI NCCL 插件,现在可以在 /opt/amazon/ofi-nccl 而非原来的 /opt/aws-ofi-nccl/ 中找到该插件。如果更新 LD_LIBRARY_PATH 变量,请确保正确修改 OFI NCCL 位置。
Nvidia Container Toolkit 版本从 1.17.3 升级到 1.17.4
发布日期:2025-01-08
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Amazon Linux 2023)20250107
更新
增加了对 G4dn 实例
的支持
发布日期:2024-12-09
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Amazon Linux 2023)20241206
更新
Nvidia Container Toolkit 版本从 1.17.0 升级到 1.17.3
发布日期:2024-11-21
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Amazon Linux 2023)20241121
增加
增加了对 P5en EC2 实例的支持。
更新
EFA 安装程序版本从 1.35.0 升级到 1.37.0
AWS OFI NCCL 插件版本从 1.121-aws 升级到 1.13.0-aws
发布日期:2024-10-30
AMI 名称:深度学习基础 OSS Nvidia 驱动程序 GPU AMI(Amazon Linux 2023)20241030
增加
适用于 Amazon Linux 2023 的深度学习基础 OSS DLAMI 初始版本
已知问题
此 DLAMI 目前不支持 G4dn 和 G5 EC2 实例。AWS 已确认存在一个可能导致 CUDA 初始化失败的不兼容问题,当开源 NVIDIA 驱动程序与 Linux 内核 6.1 版或更新版本共同使用时,该问题会同时影响 G4dn 和 G5 实例系列。该问题影响多个 Linux 发行版,例如 Amazon Linux 2023、Ubuntu 22.04 或更新版本、SUSE Linux Enterprise Server 15 SP6 或更新版本。