发布说明存档
发布日期:2025-08-09
AMI 名称:深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 82.3
增加
增加了对 P5.4xLarge 实例的支持
更新
EFA 升级到 1.43.1
发布日期:2025-04-22
AMI 名称
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 81.2
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 81.2
更新
Nvidia 驱动程序版本从 550.144.03 升级到 550.163.01,以解决 2025 年 4 月版 NVIDIA GPU 显示器驱动程序安全公告
中披露的 CVE 漏洞
发布日期:2025-02-17
AMI 名称
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 80.6
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 80.4
更新
-
NVIDIA Container Toolkit 版本从 1.17.3 更新为 1.17.4
有关更多信息,请查看此处的发布说明页面:https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4
在 Container Toolkit 版本 1.17.4 中,现在禁用挂载 CUDA 兼容性库。为了确保与容器工作流中的多个 CUDA 版本兼容,请务必更新 LD_LIBRARY_PATH 以包含您的 CUDA 兼容性库,如此处“如果您使用 CUDA 兼容层”教程下所示 - https://docs.aws.amazon.com/sagemaker/latest/dg/inference-gpu-drivers.html#collapsible-cuda-compat
删除
删除了 NVIDIA CUDA Toolkit
提供的用户空间库 cuobj 和 nvdisasm,以解决 2025 年 2 月 18 日版 NVIDIA CUDA Toolkit 安全公告 中披露的 CVE 漏洞
发布日期:2025-02-05
AMI 名称
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 80.2
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 80.4
更新
-
EFA 版本从 1.37.0 升级到 1.38.0
EFA 现在捆绑了 AWS OFI NCCL 插件,现在可以在 /opt/amazon/ofi-nccl 而非原来的 /opt/aws-ofi-nccl/ 中找到该插件。如果更新 LD_LIBRARY_PATH 变量,请确保正确修改 OFI NCCL 位置。
发布日期:2025-01-15
AMI 名称
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 80.3
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 80.1
更新
Nvidia 驱动程序版本从 550.127.05 升级到 550.144.03,以解决 2025 年 1 月版 NVIDIA GPU 显示器驱动程序安全公告
中披露的 CVE 漏洞
发布日期:2024-12-09
AMI 名称
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 80.1
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 79.9
更新
Nvidia Container Toolkit 版本从 1.17.0 升级到 1.17.3
发布日期:2024-11-11
AMI 名称
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 79.9
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 79.7
更新
Nvidia Container Toolkit 版本从 1.16.2 升级到 1.17.0,旨在解决安全漏洞 CVE-2024-0134
。
发布日期:2024-10-22
AMI 名称
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 79.6
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 79.6
更新
Nvidia 驱动程序版本从 550.90.07 升级到 550.127.05,以解决 2024 年 10 月版 NVIDIA GPU 显示器安全公告
中披露的 CVE 漏洞
发布日期:2024-10-03
AMI 名称
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 79.3
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 79.3
更新
Nvidia Container Toolkit 版本从 1.16.1 升级到 1.16.2,旨在解决安全漏洞 CVE-2024-0133
。
发布日期:2024-07-18
AMI 名称
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 78.6
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 78.7
更新
从深度学习专有 Nvidia 驱动程序 AMI 中移除了 aws_neuron_pytorch_p38 和 aws_neuron_tensorflow_p38 conda 环境。
从深度学习专有 Nvidia 驱动程序 AMI 中移除了对 Inf1 实例系列的支持。
发布日期:2024-06-06
AMI 名称
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 78.5
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 78.5
更新
Nvidia 驱动程序版本从 535.183.01 更新为 535.161.08
发布日期:2024-05-17
AMI 名称
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 78.1
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 78.1
更新
pytorch_p310 环境中 torchserve
版本从 v0.8.2 更新为 v0.11.0 。
发布日期:2024-05-07
AMI 名称
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 78.0
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 78.0
更新
tensorflow2_p310 环境中 TensorFlow 版本从 2.15 更新为 2.16。
EFA 版本从 1.30 更新为 1.32
AWS OFI NCCL 插件版本从 1.7.4 更新到 1.9.1
-
Nvidia Container Toolkit 版本从 1.13.5 更新为 1.15.0
注意:版本 1.15.0 不包括 nvidia-container-runtime 和 nvidia-docker2 软件包。建议按照 Nvidia Container Toolkit 文档
直接使用 nvidia-container-toolkit 软件包。
增加
增加了包含 CUDA12.3、NCCL 2.21.5、CuDNN 8.9.7 的 CUDA12.3 堆栈
删除
移除了位于 /usr/local/cuda-11.7 的 CUDA11.7 以及位于 /usr/local/cuda-12.0 的 CUDA12.0 堆栈
Nvidia Container Toolkit 版本从 1.13.5 更新为 1.15.0
时,移除了 nvidia-docker2 软件包及其命令 nvidia-docker,因此不再包括 nvidia-container-runtime 和 nvidia-docker2 软件包。
发布日期:2024-04-04
AMI 名称
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 77.0
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 77.0
更新
pytorch_p310 环境中 PyTorch 版本从 2.1 更新为 2.2。
对于 OSS Nvidia 驱动程序 DLAMI,增加了 G6 和 Gr6 EC2 实例支持。有关更多信息,请参阅 EC2 实例选择页面。
发布日期:2024-03-29
AMI 名称
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 76.8
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 76.9
更新
在专有和 OSS Nvidia 驱动程序 DLAMI 中,Nvidia 驱动程序版本从 535.104.12 更新为 535.161.08。
-
每个 DLAMI 支持的新实例如下:
使用专有 Nvidia 驱动程序的深度学习支持 G3(不支持 G3.16x)、P3、P3dn、Inf1
使用 OSS Nvidia 驱动程序的深度学习支持 G4dn、G5、P4d、P4de。
删除
从专有 Nvidia 驱动程序 DLAMI 中移除了 G4dn、G5、G3.16x EC2 实例支持。
版本 76.8
发布日期:2024-03-20
AMI 名称
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 76.8
增加
在专有 Nvidia 驱动程序 AMI 上,增加 awscliv2 为 /usr/local/bin/aws2,同时增加 awscliv1 为 /usr/local/bin/aws
版本 76.7
发布日期:2024-03-20
AMI 名称
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 76.7
增加
在 OSS Nvidia 驱动程序 AMI 上,增加 awscliv2 为 /usr/local/bin/aws2,同时增加 awscliv1 为 /usr/local/bin/aws
-
更新了 OSS Nvidia 驱动程序 DLAMI,支持 G4dn 和 G5,更新后的当前支持如下:
深度学习基础专有 Nvidia 驱动程序 AMI(Amazon Linux 2)支持 P3、P3dn、G3、G5、G4dn。
深度学习基础 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)支持 G4dn、G5、P4、P5。
对于 G4dn、G5、P4、P5,建议使用 OSS Nvidia 驱动程序 DLAMI。
版本 76.3
发布日期:2024-02-14
更新
TensorFlow 版本从 2.13.0 更新为 2.15.0
EFA 版本从 1.29.0 更新为 1.30.0
AWS-OFI-NCCL 版本从 1.7.3-aws 更新为 1.7.4-aws
深度学习专有 Nvidia 驱动程序 AMI 上 Nvidia 驱动程序更新为 535.104.12
深度学习 OSS Nvidia 驱动程序 AMI 上 Nvidia 驱动程序更新为 535.154.05
版本 76.2
发布日期:2024-02-02
AMI 名称
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 76.2
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 76.4
安全性
更新了 runc 包版本以使用针对 CVE-2024-21626
的补丁。
版本 76.1
发布日期:2023-12-27
更新
PyTorch 版本从 2.0.1 更新为 2.1.0
版本 75.1
发布日期:2023-11-17
请参阅 DLAMI 的重要更改
AMI 名称
深度学习 OSS Nvidia 驱动程序 AMI(Amazon Linux 2)版本 75.1
深度学习专有 Nvidia 驱动程序 AMI(Amazon Linux 2)版本 75.1
增加
更新
EFA 版本从 1.26.1 更新为 1.29.0
GDRCopy 版本从 2.3 更新为 2.4