发布说明存档
发布日期:2025-02-17
AMI 名称:深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.18(Ubuntu 22.04)20250215
更新
NVIDIA Container Toolkit 版本从 1.17.3 更新为 1.17.4
有关更多信息,请查看此处的发布说明页面:https://github.com/NVIDIA/nvidia-container-toolkit/releases/tag/v1.17.4
在 Container Toolkit 版本 1.17.4 中,现在禁用挂载 CUDA 兼容性库。为了确保与容器工作流中的多个 CUDA 版本兼容,请确保更新 LD_LIBRARY_PATH 以包含您的 CUDA 兼容性库,如如果您使用 CUDA 兼容层教程中所示。
删除
删除了 NVIDIA CUDA Toolkit
提供的用户空间库 cuobj 和 nvdisasm,以解决 2025 年 2 月 18 日版 NVIDIA CUDA Toolkit 安全公告 中披露的 CVE 漏洞
发布日期:2025-01-20
AMI 名称:深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.18(Ubuntu 22.04)20250118
更新
Nvidia 驱动程序版本从 550.90.07 升级到 550.127.05,以解决 2025 年 1 月版 NVIDIA GPU 显示器驱动程序安全公告
中披露的 CVE 漏洞
发布日期:2024-12-09
AMI 名称:深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.18(Ubuntu 22.04)20241206
增加
深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.18(Ubuntu 22.04)系列的初始版本。
软件包括以下内容:
"nvidia-driver=550.127.05"
"fabric-manager=550.127.05"
"cuda=12.5"
"cudnn=9.5.1"
"efa=1.37.0"
"nccl=2.23.4"
"aws-nccl-ofi-plugin=v1.13.0-aws"
Tensorflow 虚拟环境(激活命令 source /opt/tensorflow/bin/activate)包括以下内容:
"tensorflow=2.18.0"
修改
由于 Ubuntu 内核为解决内核地址空间布局随机化(KASLR)功能中的缺陷而进行了更改,导致 G4Dn/G5 实例无法在 OSS Nvidia 驱动程序上正常初始化 CUDA。为缓解此问题,该 DLAMI 包括了一项功能,可为 G4Dn 和 G5 实例动态加载专有驱动程序。为了确保您的实例能够正常工作,请为此加载预留一段短暂的初始化时间。
要查看此服务的状态和运行情况,您可以使用以下命令:
sudo systemctl is-active dynamic_driver_load.serviceactive