发布说明存档 - AWS Deep Learning AMIs

发布说明存档

发布日期:2025-02-17

AMI 名称:深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.18(Ubuntu 22.04)20250215

更新
删除
发布日期:2025-01-20

AMI 名称:深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.18(Ubuntu 22.04)20250118

更新
发布日期:2024-12-09

AMI 名称:深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.18(Ubuntu 22.04)20241206

增加
  • 深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.18(Ubuntu 22.04)系列的初始版本。

    • 软件包括以下内容:

      • "nvidia-driver=550.127.05"

      • "fabric-manager=550.127.05"

      • "cuda=12.5"

      • "cudnn=9.5.1"

      • "efa=1.37.0"

      • "nccl=2.23.4"

      • "aws-nccl-ofi-plugin=v1.13.0-aws"

  • Tensorflow 虚拟环境(激活命令 source /opt/tensorflow/bin/activate)包括以下内容:

    • "tensorflow=2.18.0"

修改
  • 由于 Ubuntu 内核为解决内核地址空间布局随机化(KASLR)功能中的缺陷而进行了更改,导致 G4Dn/G5 实例无法在 OSS Nvidia 驱动程序上正常初始化 CUDA。为缓解此问题,该 DLAMI 包括了一项功能,可为 G4Dn 和 G5 实例动态加载专有驱动程序。为了确保您的实例能够正常工作,请为此加载预留一段短暂的初始化时间。

    • 要查看此服务的状态和运行情况,您可以使用以下命令:

sudo systemctl is-active dynamic_driver_load.service active