运行 MPI 作业 - AWS ParallelCluster

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

运行 MPI 作业

请按照 SchedMD 中的建议,使用 Slurm 作为 MPI 引导方法来引导 MPI 作业。有关更多信息,请参阅官方 Slurm 文档或 MPI 库的官方文档。

例如,通过 IntelMPI 官方文档,您可知道在运行 StarCCM 作业时,必须通过导出环境变量 I_MPI_HYDRA_BOOTSTRAP=slurm,将 Slurm 设置为进程编排工具。

注意

已知问题

如果您的 MPI 应用程序依赖于 SSH 作为生成 MPI 作业的机制,则 Slurm 中的已知错误可能会导致将目录用户名错误地解析为“nobody”。

请将您的应用程序配置为使用 Slurm 作为 MPI 引导方法,或者参阅“问题排查”一节中的用户名解析的已知问题以了解更多详细信息以及可能的解决方法。