As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Notas de lançamento das versões do Slurm no PCS AWS
Este tópico descreve mudanças importantes para cada versão do Slurm atualmente suportada no AWS PCS. Recomendamos que você analise as alterações entre a versão antiga e a nova ao atualizar seu cluster.
Mudanças implementadas no AWS PCS
-
O Slurm SchedulerParameter requeue_on_resume_failure agora está ativado por padrão.
-
“stderr” foi removido como uma opção para LogTimeFormat, pois foi desativado no Slurm 25.05.
-
AWS O PCS suporta a configuração de pacotes de vários clusters: o nó de login pode acessar vários clusters.
Para obter mais informações sobre o Slurm 25.05, consulte as seguintes publicações:
Mudanças implementadas no AWS PCS
-
AWS O PCS oferece suporte à contabilidade do Slurm. Para obter mais informações, consulte Contabilidade de slurm no PCS AWS.
Para obter mais informações sobre o Slurm 24.11, consulte as seguintes publicações:
Mudanças implementadas no AWS PCS
-
O novo módulo Slurm Step Manager agora está habilitado por padrão no AWS PCS. Esse módulo oferece benefícios significativos ao transferir o gerenciamento de etapas do controlador central para os nós de computação, melhorando substancialmente a simultaneidade do sistema em ambientes com uso intenso de etapas. Para suportar essa configuração e melhor isolar
PrologeEpilogprocessar a execução, novos sinalizadores de prólogo (Contain,Alloc) são habilitados. -
A comunicação hierárquica do controlador para os nós de computação é habilitada para otimizar a comunicação entre nós do Slurm, o que melhora a escalabilidade e o desempenho. Além disso, a configuração de roteamento agora usa listas de nós de partição para comunicações do controlador, em vez do algoritmo de roteamento padrão do plug-in, aprimorando a resiliência do sistema.
-
Um novo plugin de hash
HashPlugin=hash/sha3substitui o anterior.hash/k12 pluginAgora, isso está habilitado por padrão nos clusters AWS PCS. -
Os registros do controlador Slurm agora incluem recursos aprimorados de auditoria para todas as chamadas de procedimento remoto (RPC) de entrada para.
slurmctldOs registros incluem o endereço de origem, o usuário autenticado e o tipo de RPC antes do processamento da conexão.
Para obter mais informações sobre o Slurm 24.05, consulte as seguintes publicações:
Configurações do Slurm que você pode alterar no PCS AWS
-
O
SuspendTimepadrão é.60Use o parâmetroscaleDownIdleTimeInSecondsde configuração AWS PCS para defini-lo. Para obter mais informações, consulte oscaleDownIdleTimeInSecondsparâmetro do tipo deClusterSlurmConfigurationdados na Referência da API AWS PCS. -
O
MaxJobCounteMaxArraySizeé baseado no tamanho escolhido para o cluster. Para obter mais informações, consulte osizeparâmetro da ação daCreateClusterAPI na Referência da API AWS PCS. -
A configuração do
SelectTypeParametersSlurm é padronizada como.CR_CPUVocê pode fornecê-lo como um valorslurmCustomSettingspara defini-lo ao criar um cluster. Para obter mais informações, consulte oslurmCustomSettingsparâmetro da ação daCreateClusterAPI e SlurmCustomSettingna Referência da API AWS PCS. -
Você pode definir
PrologeEpilogno nível do cluster. Você pode fornecê-lo como um valorslurmCustomSettingspara defini-lo ao criar um cluster. Para obter mais informações, consulteCreateClustere SlurmCustomSettingna Referência da API AWS PCS. -
Você pode definir
WeighteRealMemoryno nível do grupo de nós de computação. Você pode fornecê-lo como um valorslurmCustomSettingspara defini-lo ao criar um grupo de nós de computação. Para obter mais informações, consulteCreateComputeNodeGroupe SlurmCustomSettingna Referência da API AWS PCS.