As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Cenário 3: Uma instância spot que executa trabalhos de vários nós é interrompida
O trabalho falha com um código de estado deNODE_FAIL, e o trabalho é colocado novamente na fila (a menos que tenha --no-requeue sido especificado quando o trabalho foi enviado). Se o nó for estático, ele será substituído. Se o nó for um nó dinâmico, o nó será encerrado e redefinido. Outros nós que estavam executando os trabalhos encerrados podem ser alocados a outros trabalhos pendentes, ou reduzidos depois que o tempo configurado SlurmSettings / ScaledownIdletime tiver passado.