

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

# Risoluzione dei problemi nei cluster con integrazione AWS Batch
<a name="troubleshooting-v3-batch"></a>

Questa sezione fornisce possibili suggerimenti per la risoluzione dei problemi per i cluster con integrazione dello AWS Batch scheduler, in particolare per quanto riguarda i problemi relativi ai nodi principali, ai problemi di elaborazione, agli errori dei processi e agli errori di timeout.

**Topics**
+ [Problemi relativi al nodo principale](#troubleshooting-v3-batch-head-node)
+ [Problemi di calcolo](#troubleshooting-v3-batch-compute-nodes)
+ [Errori del processo](#troubleshooting-v3-batch-job-fail)
+ [Errore Connect timeout sull'URL dell'endpoint](#troubleshooting-v3-batch-connect-timeout)

## Problemi relativi al nodo principale
<a name="troubleshooting-v3-batch-head-node"></a>

È possibile risolvere i problemi di configurazione del nodo principale allo stesso modo di un Slurm cluster (ad eccezione dei log Slurm specifici). Per ulteriori informazioni su questi problemi, consulta [Nodo principale](troubleshooting-v3-scaling-issues.md#troubleshooting-v3-node-init.head-node).

## Problemi di calcolo
<a name="troubleshooting-v3-batch-compute-nodes"></a>

AWS Batch gestisce gli aspetti di scalabilità e calcolo dei tuoi servizi. Se riscontri problemi relativi all'elaborazione, consulta la documentazione AWS Batch [sulla risoluzione dei problemi per ricevere assistenza](https://docs.aws.amazon.com/batch/latest/userguide/troubleshooting.html).

## Errori del processo
<a name="troubleshooting-v3-batch-job-fail"></a>

Se un processo fallisce, puoi eseguire il [`awsbout`](awsbatchcli.awsbout-v3.md) comando per recuperare l'output del processo. Puoi anche eseguire il [`awsbstat`](awsbatchcli.awsbstat-v3.md) comando per ottenere un collegamento ai log dei lavori archiviati da Amazon CloudWatch.

## Errore Connect timeout sull'URL dell'endpoint
<a name="troubleshooting-v3-batch-connect-timeout"></a>

Se i lavori paralleli multinodo falliscono e restituiscono un errore: `Connect timeout on endpoint URL`
+ Nel log `awsbout` di output, verificate che il job sia parallelo a più nodi rispetto all'output: `Detected 3/3 compute nodes. Waiting for all compute nodes to start.`
+ Verifica se la sottorete dei nodi di calcolo è pubblica.

I lavori paralleli multinodo non supportano l'uso di sottoreti pubbliche quando si utilizza in. AWS Batch AWS ParallelCluster Usa una sottorete privata per i nodi e i lavori di elaborazione. *Per ulteriori informazioni, consulta [Considerazioni sull'ambiente di calcolo](https://docs.aws.amazon.com/batch/latest/userguide/multi-node-parallel-jobs.html#mnp-ce) nella Guida per l'utente.AWS Batch * Per configurare una sottorete privata per i nodi di calcolo, consulta. [AWS ParallelCluster con scheduler AWS Batch](network-configuration-v3-batch.md)