Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Errori di streaming del cluster Amazon EMR
In genere, puoi individuare la causa di un errore di streaming in un file syslog
. Un collegamento a questo file è visualizzato nel riquadro Steps (Fasi).
Gli errori esposti di seguito sono comuni ai cluster di streaming.
Argomenti
I dati sono inviati al mappatore in un formato errato?
Per determinare se è il caso, cerca un messaggio di errore nel file syslog
di un tentativo di attività nei log dei tentativi di attività. Per ulteriori informazioni, consulta Visualizza i file di log di Amazon EMR.
Si è verificato il timeout dello script?
Il timeout predefinito per uno script mappatore o riduttore è di 600 secondi. Se lo script richiede più tempo, il tentativo di attività non riuscirà. Per determinare se si è verificato tale problema, controlla il file syslog
di un tentativo di attività non riuscito nei log dei tentativi di attività. Per ulteriori informazioni, consulta Visualizza i file di log di Amazon EMR.
Puoi modificare il limite di tempo impostando un nuovo valore per l'impostazione di configurazione mapred.task.timeout
. Questa impostazione specifica il numero di millisecondi dopo i quali Amazon EMR terminerà un'attività che non ha letto l'input, scritto l'output o aggiornato la stringa di stato. Puoi aggiornare questo valore passando un ulteriore argomento di streaming -jobconf
mapred.task.timeout=800000
.
Stai passando argomenti di streaming non validi?
Lo streaming di Hadoop supporta solo gli argomenti elencati di seguito. Se passi degli argomenti che non sono tra questi, si verificherà un errore nel cluster.
-blockAutoGenerateCacheFiles -cacheArchive -cacheFile -cmdenv -combiner -debug -input -inputformat -inputreader -jobconf -mapper -numReduceTasks -output -outputformat -partitioner -reducer -verbose
Inoltre, lo streaming Hadoop riconosce solo gli argomenti passati utilizzando la sintassi Java, ovvero preceduti da un solo trattino. Se passi argomenti preceduti da un doppio trattino, si verificherà un errore nel cluster.
Lo script è terminato con un errore?
Se lo script mappatore o riduttore termina con un errore, puoi individuare l'errore nel file stderr
relativo al tentativo di attività non riuscito nei log dei tentativi di attività. Per ulteriori informazioni, consulta Visualizza i file di log di Amazon EMR.