AWS Data Pipeline non è più disponibile per i nuovi clienti. I clienti esistenti di AWS Data Pipeline possono continuare a utilizzare il servizio normalmente. Ulteriori informazioni
Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
EmrCluster
Rappresenta la configurazione di un cluster Amazon EMR. Questo oggetto viene utilizzato da EmrActivity e HadoopActivity per avviare un cluster.
Indice
Pianificatori
I pianificatori forniscono un modo per specificare l'allocazione di risorse e la prioritizzazione dei processi all'interno di un cluster Hadoop. Gli amministratori o gli utenti possono scegliere un pianificatore per diverse classi di utenti e applicazioni. Un pianificatore può usare le code per allocare risorse per utenti e applicazioni. È possibile configurare tali code quando si crea il cluster. È quindi possibile configurare priorità per determinati tipi di lavoro e utenti rispetto ad altri. In questo modo si ottiene un utilizzo efficiente delle risorse del cluster, consentendo a più utenti di inviare dati al cluster. Esistono tre tipi di pianificatori disponibili:
-
FairScheduler
— Tenta di pianificare le risorse in modo uniforme per un periodo di tempo significativo. -
CapacityScheduler
— Utilizza le code per consentire agli amministratori del cluster di assegnare gli utenti a code con priorità e allocazione delle risorse diverse. -
Predefinito: utilizzato dal cluster, che può essere configurato dal sito.
Versioni di rilascio di Amazon EMR
Un rilascio di Amazon EMR è un insieme di applicazioni open source dell'ecosistema di big data. Ogni rilascio comprende diverse applicazioni, componenti e funzioni di Big Data che si sceglie di avere per installare e configurare Amazon EMR quando si crea un cluster. È possibile specificare la versione di rilascio con l'etichetta del rilascio. Le etichette di rilascio sono sotto forma di emr-
Ad esempio, x.x.x
emr-5.30.0
. I cluster Amazon EMR si basano sull'etichetta di rilascio emr-4.0.0
e successivamente utilizzano la releaseLabel
proprietà per specificare l'etichetta di rilascio di un oggetto. EmrCluster
Le versioni precedenti utilizzano la proprietà amiVersion
.
Importante
Tutti i cluster Amazon EMR creati utilizzando la versione 5.22.0 o versioni successive utilizzano Signature Version 4 per autenticare le richieste inviate ad Amazon S3. Alcune versioni di rilascio precedenti utilizzano Signature Version 2. Il supporto di Signature Version 2 è stato interrotto. Per ulteriori informazioni, consulta Amazon S3 Update – SigV2 Deprecation Period Extended and Modified
Considerazioni e limitazioni
Usa la versione più recente di Task Runner
Se si utilizza un EmrCluster
oggetto autogestito con un'etichetta di rilascio, utilizzare la versione più recente di Task Runner. Per ulteriori informazioni sui Task Runner, consulta Lavorare con Task Runner. Puoi configurare i valori delle proprietà per tutte le classificazioni di configurazione di Amazon EMR. Per ulteriori informazioni, consulta Configurazione delle applicazioni nella Amazon EMR Release Guide Proprietà e riferimenti EmrConfiguration agli oggetti.
Support per IMDSv2
In precedenza, AWS Data Pipeline supportata solo IMDSv1. AWS Data Pipeline Supporta IMDSv2 Amazon EMR 5.23.1, 5.27.1 e 5.32 o versioni successive e Amazon EMR 6.2 o versioni successive. IMDSv2 utilizza un metodo orientato alla sessione per gestire meglio l'autenticazione durante il recupero delle informazioni sui metadati dalle istanze. È necessario configurare le istanze per effettuare IMDSv2 chiamate creando risorse gestite dall'utente utilizzando -2.0. TaskRunner
Amazon EMR 5.32 o versioni successive e Amazon EMR 6.x
Le serie di release di Amazon EMR 5.32 o successive e 6.x utilizzano la versione 3.x di Hadoop, che ha introdotto importanti cambiamenti nel modo in cui viene valutato il classpath di Hadoop rispetto alla versione 2.x di Hadoop. Le librerie comuni come Joda-Time sono state rimosse dal classpath.
Se EmrActivity o HadoopActivity esegue un file Jar che ha dipendenze da una libreria rimossa in Hadoop 3.x, il passaggio ha esito negativo e restituisce l'errore o. java.lang.NoClassDefFoundError
java.lang.ClassNotFoundException
Questo può accadere per i file Jar che sono stati eseguiti senza problemi utilizzando le versioni di release di Amazon EMR 5.x.
Per risolvere il problema, devi copiare le dipendenze dei file Jar nel classpath di Hadoop su un EmrCluster
oggetto prima di avviare o il. EmrActivity
HadoopActivity
Forniamo uno script bash per farlo. Lo script bash è disponibile nella seguente posizione, dove si trova MyRegion
la AWS regione in cui viene eseguito l'EmrCluster
oggetto, ad esempio. us-west-2
s3://datapipeline-
MyRegion
/MyRegion
/bootstrap-actions/latest/TaskRunner/copy-jars-to-hadoop-classpath.sh
Il modo di eseguire lo script dipende dal fatto che venga EmrActivity
HadoopActivity
eseguito su una risorsa gestita da AWS Data Pipeline o su una risorsa autogestita.
Se utilizzi una risorsa gestita da AWS Data Pipeline, aggiungi un bootstrapAction
all'EmrCluster
oggetto. bootstrapAction
specifica lo script e i file Jar da copiare come argomenti. È possibile aggiungere fino a 255 bootstrapAction
campi per EmrCluster
oggetto e aggiungere un bootstrapAction
campo a un EmrCluster
oggetto che dispone già di azioni bootstrap.
Per specificare questo script come azione di bootstrap, usa la seguente sintassi, dove si trova la regione in cui JarFileRegion
viene salvato il file Jar e ognuna MyJarFilen
è il percorso assoluto in Amazon S3 di un file Jar da copiare nel classpath Hadoop. Non specificate i file Jar che si trovano nel classpath Hadoop per impostazione predefinita.
s3://datapipeline-
MyRegion
/MyRegion
/bootstrap-actions/latest/TaskRunner/copy-jars-to-hadoop-classpath.sh,JarFileRegion
,MyJarFile1
,MyJarFile2
[, ...]
L'esempio seguente specifica un'azione di bootstrap che copia due file Jar in Amazon S3my-jar-file.jar
: e il. emr-dynamodb-tool-4.14.0-jar-with-dependencies.jar
La regione utilizzata nell'esempio è us-west-2.
{ "id" : "
MyEmrCluster
", "type" : "EmrCluster", "keyPair" : "my-key-pair
", "masterInstanceType" : "m5.xlarge
", "coreInstanceType" : "m5.xlarge
", "coreInstanceCount" : "2
", "taskInstanceType" : "m5.xlarge
", "taskInstanceCount": "2
", "bootstrapAction" : ["s3://datapipeline-us-west-2
/us-west-2
/bootstrap-actions/latest/TaskRunner/copy-jars-to-hadoop-classpath.sh,us-west-2
,s3://path/to/my-jar-file.jar,s3://dynamodb-dpl-us-west-2
/emr-ddb-storage-handler/4.14.0/emr-dynamodb-tools-4.14.0-jar-with-dependencies.jar"] }
È necessario salvare e attivare la pipeline affinché la modifica bootstrapAction
alla nuova abbia effetto.
Se si utilizza una risorsa autogestita, è possibile scaricare lo script nell'istanza del cluster ed eseguirlo dalla riga di comando utilizzando SSH. Lo script crea una directory denominata /etc/hadoop/conf/shellprofile.d
e un file denominato datapipeline-jars.sh
in quella directory. I file jar forniti come argomenti della riga di comando vengono copiati in una directory denominata creata dallo script. /home/hadoop/datapipeline_jars
Se il cluster è configurato in modo diverso, modifica lo script in modo appropriato dopo averlo scaricato.
La sintassi per eseguire lo script sulla riga di comando è leggermente diversa da quella bootstrapAction
mostrata nell'esempio precedente. Utilizza gli spazi anziché le virgole tra gli argomenti, come illustrato nell'esempio seguente.
./copy-jars-to-hadoop-classpath.sh
us-west-2
s3://path/to/my-jar-file.jar s3://dynamodb-dpl-us-west-2
/emr-ddb-storage-handler/4.14.0/emr-dynamodb-tools-4.14.0-jar-with-dependencies.jar
Autorizzazioni Amazon EMR
Quando crei un ruolo IAM personalizzato, valuta attentamente le autorizzazioni minime necessarie al cluster per svolgere il suo lavoro. Assicurati di concedere l'accesso alle risorse richieste, come i file in Amazon S3 o i dati in Amazon RDS, Amazon Redshift o DynamoDB. Se si desidera impostare visibleToAllUsers
su False, il ruolo deve disporre delle autorizzazioni appropriate. Si noti che DataPipelineDefaultRole
non dispone di tali autorizzazioni. È necessario fornire un'unione dei DataPipelineDefaultRole
ruoli DefaultDataPipelineResourceRole
and come ruolo EmrCluster
oggetto oppure creare un ruolo personalizzato per questo scopo.
Sintassi
Campi Object Invocation | Descrizione | Tipo di slot |
---|---|---|
schedule | Questo oggetto viene richiamato entro l'esecuzione di un intervallo di pianificazione. Specificare un riferimento alla pianificazione di un altro oggetto per impostare l'ordine di esecuzione delle dipendenze per questo oggetto. È possibile soddisfare questo requisito impostando esplicitamente una pianificazione sull'oggetto, ad esempio, specificando "schedule": {"ref":
"DefaultSchedule"} . Nella maggior parte dei casi, è meglio inserire il riferimento alla pianificazione nell'oggetto pipeline di default, in modo che tutti gli oggetti possano ereditare tale pianificazione. O, se la pipeline consiste di una struttura di pianificazioni (nidificate all'interno della pianificazione principale), è possibile creare un oggetto padre che dispone di un riferimento alla pianificazione. Per ulteriori informazioni sulle configurazioni di pianificazione opzionali di esempio, consulta https://docs.aws.amazon.com/datapipeline/latest/DeveloperGuide/dp-object-schedule.html |
Oggetto di riferimento, ad esempio "schedule":{"ref":"myScheduleId"} |
Campi opzionali | Descrizione | Tipo di slot |
---|---|---|
actionOnResourceFallimento | L'operazione intrapresa dopo il fallimento di una risorsa per questa risorsa. I valori validi sono"retryall ", che ritenta tutte le attività per il cluster per la durata specificata, e "retrynone ". |
Stringa |
actionOnTaskFallimento | L'operazione intrapresa dopo il fallimento dell'attività per questa risorsa. I valori validi sono "continue", ossia non terminare il cluster, e "terminate". | Stringa |
additionalMasterSecurityGroupIds | L'identificatore dei gruppi di sicurezza principali aggiuntivi del cluster EMR, che segue il modulo sg-01. XXXX6a Per ulteriori informazioni, consulta Amazon EMR Additional Security Groups nella Amazon EMR Management Guide. | Stringa |
additionalSlaveSecurityGroupIds | Identificatore di gruppi di sicurezza slave aggiuntivi del cluster EMR, che segue il modulo sg-01XXXX6a . |
Stringa |
amiVersion | La versione di Amazon Machine Image (AMI) che Amazon EMR utilizza per installare i nodi del cluster. Per ulteriori informazioni, consulta la Guida alla gestione di Amazon EMR. | Stringa |
applications | Applicazioni da installare nel cluster con argomenti separati da virgole. Hive e Pig vengono installati per impostazione predefinita. Questo parametro è applicabile solo ad Amazon EMR versione 4.0 e successive. | Stringa |
attemptStatus | Lo stato segnalato più di recente dall'attività remota. | Stringa |
attemptTimeout | Timeout per il completamento del lavoro in remoto. Se questo campo è impostato, un'attività remota che non viene completata entro il tempo impostato di avvio viene tentata di nuovo. | Periodo |
availabilityZone | La zona di disponibilità in cui eseguire il cluster. | Stringa |
bootstrapAction | Un'operazione da eseguire all'avvio del cluster. Puoi specificare argomenti separati da virgole. Per specificare più operazioni, fino a 255, aggiungere più campi bootstrapAction . Il comportamento predefinito è avviare il cluster senza operazioni di bootstrap. |
Stringa |
configurazione | SecurityConfiguration per il cluster Amazon EMR. Questo parametro è applicabile solo ad Amazon EMR versione 4.0 e successive. | Oggetto di riferimento, ad esempio, "configuration":{"ref":"myEmrConfigurationId"} |
coreInstanceBidPrezzo | Il prezzo Spot massimo che si è disposti a pagare per le EC2 istanze Amazon. Se viene specificato un prezzo di offerta, Amazon EMR utilizza le istanze Spot per il gruppo di istanze. Il prezzo è specificato in USD. | Stringa |
coreInstanceCount | Numero di nodi principali da utilizzare per il cluster. | Numero intero |
coreInstanceType | Il tipo di EC2 istanza Amazon da utilizzare per i nodi principali. Consultare EC2 Istanze Amazon supportate per i cluster Amazon EMR . | Stringa |
coreGroupConfiguration | La configurazione per il gruppo di istanze principali del cluster Amazon EMR. Questo parametro è applicabile solo ad Amazon EMR versione 4.0 e successive. | Oggetto di riferimento, ad esempio “configuration”: {“ref”:
“myEmrConfigurationId”} |
coreEbsConfiguration | La configurazione per i volumi Amazon EBS che verranno collegati a ciascuno dei nodi principali del gruppo principale del cluster Amazon EMR. Per ulteriori informazioni, consulta i tipi di istanza che supportano l'ottimizzazione di EBS nella Amazon EC2 User Guide. | Oggetto di riferimento, ad esempio “coreEbsConfiguration”: {“ref”:
“myEbsConfiguration”} |
customAmiId | Si applica solo ad Amazon EMR 5.7.0 e versioni successive. Speciifica l'ID AMI di un'AMI personalizzata da utilizzare quando Amazon EMR effettua il provisioning delle istanze Amazon EC2 . Può anche essere usato al posto delle azioni di bootstrap per personalizzare le configurazioni dei nodi del cluster. Per ulteriori informazioni, consulta il seguente argomento nella Guida alla gestione di Amazon EMR. Utilizzo di un'AMI personalizzata | Stringa |
EbsBlockDeviceConfig |
Configurazione di un dispositivo a blocchi Amazon EBS richiesto associato al gruppo di istanze. Include un numero specificato di volumi che saranno associati a ogni istanza presente nel gruppo di istanze. Include
|
Oggetto di riferimento, ad esempio “EbsBlockDeviceConfig”: {“ref”:
“myEbsBlockDeviceConfig”} |
emrManagedMasterSecurityGroupId | L'identificatore del gruppo di sicurezza principale del cluster Amazon EMR, che segue la forma di. sg-01XXXX6a Per ulteriori informazioni, consulta Configure Security Groups nella Amazon EMR Management Guide. |
Stringa |
emrManagedSlaveSecurityGroupId | L'identificatore del gruppo di sicurezza slave del cluster Amazon EMR, che segue il modulo. sg-01XXXX6a |
Stringa |
enableDebugging | Abilita il debug nel cluster Amazon EMR. | Stringa |
failureAndRerunModalità | Descrive il comportamento del nodo consumer quando le dipendenze presentano un errore o vengono di nuovo eseguite. | Enumerazione |
hadoopSchedulerType | Il tipo di pianificatore del cluster. I tipi validi sono:
PARALLEL_FAIR_SCHEDULING ,
PARALLEL_CAPACITY_SCHEDULING e
DEFAULT_SCHEDULER . |
Enumerazione |
httpProxy | Host proxy che i clienti utilizzano per connettersi ai servizi AWS. | Oggetto di riferimento, ad esempio «HttpProxy»: {"ref»:» myHttpProxy Id "} |
initTimeout | Il tempo di attesa prima dell'avvio della risorsa. | Periodo |
keyPair | La coppia di EC2 chiavi Amazon da utilizzare per accedere al nodo principale del cluster Amazon EMR. | Stringa |
lateAfterTimeout | Il tempo trascorso dall'inizio della pipeline entro il quale l'oggetto deve essere completato. Viene attivato solo quando il tipo di pianificazione non è impostato su. ondemand |
Periodo |
masterInstanceBidPrezzo | Il prezzo Spot massimo che si è disposti a pagare per le EC2 istanze Amazon. Si tratta di un valore decimale compreso tra 0 e 20,00, esclusi. Il prezzo è specificato in USD. L'impostazione di questo valore abilita le istanze Spot per il nodo master del cluster Amazon EMR. Se viene specificato un prezzo di offerta, Amazon EMR utilizza le istanze Spot per il gruppo di istanze. | Stringa |
masterInstanceType | Il tipo di EC2 istanza Amazon da utilizzare per il nodo principale. Consultare EC2 Istanze Amazon supportate per i cluster Amazon EMR . | Stringa |
masterGroupConfiguration | La configurazione per il gruppo di istanze master del cluster Amazon EMR. Questo parametro è applicabile solo ad Amazon EMR versione 4.0 e successive. | Oggetto di riferimento, ad esempio “configuration”: {“ref”:
“myEmrConfigurationId”} |
masterEbsConfiguration | La configurazione per i volumi Amazon EBS che verranno collegati a ciascuno dei nodi master del gruppo principale nel cluster Amazon EMR. Per ulteriori informazioni, consulta i tipi di istanza che supportano l'ottimizzazione di EBS nella Amazon EC2 User Guide. | Oggetto di riferimento, ad esempio “masterEbsConfiguration”: {“ref”:
“myEbsConfiguration”} |
maxActiveInstances | Il numero massimo di istanze attive simultanee di un componente. Le riesecuzioni non contano ai fini del numero di istanze attive. | Numero intero |
maximumRetries | Numero massimo di tentativi in caso di errore. | Numero intero |
onFail | Un'azione da eseguire quando l'oggetto corrente ha esito negativo. | Oggetto di riferimento, ad esempio, "onFail":{"ref":"myActionId"} |
onLateAction | Azioni che devono essere attivate se un oggetto non è stato ancora pianificato o non è ancora completo. | Oggetto di riferimento, ad esempio, "onLateAction":{"ref":"myActionId"} |
onSuccess | Un'operazione da eseguire quando l'oggetto corrente ha esito positivo. | Oggetto di riferimento, ad esempio, "onSuccess":{"ref":"myActionId"} |
parent | Padre dell'oggetto corrente da cui vengono ereditati gli slot. | Oggetto di riferimento, ad esempio. "parent":{"ref":"myBaseObjectId"} |
pipelineLogUri | L'URI di Amazon S3 (ad esempio 's3://BucketName/Key/ ') per caricare i log per la pipeline. | Stringa |
Regione | Il codice per la regione in cui deve essere eseguito il cluster Amazon EMR. Per impostazione predefinita, il cluster viene eseguito nella stessa regione della pipeline. È possibile eseguire il cluster nella stessa regione del set di dati dipendenti. | Enumerazione |
releaseLabel | Etichetta release per il cluster EMR. | Stringa |
reportProgressTimeout | Timeout per chiamate successive di attività in remoto a reportProgress . Se impostato, le attività in remoto che non presentano avanzamenti nel periodo specificato potrebbero essere considerate bloccate e sono quindi oggetto di un altro tentativo. |
Periodo |
resourceRole | Il ruolo IAM AWS Data Pipeline utilizzato per creare il cluster Amazon EMR. Il ruolo predefinito è DataPipelineDefaultRole . |
Stringa |
retryDelay | La durata del timeout tra due tentativi. | Periodo |
role | Il ruolo IAM è passato ad Amazon EMR per creare EC2 nodi. | Stringa |
runsOn | Campo non consentito su questo oggetto. | Oggetto di riferimento, ad esempio, "runsOn":{"ref":"myResourceId"} |
SecurityConfiguration | L'identificatore della configurazione di sicurezza EMR che verrà applicata al cluster. Questo parametro è applicabile solo ad Amazon EMR versione 4.8.0 e successive. | Stringa |
serviceAccessSecurityGroupId | L'identificatore per il gruppo di sicurezza dell'accesso al servizio del cluster Amazon EMR. | Stringa. Segue la forma sg-01XXXX6a , ad esempio, sg-1234abcd . |
scheduleType | Il tipo di pianificazione consente di specificare se gli oggetti nella definizione di pipeline devono essere programmati all'inizio o alla fine dell'intervallo. I valori sono cron , ondemand e timeseries . La pianificazione timeseries significa che le istanze sono programmate al termine di ogni intervallo. La pianificazione cron significa che le istanze sono programmate all'inizio di ogni intervallo. Una pianificazione ondemand consente di eseguire una pipeline una sola volta, per attivazione. Non è necessario clonare o ricreare la pipeline per eseguirla di nuovo. Se utilizzi una pianificazione ondemand , devi specificarlo nell'oggetto predefinito e deve essere l'unico scheduleType specificato per gli oggetti della pipeline. Per utilizzare le pipeline ondemand , chiama l'operazione ActivatePipeline per ogni esecuzione successiva. |
Enumerazione |
subnetId | L'identificatore della sottorete in cui avviare il cluster Amazon EMR. | Stringa |
supportedProducts | Un parametro che installa software di terze parti su un cluster Amazon EMR, ad esempio una distribuzione di terze parti di Hadoop. | Stringa |
taskInstanceBidPrezzo | Il prezzo Spot massimo che si è disposti a pagare per EC2 le istanze. Un valore decimale compreso tra 0 e 20,00, esclusi. Il prezzo è specificato in USD. Se viene specificato un prezzo di offerta, Amazon EMR utilizza le istanze Spot per il gruppo di istanze. | Stringa |
taskInstanceCount | Numero di nodi di attività da utilizzare per il cluster Amazon EMR. | Numero intero |
taskInstanceType | Il tipo di EC2 istanza Amazon da utilizzare per i task node. | Stringa |
taskGroupConfiguration | La configurazione per il gruppo di attività del cluster Amazon EMR. Questo parametro è applicabile solo ad Amazon EMR versione 4.0 e successive. | Oggetto di riferimento, ad esempio “configuration”: {“ref”:
“myEmrConfigurationId”} |
taskEbsConfiguration | La configurazione per i volumi Amazon EBS che verranno collegati a ciascuno dei nodi di attività del gruppo di attività nel cluster Amazon EMR. Per ulteriori informazioni, consulta i tipi di istanza che supportano l'ottimizzazione di EBS nella Amazon EC2 User Guide. | Oggetto di riferimento, ad esempio “taskEbsConfiguration”: {“ref”:
“myEbsConfiguration”} |
terminateAfter | Termina la risorsa dopo queste numerose ore. | Numero intero |
VolumeSpecification |
Le specifiche del volume Amazon EBS, ad esempio il tipo di volume, IOPS e le dimensioni in Gigibyte (GiB) che verranno richieste per il volume Amazon EBS collegato a un'istanza EC2 Amazon nel cluster Amazon EMR. Il nodo può essere principale, master o di task.
|
Oggetto di riferimento, ad esempio “VolumeSpecification”: {“ref”:
“myVolumeSpecification”} |
useOnDemandOnLastAttempt | Nell'ultimo tentativo di richiesta di una risorsa, effettuare una richiesta per istanze on demand invece che per istanze Spot. In questo modo, se tutti i tentativi precedenti non sono andati a buon fine, l'ultimo tentativo non viene interrotto. | Booleano |
workerGroup | Campo non consentito su questo oggetto. | Stringa |
Campi Runtime | Descrizione | Tipo di slot |
---|---|---|
@activeInstances | Elenco di oggetti di istanze attive attualmente programmate. | Oggetto di riferimento, ad esempio «activeInstances»: {"ref»:» Id "} myRunnableObject |
@actualEndTime | L'ora in cui è terminata l'esecuzione di questo oggetto. | DateTime |
@actualStartTime | L'ora in cui è stata avviata l'esecuzione di questo oggetto. | DateTime |
cancellationReason | CancellationReason se questo oggetto è stato annullato. | Stringa |
@cascadeFailedOn | Descrizione della catena di dipendenza che ha generato l'errore dell'oggetto. | Oggetto di riferimento, ad esempio "cascadeFailedOn«: {" ref»:» myRunnableObject Id "} |
emrStepLog | I log dei passaggi sono disponibili solo per i tentativi di attività di Amazon EMR. | Stringa |
errorId | ID dell'errore se l'oggetto non è riuscito. | Stringa |
errorMessage | Messaggio di errore se l'oggetto non è riuscito. | Stringa |
errorStackTrace | Traccia dello stack di errore se l'oggetto non è riuscito. | Stringa |
@failureReason | Il motivo dell'errore della risorsa. | Stringa |
@finishedTime | L'ora in cui è terminata l'esecuzione di questo oggetto. | DateTime |
hadoopJobLog | I log dei lavori Hadoop sono disponibili sui tentativi di attività di Amazon EMR. | Stringa |
@healthStatus | Lo stato di integrità dell'oggetto che riflette l'esito positivo o negativo dell'ultima istanza dell'oggetto che ha raggiunto lo stato di un'istanza terminata. | Stringa |
@healthStatusFromInstanceId | Id dell'ultimo oggetto dell'istanza che ha raggiunto lo stato terminato. | Stringa |
@ Ora healthStatusUpdated | L'ora in cui lo stato di integrità è stato aggiornato l'ultima volta. | DateTime |
hostname | Il nome host del client che si è aggiudicato il tentativo dell'attività. | Stringa |
@lastDeactivatedTime | L'ora in cui l'oggetto è stato disattivato. | DateTime |
@ latestCompletedRun Ora | L'orario dell'esecuzione più recente durante il quale l'esecuzione è stata completata. | DateTime |
@latestRunTime | L'orario dell'esecuzione più recente durante il quale l'esecuzione è stata pianificata. | DateTime |
@nextRunTime | L'orario dell'esecuzione da programmare come successiva. | DateTime |
reportProgressTime | Il periodo di tempo più recente in cui l'attività remota ha segnalato un progresso. | DateTime |
@scheduledEndTime | L'orario di termine della pianificazione per un oggetto. | DateTime |
@scheduledStartTime | L'orario di inizio della pianificazione per l'oggetto. | DateTime |
@status | Lo stato di questo oggetto. | Stringa |
@version | Versione della pipeline con cui l'oggetto è stato creato. | Stringa |
@waitingOn | La descrizione dell'elenco di dipendenze per cui questo oggetto è in attesa. | Oggetto di riferimento, ad esempio «waitingOn»: {"ref»:» myRunnableObject Id "} |
Campi di sistema | Descrizione | Tipo di slot |
---|---|---|
@error | Errore che descrive il formato oggetto errato. | Stringa |
@pipelineId | L'ID della pipeline a cui appartiene questo oggetto. | Stringa |
@sphere | La posizione di un oggetto nel ciclo di vita. I Component Objects generano Instance Objects che eseguono Attempt Objects. | Stringa |