AWS Data Pipeline non è più disponibile per i nuovi clienti. I clienti esistenti di AWS Data Pipeline possono continuare a utilizzare il servizio normalmente. Ulteriori informazioni
Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Ec2Resource
Un'istanza Amazon EC2 che esegue il lavoro definito da un'attività di pipeline.
AWS Data Pipeline ora supporta IMDSv2 per l'istanza Amazon EC2, che utilizza un metodo orientato alla sessione per gestire meglio l'autenticazione durante il recupero delle informazioni sui metadati dalle istanze. Una sessione inizia e termina una serie di richieste che il software in esecuzione su un'istanza Amazon EC2 utilizza per accedere ai metadati e alle credenziali dell'istanza Amazon EC2 archiviati localmente. Il software avvia una sessione con una semplice richiesta HTTP PUT a IMDSv2. IMDSv2 restituisce un token segreto al software in esecuzione sull'istanza Amazon EC2, che utilizzerà il token come password per effettuare IMDSv2 richieste di metadati e credenziali.
Nota
Per utilizzare IMDSv2 per la tua istanza Amazon EC2, dovrai modificare le impostazioni, poiché l'AMI predefinita non è compatibile con. IMDSv2 Puoi specificare una nuova versione AMI che puoi recuperare tramite il seguente parametro SSM:. /aws/service/ami-amazon-linux-latest/amzn-ami-hvm-x86_64-ebs
Per informazioni sulle istanze Amazon EC2 predefinite che vengono AWS Data Pipeline create se non specifichi un'istanza, consulta. Istanze Amazon EC2 predefinite per regione AWS
Esempi
EC2-Classic
Importante
Solo AWS gli account creati prima del 4 dicembre 2013 supportano la piattaforma EC2-Classic. Se disponi di uno di questi account, potresti avere la possibilità di creare oggetti EC2Resource per una pipeline in una rete EC2-Classic anziché in un VPC. Ti consigliamo vivamente di creare risorse per tutte le tue pipeline in VPC. Inoltre, se disponi di risorse esistenti in EC2-Classic, ti consigliamo di migrarle su un VPC.
L'oggetto di esempio seguente avvia un'istanza EC2 in EC2-Classic, con alcuni campi opzionali impostati.
{ "id" : "MyEC2Resource", "type" : "Ec2Resource", "actionOnTaskFailure" : "terminate", "actionOnResourceFailure" : "retryAll", "maximumRetries" : "1", "instanceType" : "m5.large", "securityGroups" : [ "test-group", "default" ], "keyPair" : "my-key-pair" }
EC2-VPC
L'oggetto di esempio seguente avvia un'istanza EC2 in un VPC non di default, con alcuni campi opzionali impostati.
{ "id" : "MyEC2Resource", "type" : "Ec2Resource", "actionOnTaskFailure" : "terminate", "actionOnResourceFailure" : "retryAll", "maximumRetries" : "1", "instanceType" : "m5.large", "securityGroupIds" : [ "sg-12345678", "sg-12345678" ], "subnetId": "subnet-12345678", "associatePublicIpAddress": "true", "keyPair" : "my-key-pair" }
Sintassi
| Campi obbligatori | Description | Tipo di slot |
|---|---|---|
| resourceRole | Il ruolo IAM che controlla le risorse a cui può accedere l'istanza Amazon EC2. | Stringa |
| role | Il ruolo IAM AWS Data Pipeline utilizzato per creare l'istanza EC2. | Stringa |
| Campi Object Invocation | Description | Tipo di slot |
|---|---|---|
| schedule |
Questo oggetto viene richiamato entro l'esecuzione di un intervallo di pianificazione. Per impostare l'ordine di esecuzione delle dipendenze per questo oggetto, specificare un riferimento di pianificazione a un altro oggetto. Questa operazione può essere eseguita in uno dei seguenti modi:
|
Oggetto di riferimento, ad esempio |
| Campi opzionali | Description | Tipo di slot |
|---|---|---|
| actionOnResourceFallimento | L'operazione intrapresa dopo il fallimento di una risorsa per questa risorsa. I valori validi sono "retryall" e "retrynone". |
Stringa |
| actionOnTaskFallimento | L'operazione intrapresa dopo il fallimento di un'attività per questa risorsa. I valori validi sono "continue" e "terminate". |
Stringa |
| associatePublicIpIndirizzo | Indica se assegnare automaticamente un indirizzo IP pubblico all'istanza. Se l'istanza è in Amazon EC2 o Amazon VPC, il valore predefinito è. true In caso contrario, il valore predefinito è false. |
Booleano |
| attemptStatus | Lo stato segnalato più di recente dall'attività remota. | Stringa |
| attemptTimeout | Timeout per il completamento del lavoro in remoto. Se questo campo è impostato, un'attività remota che non viene completata entro il tempo impostato di avvio viene tentata di nuovo. | Periodo |
| availabilityZone | La zona di disponibilità in cui avviare l'istanza Amazon EC2. | Stringa |
| disabilitare IMDSv1 | Il valore predefinito è false e abilita entrambi IMDSv1 e IMDSv2. Se lo imposti su true, disabilita IMDSv1 e fornisce solo IMDSv2s | Booleano |
| failureAndRerunModalità | Descrive il comportamento del nodo consumer quando le dipendenze presentano un errore o vengono di nuovo eseguite. | Enumerazione |
| httpProxy | L'host proxy utilizzato dai client per connettersi ai AWS servizi. | Oggetto di riferimento, ad esempio "httpProxy":{"ref":"myHttpProxyId"} |
| imageId | L'ID dell'AMI utilizzato per l'istanza. Per impostazione predefinita, AWS Data Pipeline utilizza il tipo di virtualizzazione AMI HVM. L'AMI specifica IDs utilizzata si basa su una regione. È possibile sovrascrivere l'AMI predefinita specificando l'AMI HVM di tua scelta. Per ulteriori informazioni sui tipi di AMI, consulta Tipi di virtualizzazione dell'AMI Linux e Ricerca di un AMI Linux nella Guida per l'utente di Amazon EC2. |
Stringa |
| initTimeout | Il tempo di attesa prima dell'avvio della risorsa. | Periodo |
| instanceCount | Obsoleta. | Numero intero |
| instanceType | Il tipo di istanza Amazon EC2 da avviare. | Stringa |
| keyPair | Nome della coppia di chiavi. Se avvii un'istanza Amazon EC2 senza specificare una coppia di key pair, non puoi accedervi. | Stringa |
| lateAfterTimeout | Il tempo trascorso dall'inizio della pipeline entro il quale l'oggetto deve essere completato. Viene attivato solo quando il tipo di pianificazione non è impostato su. ondemand |
Periodo |
| maxActiveInstances | Il numero massimo di istanze attive simultanee di un componente. Le riesecuzioni non contano ai fini del numero di istanze attive. | Numero intero |
| maximumRetries | Numero massimo di tentativi in caso di errore. | Numero intero |
| minInstanceCount | Obsoleta. | Numero intero |
| onFail | Un'azione da eseguire quando l'oggetto corrente ha esito negativo. | Oggetto di riferimento, ad esempio "onFail":{"ref":"myActionId"} |
| onLateAction | Azioni che devono essere attivate se un oggetto non è stato ancora pianificato o se è ancora in esecuzione. | Oggetto di riferimento, ad esempio "onLateAction":{"ref":"myActionId"} |
| onSuccess | Un'operazione da eseguire quando l'oggetto corrente ha esito positivo. | Oggetto di riferimento, ad esempio "onSuccess":{"ref":"myActionId"} |
| parent | Padre dell'oggetto corrente da cui vengono ereditati gli slot. | Oggetto di riferimento, ad esempio "parent":{"ref":"myBaseObjectId"} |
| pipelineLogUri | L'URI di Amazon S3 (ad esempio's3://BucketName/Key/') per il caricamento dei log per la pipeline. |
Stringa |
| region | Il codice per la regione in cui deve essere eseguita l'istanza Amazon EC2. Per impostazione predefinita, l'istanza viene eseguita nella stessa regione della pipeline. È possibile eseguire l'istanza nella stessa regione del set di dati dipendenti. | Enumerazione |
| reportProgressTimeout | Timeout per chiamate successive di attività in remoto a reportProgress. Se impostato, le attività in remoto che non presentano avanzamenti nel periodo specificato potrebbero essere considerate bloccate ed essere quindi oggetto di un altro tentativo. |
Periodo |
| retryDelay | La durata del timeout tra due tentativi. | Periodo |
| runAsUser | L'utente che deve eseguire il. TaskRunner | Stringa |
| runsOn | Campo non consentito su questo oggetto. | Oggetto di riferimento, ad esempio, "runsOn":{"ref":"myResourceId"} |
| scheduleType |
Il tipo di pianificazione consente di specificare se gli oggetti nella definizione di pipeline devono essere programmati all'inizio o alla fine dell'intervallo oppure on demand. I valori sono:
|
Enumerazione |
| securityGroupIds | Gli ID di uno o più gruppi di sicurezza Amazon EC2 da utilizzare per le istanze nel pool di risorse. | Stringa |
| securityGroups | Uno o più gruppi di sicurezza Amazon EC2 da utilizzare per le istanze nel pool di risorse. | Stringa |
| spotBidPrice | L'importo massimo per ora per la tua istanza Spot in dollari, un valore decimale compreso tra 0 e 20,00, esclusi. | Stringa |
| subnetId | L'ID della sottorete Amazon EC2 in cui avviare l'istanza. | Stringa |
| terminateAfter | Il numero di ore dopo cui terminare la risorsa. | Periodo |
| useOnDemandOnLastAttempt | Nell'ultimo tentativo di richiesta di una risorsa Spot, effettuare una richiesta per istanze on demand invece che per istanze Spot. In questo modo, se tutti i tentativi precedenti non sono andati a buon fine, l'ultimo tentativo non viene interrotto. | Booleano |
| workerGroup | Campo non consentito su questo oggetto. | Stringa |
| Campi Runtime | Description | Tipo di slot |
|---|---|---|
| @activeInstances | Elenco di oggetti di istanze attive attualmente programmate. | Oggetto di riferimento, ad esempio, "activeInstances":{"ref":"myRunnableObjectId"} |
| @actualEndTime | L'ora in cui è terminata l'esecuzione di questo oggetto. | DateTime |
| @actualStartTime | L'ora in cui è stata avviata l'esecuzione di questo oggetto. | DateTime |
| cancellationReason | cancellationReason se questo oggetto è stato annullato. |
Stringa |
| @cascadeFailedOn | Descrizione della catena di dipendenza che ha generato l'errore dell'oggetto. | Oggetto di riferimento, ad esempio, "cascadeFailedOn":{"ref":"myRunnableObjectId"} |
| emrStepLog | I log dei passaggi sono disponibili solo per i tentativi di attività di Amazon EMR. | Stringa |
| errorId | ID dell'errore se l'oggetto non è riuscito. | Stringa |
| errorMessage | Messaggio di errore se l'oggetto non è riuscito. | Stringa |
| errorStackTrace | Traccia dello stack di errore se l'oggetto non è riuscito. | Stringa |
| @failureReason | Il motivo dell'errore della risorsa. | Stringa |
| @finishedTime | L'ora in cui è terminata l'esecuzione di questo oggetto. | DateTime |
| hadoopJobLog | I log dei lavori Hadoop sono disponibili sui tentativi di attività di Amazon EMR. | Stringa |
| @healthStatus | Lo stato di integrità dell'oggetto che riflette l'esito positivo o negativo dell'ultima istanza dell'oggetto che ha raggiunto lo stato di un'istanza terminata. | Stringa |
| @healthStatusFromInstanceId | Id dell'ultimo oggetto dell'istanza che ha raggiunto lo stato terminato. | Stringa |
| @ Ora healthStatusUpdated | L'ora in cui lo stato di integrità è stato aggiornato l'ultima volta. | DateTime |
| hostname | Il nome host del client che si è aggiudicato il tentativo dell'attività. | Stringa |
| @lastDeactivatedTime | L'ora in cui l'oggetto è stato disattivato. | DateTime |
| @ latestCompletedRun Ora | L'orario dell'esecuzione più recente durante il quale l'esecuzione è stata completata. | DateTime |
| @latestRunTime | L'orario dell'esecuzione più recente durante il quale l'esecuzione è stata pianificata. | DateTime |
| @nextRunTime | L'orario dell'esecuzione da programmare come successiva. | DateTime |
| reportProgressTime | Il periodo di tempo più recente in cui l'attività remota ha segnalato un progresso. | DateTime |
| @scheduledEndTime | L'orario di termine della pianificazione per l'oggetto. | DateTime |
| @scheduledStartTime | L'orario di inizio della pianificazione per l'oggetto. | DateTime |
| @status | Lo stato di questo oggetto. | Stringa |
| @version | Versione della pipeline con cui l'oggetto è stato creato. | Stringa |
| @waitingOn | La descrizione dell'elenco di dipendenze per cui questo oggetto è in attesa. | Oggetto di riferimento, ad esempio "waitingOn":{"ref":"myRunnableObjectId"} |
| Campi di sistema | Description | Tipo di slot |
|---|---|---|
| @error | Errore che descrive il formato oggetto errato. | Stringa |
| @pipelineId | L'ID della pipeline a cui appartiene questo oggetto. | Stringa |
| @sphere | La posizione di un oggetto nel ciclo di vita. I Component Objects generano Instance Objects che eseguono Attempt Objects. | Stringa |