Atividades - AWS Data Pipeline

AWS Data Pipeline não está mais disponível para novos clientes. Os clientes existentes do AWS Data Pipeline podem continuar usando o serviço normalmente. Saiba mais

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Atividades

No AWS Data Pipeline, uma atividade é um componente de pipeline que define o trabalho a ser realizado. O AWS Data Pipeline fornece várias atividades pré-empacotadas que acomodam cenários comuns, como o movimento de dados de um local para outro, a execução de consultas do Hive e assim por diante. As atividades são extensíveis. Assim, você pode executar seus próprios scripts personalizados para oferecer suporte a infinitas combinações.

O AWS Data Pipeline oferece suporte aos seguintes tipos de atividades:

CopyActivity

Copia dados de um local para outro.

EmrActivity

Executa o cluster do Amazon EMR.

HiveActivity

Executa uma consulta do Hive em um cluster do Amazon EMR.

HiveCopyActivity

Executa uma consulta do Hive em um cluster do Amazon EMR com suporte para filtragem avançada de dados, além de suporte a S3 DataNode e a Nó do Dynamo DBData.

PigActivity

Executa um script do Pig em um cluster do Amazon EMR.

RedshiftCopyActivity

Copia dados entre as tabelas do Amazon Redshift.

ShellCommandActivity

Executa um comando shell UNIX/Linux personalizado como uma atividade.

SqlActivity

Executa uma consulta SQL em um banco de dados.

Algumas atividades contam com suporte especial para preparação de dados e tabelas de banco de dados. Para obter mais informações, consulte Preparar dados e tabelas com atividades de pipeline.