활동 - AWS Data Pipeline

AWS Data Pipeline 는 더 이상 신규 고객이 사용할 수 없습니다. 의 기존 고객은 평소와 같이 서비스를 계속 사용할 AWS Data Pipeline 수 있습니다. 자세히 알아보기

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

활동

AWS Data Pipeline에서 활동은 수행할 작업을 정의하는 파이프라인 구성요소입니다. AWS Data Pipeline은 한 위치에서 다른 위치로의 데이터 이전, Hive 쿼리 실행 등과 같은 보편적인 시나리오를 수용하는 다수의 사전 패키징된 활동을 제공합니다. 활동은 확장 가능하므로, 자체의 사용자 지정 스크립트를 실행하여 무한한 조합을 지원할 수 있습니다.

AWS Data Pipeline이 지원하는 활동의 유형은 다음과 같습니다.

CopyActivity

한 위치에서 다른 위치로의 데이터 복사.

EmrActivity

Amazon EMR 클러스터 실행.

HiveActivity

Amazon EMR 클러스터 상에서의 Hive 쿼리를 실행합니다.

HiveCopyActivity

고급 데이터 필터링과 S3DataNodeDynamoDBDataNode이(가) 지원되는 Amazon EMR 클러스터에서 Hive 쿼리를 실행합니다.

PigActivity

Amazon EMR 클러스터에서 Pig 스크립트를 실행합니다.

RedshiftCopyActivity

Amazon Redshift에/로부터 복사.

ShellCommandActivity

사용자 지정 UNIX/Linux 셸 명령을 활동으로 실행합니다.

SqlActivity

데이터베이스에서 SQL 쿼리를 실행합니다.

일부 활동은 데이터 및 데이터베이스 스테이징을 특별히 지원합니다. 자세한 내용은 파이프라인 활동으로 데이터 및 테이블 준비 섹션을 참조하세요.