Amazon Athena 페더레이션 쿼리 사용
Amazon S3 외의 원본에 데이터가 있는 경우 Athena 연합 쿼리를 사용하여 데이터를 제자리에 쿼리하거나 여러 데이터 원본에서 데이터를 추출하여 Amazon S3에 저장하는 파이프라인을 구축할 수 있습니다. Athena 연합 쿼리를 사용하면 관계형, 비관계형, 객체 및 사용자 지정 데이터 원본에 저장된 데이터에 대해 SQL 쿼리를 실행할 수 있습니다. 지원되는 데이터 소스의 전체 목록은 사용 가능한 데이터 소스 커넥터 단원을 참조하세요.
데이터 소스에 대해 쿼리를 실행하면 Athena는 커넥터를 간접적으로 호출하여 읽을 데이터를 결정하고, 병렬 처리를 관리하고, 필터 조건자를 푸시다운합니다. 커넥터는 쿼리를 제출하는 사용자에 따라 데이터에 대한 액세스를 제한할 수도 있습니다.
Athena는 데이터 소스 커넥터를 사용하여 기본 데이터에 대해 페더레이션 쿼리를 실행합니다. Athena는 서로 다른 기능을 가진 두 가지 유형의 데이터 소스 커넥터를 지원합니다.
-
AWS Glue Data Catalog 페더레이션 커넥터 - 이 커넥터는 AWS Glue 연결을 사용하여 데이터 소스에 연결합니다. Lake Formation을 통해 세분화된 데이터 거버넌스 제어 지원과 함께 사용할 수 있습니다. 자세한 내용은 AWS Lake Formation 개발자 안내서의 페더레이션 카탈로그 데이터 연결을 참조하세요.
-
Lambda와 연결된 커넥터는 필요에 따라 AWS Glue Data Catalog로 수동 등록하여 세분화된 데이터 거버넌스를 위해 Lake Formation과 함께 사용할 수 있습니다.
-
2026년 4월 21일부터 새로 생성되는 특정 커넥터는 Glue 데이터 카탈로그로 자동 등록되며 AWS 계정의 Lambda 함수를 사용하지 않습니다.
-
-
Athena 데이터 카탈로그 페더레이션 커넥터 - 이 커넥터는 Athena 전용이며 AWS Glue Data Catalog에 페더레이션 카탈로그로 등록할 수 없습니다. 데이터를 쿼리하려면 AWS 계정의 Lambda 함수가 필요합니다. Athena Query Federation SDK를 사용하여 개발된 사용자 지정 커넥터는 Athena 데이터 카탈로그 커넥터입니다. 자세한 내용은 Athena Query Federation SDK를 사용하여 데이터 소스 커넥터 개발 섹션을 참조하세요.
각 유형과 호환되는 데이터 소스 목록은 데이터 소스별 커넥터 유형 지원 섹션을 참조하세요.
참고
타사 개발자가 Athena Query Federation SDK를 사용하여 데이터 원본 커넥터를 작성한 경우도 있을 수 있습니다. 이러한 데이터 원본 커넥터와 관련한 지원 또는 라이선스 문제는 커넥터 공급업체에 문의하세요. 이러한 커넥터는 AWS에서 테스트 또는 지원되지 않습니다.
고려 사항 및 제한 사항
-
보기 - 페더레이션된 데이터 소스에서 보기를 생성하고 쿼리할 수 있습니다. 페더레이션된 보기는 기본 데이터 소스가 아닌 AWS Glue에 저장됩니다. 자세한 내용은 페더레이션 뷰 쿼리 섹션을 참조하세요.
-
구분 식별자 - 구분 식별자(인용 식별자로도 불림)는 큰 따옴표(")로 시작해서 끝납니다. 현재 Athena의 페더레이션 쿼리에는 구분된 식별자가 지원되지 않습니다.
-
쓰기 작업 - INSERT INTO 같은 쓰기 작업은 지원되지 않습니다. 이를 실행하려고 하면
이 작업은 현재 외부 카탈로그에서 지원되지 않습니다(This operation is currently not supported for external catalogs)라는 오류 메시지가 표시될 수 있습니다. -
요금 – 요금 정보는 Amazon Athena 요금
을 참조하세요. -
JDBC 드라이버 - JDBC 드라이버와 함께 연합 쿼리나 외부 Hive 메타스토어를 사용하려면 JDBC 연결 문자열에
MetadataRetrievalMethod=ProxyAPI를 포함해야 합니다. JDBC 드라이버에 대한 자세한 내용은 JDBC로 Amazon Athena에 연결 섹션을 참조하세요. -
Secrets Manager – AWS Secrets Manager에서 Athena 연합 쿼리 기능을 사용하려면 Secrets Manager에 대해 Amazon VPC 프라이빗 엔드포인트를 구성해야 합니다. 자세한 내용은 AWS Secrets Manager 사용 설명서의 Secrets Manager VPC 프라이빗 엔드포인트 생성을 참조하세요.
-
패스스루 쿼리 - 데이터 소스가 AWS Glue Data Catalog로 등록된 후에는 패스스루 쿼리가 지원되지 않습니다.
데이터 소스별 커넥터 유형 지원
다음 표에는 각 데이터 소스에서 지원하는 커넥터 유형이 나와 있습니다. 2026년 4월 21일 이후에 생성하는 특정 AWS Glue Data Catalog 페더레이션 카탈로그 커넥터에는 Lambda가 필요 없습니다.
| 데이터 소스 | AWS Glue Data Catalog 페더레이션 커넥터 | Athena 데이터 카탈로그 페더레이션 커넥터 | |
|---|---|---|---|
| Lambda 없음 | Lambda 사용 | ||
| Amazon CloudWatch Logs | 예 | 예 | |
| Amazon CloudWatch 지표 | 예 | 예 | |
| Amazon DocumentDB | 예 | 예 | 예 |
| Amazon DynamoDB | 예 | 예 | 예 |
| Amazon MSK | 예 | ||
| Amazon Neptune | 예 | ||
| Amazon OpenSearch | 예 | 예 | 예 |
| Amazon Redshift | 예 | 예 | 예 |
| Amazon Timestream | 예 | 예 | |
| Azure Data Lake Storage | 예 | 예 | |
| Azure Synapse | 예 | 예 | |
| Cloudera Hive | 예 | 예 | |
| Cloudera Impala | 예 | 예 | |
| CMDB | 예 | 예 | |
| Confluent | 예 | ||
| 사용자 지정 | 예 | ||
| Db2 | 예 | 예 | |
| Db2 iSeries | 예 | 예 | |
| Google BigQuery | 예 | 예 | 예 |
| Google Cloud Storage | 예 | 예 | |
| HBase | 예 | 예 | |
| Hortonworks(Hive) | 예 | ||
| Kafka | 예 | ||
| MySQL | 예 | 예 | 예 |
| Oracle | 예 | 예 | 예 |
| PostgreSQL | 예 | 예 | 예 |
| Redis OSS | 예 | ||
| SAP HANA | 예 | 예 | 예 |
| Snowflake | 예 | 예 | 예 |
| SQL Server | 예 | 예 | 예 |
| Teradata | 예 | 예 | 예 |
| TPC-DS | 예 | 예 | |
| Vertica | 예 | 예 | |
비디오
Athena 연합 쿼리 사용에 대해 자세히 알아보려면 다음 동영상을 시청하세요.
동영상: Analyze Results of Federated Query in Amazon Athena in Quick
다음 동영상은 Quick에서 Athena 페더레이션 쿼리의 결과를 분석하는 방법을 보여줍니다.
동영상: 게임 분석 파이프라인
다음 동영상은 Amazon Athena 연합 쿼리를 사용하여 게임 및 서비스의 원격 측정 데이터를 수집, 저장, 분석하기 위해 확장형 서버리스 데이터 파이프라인을 배포하는 방법을 보여줍니다.