

# Amazon RDS 제로 ETL 통합
<a name="zero-etl"></a>

Amazon Redshift 및 Amazon SageMaker AI와의 Amazon RDS 제로 ETL 통합을 사용하면RDS의 데이터를 사용해 거의 실시간에 가까운 분석 및 기계 학습(ML)을 수행할 수 있습니다. 이 솔루션은 트랜잭션 데이터가 RDS 데이터베이스에 기록된 후 분석 대상에서 사용할 수 있도록 하기 위한 완전관리형 솔루션입니다. **추출, 전환, **적재(ETL)는 여러 소스의 데이터를 데이터 웨어하우스라는 대규모 중앙 리포지토리로 결합하는 프로세스입니다.

제로 ETL 통합을 통해 RDS 데이터베이스의 데이터를 거의 실시간으로 Amazon Redshift 또는 Amazon SageMaker AI 레이크하우스에서 사용할 수 있습니다. 데이터가 대상 데이터 웨어하우스 또는 데이터 레이크에 저장되면 기계 학습, 구체화된 뷰, 데이터 공유, 여러 데이터 저장소 및 데이터 레이크에 대한 페더레이션 액세스, Amazon SageMaker AI, Quick 및 기타 AWS 서비스와의 통합과 같은 기본 제공 기능을 사용하여 분석, ML 및 AI 워크로드를 강화할 수 있습니다.

제로 ETL 통합을 만들려면 RDS 데이터베이스를 *소스*로 지정하고 지원되는 데이터 웨어하우스 또는 레이크하우스를 *대상*으로 지정합니다. 통합은 소스 데이터베이스에서 대상 데이터 웨어하우스 또는 레이크하우스로 데이터를 복제합니다.

다음 다이어그램은 Amazon Redshift와의 제로 ETL 통합에서 이 기능을 보여줍니다.

![\[제로 ETL 통합\]](http://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/UserGuide/images/zero-etl-integrations.png)


다음 다이어그램은 Amazon SageMaker AI 레이크하우스와의 제로 ETL 통합에서 이 기능을 보여줍니다.

![\[Amazon SageMaker AI 레이크하우스와의 제로 ETL 통합\]](http://docs.aws.amazon.com/ko_kr/AmazonRDS/latest/UserGuide/images/zero-etl-rds-lakehouse.png)


통합은 데이터 파이프라인의 상태를 모니터링하고 가능한 경우 문제로부터 복구합니다. 여러 RDS 데이터베이스를 단일 대상 데이터 웨어하우스 또는 레이크하우스로 통합하여 여러 애플리케이션에 걸쳐 인사이트를 도출할 수 있습니다.

**Topics**
+ [이점](#zero-etl.benefits)
+ [주요 개념](#zero-etl.concepts)
+ [제한 사항](#zero-etl.reqs-lims)
+ [할당량](#zero-etl.quotas)
+ [지원되는 리전](#zero-etl.regions)
+ [Amazon RDS 제로 ETL 통합 시작하기](zero-etl.setting-up.md)
+ [Amazon Redshift가 구성된 Amazon RDS 제로 ETL 통합 생성](zero-etl.creating.md)
+ [Amazon SageMaker 레이크하우스와 Amazon RDS 제로 ETL 통합 생성](zero-etl.creating-smlh.md)
+ [Amazon RDS 제로 ETL 통합의 데이터 필터링](zero-etl.filtering.md)
+ [소스 RDS 데이터베이스에 데이터 추가 및 쿼리](zero-etl.querying.md)
+ [Amazon RDS 제로 ETL 통합 확인 및 모니터링](zero-etl.describingmonitoring.md)
+ [Amazon RDS 제로 ETL 통합 수정](zero-etl.modifying.md)
+ [Amazon RDS 제로 ETL 통합 삭제](zero-etl.deleting.md)
+ [Amazon RDS 제로 ETL 통합 문제 해결](zero-etl.troubleshooting.md)

## 이점
<a name="zero-etl.benefits"></a>

RDS 제로 ETL 통합은 다음과 같은 주요 이점을 제공합니다.
+ 여러 데이터 소스에서 총체적인 인사이트를 도출할 수 있도록 도와줍니다.
+ 추출, 전환, 적재(ETL) 작업을 수행하는 복잡한 데이터 파이프라인을 구축하고 유지 관리할 필요가 없습니다. 제로 ETL 통합은 파이프라인을 프로비저닝하고 관리해 주므로 파이프라인을 구축하고 관리하는 데 따르는 어려움이 발생하지 않습니다.
+ 운영 부담과 비용을 줄이고 애플리케이션 개선에 집중할 수 있습니다.
+ 대상의 분석 및 ML 기능을 통해 트랜잭션 데이터 및 기타 데이터에서 인사이트를 도출하여 중요하고 시간에 민감한 이벤트에 효과적으로 대응할 수 있습니다.

## 주요 개념
<a name="zero-etl.concepts"></a>

제로 ETL 통합을 시작할 때는 다음 개념을 고려하세요.

**통합**  
RDS 데이터베이스에서 데이터 웨어하우스 또는 카탈로그로 트랜잭션 데이터 및 스키마를 자동으로 복제하는 완전관리형 데이터 파이프라인입니다.

**소스 데이터베이스**  
데이터가 복제되는 RDS 데이터베이스입니다. 단일 AZ나 다중 AZ DB 인스턴스 또는 다중 AZ DB 클러스터를 지정할 수 있습니다(RDS for MySQL만 해당).

**대상**  
데이터가 복제되는 데이터 웨어하우스 또는 레이크하우스입니다. 데이터 웨어하우스에는 [프로비저닝된 클러스터](https://docs.aws.amazon.com/redshift/latest/mgmt/working-with-clusters.html) 데이터 웨어하우스와 [서버리스](https://docs.aws.amazon.com/redshift/latest/mgmt/serverless-workgroup-namespace.html) 데이터 웨어하우스라는 2가지 유형이 있습니다. 프로비저닝된 클러스터 데이터 웨어하우스는 노드라고 하는 컴퓨팅 리소스의 모음으로, 노드는 *클러스터*라고 하는 그룹을 구성합니다. 서버리스 데이터 웨어하우스는 컴퓨팅 리소스를 저장하는 작업 그룹과 데이터베이스 객체 및 사용자를 수용하는 네임스페이스로 구성됩니다. 두 데이터 웨어하우스 모두 분석 엔진을 실행하며 하나 이상의 데이터베이스를 포함합니다.  
대상 레이크하우스는 카탈로그, 데이터베이스, 테이블 및 뷰로 구성됩니다. 레이크하우스 아키텍처에 대한 자세한 내용은 *Amazon SageMaker AI Unified Studio 사용 설명서*의 [https://docs.aws.amazon.com/sagemaker-unified-studio/latest/userguide/lakehouse-components.html](https://docs.aws.amazon.com/sagemaker-unified-studio/latest/userguide/lakehouse-components.html) 섹션을 참조하세요.  
여러 소스 데이터베이스가 동일한 대상에 쓸 수 있습니다.  
자세한 내용은 *Amazon Redshift 개발자 안내서*의 [데이터 웨어하우스 시스템 아키텍처](https://docs.aws.amazon.com/redshift/latest/dg/c_high_level_system_architecture.html)를 참조하세요.

## 제한 사항
<a name="zero-etl.reqs-lims"></a>

다음 제한 사항은 RDS 제로 ETL 통합에 적용됩니다.

**Topics**
+ [일반 제한 사항](#zero-etl.reqs-lims-general)
+ [RDS for MySQL 제한 사항](#zero-etl.reqs-lims-mysql)
+ [RDS for PostgreSQL 제한 사항](#zero-etl.reqs-lims-rds-postgres)
+ [RDS for Oracle 제한 사항](#zero-etl.reqs-lims-oracle)
+ [Amazon Redshift 제한 사항](#zero-etl.reqs-lims-redshift)
+ [Amazon SageMaker AI 레이크하우스 제한 사항](#zero-etl.reqs-lims-sagemaker-)

### 일반 제한 사항
<a name="zero-etl.reqs-lims-general"></a>
+ 소스 데이터베이스는 대상과 동일한 리전에 있어야 합니다.
+ 기존 통합이 있는 경우 데이터베이스의 이름을 변경할 수 없습니다.
+ 동일한 소스 데이터베이스와 대상 데이터베이스 간에 여러 통합을 만들 수 없습니다.
+ 기존 통합이 있는 데이터베이스는 삭제할 수 없습니다. 먼저 연결된 모든 통합을 삭제해야 합니다.
+ 소스 데이터베이스를 중지하면 데이터베이스를 다시 시작할 때까지 마지막 몇 개의 트랜잭션이 복제되지 않을 수 있습니다.
+ 소스 데이터베이스가 중지된 경우 통합을 삭제할 수 없습니다.
+ 데이터베이스가 블루/그린 배포의 소스인 경우 블루 및 그린 환경은 전환 중에 기존의 제로 ETL 통합을 가질 수 없습니다. 먼저 통합을 삭제하고 전환한 다음 다시 만들어야 합니다.
+ 다른 통합이 활발하게 생성되고 있는 소스 데이터베이스에 대해 통합을 생성할 수 없습니다.
+ 처음에 통합을 생성하거나 테이블을 재동기화할 때는 소스 데이터베이스의 크기에 따라 소스에서 대상으로 데이터를 시드하는 데 20\$125분 이상 걸릴 수 있습니다. 이러한 지연으로 인해 복제 지연이 증가할 수 있습니다.
+ 일부 데이터 유형은 지원되지 않습니다. 자세한 내용은 [RDS와 Amazon Redshift 데이터베이스 간의 데이터 유형 차이](zero-etl.querying.md#zero-etl.data-type-mapping) 섹션을 참조하세요.
+ 시스템 테이블, 임시 테이블 및 뷰는 대상 웨어하우스에 복제되지 않습니다.
+ 소스 테이블에서 DDL 명령(예: `ALTER TABLE`)을 수행하면 테이블 재동기화를 트리거하여 재동기화 중에 테이블을 쿼리할 수 없게 됩니다. 자세한 내용은 [Amazon Redshift 테이블 중 하나 이상을 재동기화해야 합니다](zero-etl.troubleshooting.md#zero-etl.troubleshooting.resync) 섹션을 참조하세요.

### RDS for MySQL 제한 사항
<a name="zero-etl.reqs-lims-mysql"></a>
+ 소스 데이터베이스에서 지원되는 RDS for MySQL 버전을 실행하고 있어야 합니다. 지원되는 버전 목록은 섹션을 참조하세요[Amazon RDS 제로 ETL 통합을 지원하는 리전 및 DB 엔진](Concepts.RDS_Fea_Regions_DB-eng.Feature.ZeroETL.md)
+ 제로 ETL 통합은 동일한 AWS 리전의 프라이머리 인스턴스와 읽기 전용 복제본 인스턴스 모두에서 지원되지 않습니다.
+ 제로 ETL 통합은 진행 중인 데이터 변경 사항을 캡처하기 위해 MySQL 바이너리 로깅(binlog)에 의존합니다. binlog 기반 데이터 필터링을 사용하면 소스 데이터베이스와 대상 데이터베이스 간에 데이터 불일치가 발생할 수 있으므로 사용하지 않는 것이 좋습니다.
+ 제로 ETL 통합은 InnoDB 스토리지 엔진을 사용하도록 구성된 데이터베이스에만 지원됩니다.
+ 사전 정의된 테이블 업데이트가 포함된 외래 키 참조는 지원되지 않습니다. 특히, `CASCADE`, `SET NULL`, `SET DEFAULT` 작업에서는 `ON DELETE` 및 `ON UPDATE` 규칙이 지원되지 않습니다. 다른 테이블에 대한 이러한 참조가 포함된 테이블을 만들거나 업데이트하려고 하면 테이블이 실패 상태가 됩니다.
+ 마그네틱 스토리지를 사용하는 소스 데이터베이스에 대한 통합을 생성할 수 없습니다.

### RDS for PostgreSQL 제한 사항
<a name="zero-etl.reqs-lims-rds-postgres"></a>
+ 소스 데이터베이스는 버전 15.7 이상, 16.3 이상 또는 17.1 이상을 실행하는 RDS for PostgreSQL 인스턴스여야 합니다. 더 낮은 버전은 지원되지 않습니다.
+ RDS for PostgreSQL 제로 ETL 통합은 다중 AZ DB 클러스터를 소스 데이터베이스로 지원하지 않습니다.
+ RDS for PostgreSQL 읽기 전용 복제본 인스턴스에서는 제로 ETL 통합을 만들 수 없습니다.
+ PostgreSQL 로깅되지 않은 테이블 및 구체화된 뷰는 Amazon Redshift에 복제되지 않습니다.
+ [지오메트리 데이터 유형](https://www.postgresql.org/docs/current/datatype-geometric.html) 및 64KB를 초과하는 데이터와 같은 특정 PostgreSQL 데이터 유형의 복제는 Amazon Redshift의 제한으로 인해 지원되지 않습니다. RDS for PostgreSQL과 Amazon Redshift 간의 데이터 유형 차이에 대한 자세한 내용은 **데이터 유형 차이** 섹션에서 [RDS for PostgreSQL](zero-etl.querying.md#zero-etl.data-type-mapping-postgres)의 내용을 참조하세요.
+ 활성 제로 ETL 통합이 있는 소스 RDS for PostgreSQL 인스턴스에서는 [메이저 버전 업그레이드](USER_UpgradeDBInstance.PostgreSQL.md)를 수행할 수 없습니다. 소스 인스턴스를 업그레이드하려면 먼저 기존 제로 ETL 통합을 모두 삭제해야 합니다. 메이저 버전 업그레이드가 완료되면 제로 ETL 통합을 다시 만들 수 있습니다.
+ 소스 DB 인스턴스에서 [선언적 파티셔닝](https://www.postgresql.org/docs/current/ddl-partitioning.html#DDL-PARTITIONING-DECLARATIVE) 트랜잭션을 수행하는 경우 영향을 받는 모든 테이블은 실패 상태가 되며 더 이상 액세스할 수 없습니다.

### RDS for Oracle 제한 사항
<a name="zero-etl.reqs-lims-oracle"></a>
+ 소스 데이터베이스는 버전 19c Enterprise Edition 또는 Standard Edition 2, 2019년 7월 릴리스 업데이트 이상을 실행하는 RDS for Oracle 인스턴스여야 합니다. 더 낮은 버전은 지원되지 않습니다.
+ RDS for Oracle 읽기 전용 복제본 인스턴스에서는 제로 ETL 통합을 만들 수 없습니다.
+ [테넌트 데이터베이스](Oracle.Concepts.CDBs.md)에 제로 ETL 통합이 있는 경우 테넌트 데이터베이스의 이름을 바꿀 수 없습니다.
+ 테넌트 데이터베이스는 제로 ETL 통합을 하나만 가질 수 있습니다.
+ RDS for Oracle과 Amazon Redshift에는 몇 가지 데이터 유형 차이가 있습니다. 자세한 내용은 **데이터 유형 차이** 섹션에서 [RDS for Oracle](zero-etl.querying.md#zero-etl.data-type-mapping-oracle)의 내용을 참조하세요.

### Amazon Redshift 제한 사항
<a name="zero-etl.reqs-lims-redshift"></a>

제로 ETL 통합과 관련된 Amazon Redshift 제한 사항 목록은 *Amazon Redshift 관리 가이드*의 [Amazon Redshift와 제로 ETL 통합을 사용할 때 고려할 사항](https://docs.aws.amazon.com/redshift/latest/mgmt/zero-etl.reqs-lims.html)을 참조하세요.

### Amazon SageMaker AI 레이크하우스 제한 사항
<a name="zero-etl.reqs-lims-sagemaker-"></a>

다음은 Amazon SageMaker AI 레이크하우스 제로 ETL 통합에 대한 제한 사항입니다.
+ 카탈로그 이름의 길이는 19자로 제한됩니다.

## 할당량
<a name="zero-etl.quotas"></a>

계정에는 RDS 제로 ETL 통합과 관련된 다음과 같은 할당량이 있습니다. 각 할당량은 달리 지정되지 않는 한 리전별로 적용됩니다.


| 이름 | 기본값 | 설명 | 
| --- | --- | --- | 
| 통합 | 100 | AWS 계정 내 총 통합 수입니다. | 
| 대상당 통합 | 50 | 단일 대상 데이터 웨어하우스 또는 레이크하우스로 데이터를 보내는 통합 수입니다. | 
| 소스 인스턴스별 통합 | 5 | 단일 소스 DB 인스턴스에서 데이터를 보내는 통합 수입니다. | 

또한 대상 웨어하우스는 각 DB 인스턴스 또는 클러스터 노드에 허용되는 테이블 수에 구체적인 제한을 두고 있습니다. Amazon Redshift 할당량 및 제한에 대한 자세한 내용은 *Amazon Redshift 관리 안내서*의 [Amazon Redshift의 할당량 및 제한](https://docs.aws.amazon.com/redshift/latest/mgmt/amazon-redshift-limits.html)을 참조하세요.

## 지원되는 리전
<a name="zero-etl.regions"></a>

RDS 제로 ETL 통합은 일부 AWS 리전에서 사용할 수 있습니다. 지원되는 리전 목록은 [Amazon RDS 제로 ETL 통합을 지원하는 리전 및 DB 엔진](Concepts.RDS_Fea_Regions_DB-eng.Feature.ZeroETL.md) 섹션을 참조하세요.