동종 데이터베이스 마이그레이션 고려 사항 - AWS 권장 가이드

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

동종 데이터베이스 마이그레이션 고려 사항

이 섹션에서는 동종 마이그레이션의 주요 모범 사례를 설명합니다. 데이터베이스를 온프레미스의 Exadata에서 Amazon RDS for Oracle 또는 Amazon EC2의 Oracle로 마이그레이션할 때는 다음 하위 섹션에서 설명하는 지침을 고려하세요.

암호화

데이터 보안은 고객의 기밀성, 무결성 및 가용성을 보호하기 위해 엄격한 계약, 기술 및 조직 조치를 구현 AWS AWS 했습니다. 데이터베이스의 경우 암호화는 프라이빗 정보와 민감한 데이터를 보호하기 때문에 중요합니다. Oracle on Amazon EC2 및 Amazon RDS for Oracle은 저장 데이터에 대해 두 가지 암호화 방법을 지원합니다.

두 옵션 모두 Oracle 데이터베이스와 모든 데이터베이스 백업에서 사용자 데이터를 암호화합니다. 암호화는 애플리케이션에서 발급된 DML 문에도 투명합니다.

전송 중인 데이터의 경우 Oracle on Amazon EC2 및 Amazon RDS for Oracle은 Oracle NNE(네이티브 네트워크 암호화)를 지원합니다. NNE 지원에 대한 자세한 내용은 Amazon RDS 설명서를 참조하세요.

데이터 파티셔닝

Oracle 파티셔닝을 사용하면 테이블 또는 인덱스와 같은 데이터베이스의 단일 논리적 객체가 더 작은 물리적 데이터베이스 객체로 분할되어 관리 용이성, 성능 및 가용성을 개선하는 데 도움이 됩니다. Oracle 파티셔닝에는 Oracle 라이선스가 필요합니다.

데이터베이스 워크로드가 큰 경우 테이블 파티셔닝을 고려하세요. 파티션 정리를 사용하면 Oracle Database 옵티마이저가 SQL 문의 FROMWHERE 절을 분석하여 파티션 액세스 목록을 빌드할 때 불필요한 파티션을 제거할 수 있습니다. Oracle Database는 SQL 문과 관련된 파티션에서만 작업을 수행하므로 일반적으로 성능이 향상됩니다.

파티셔닝은 가용성에도 도움이 됩니다. 파티션이 오프라인 상태가 되고 작업을 완료하기 위해 SQL 문에 오프라인 파티션이 필요하지 않은 경우 SQL 문이 성공합니다. 그러나 분할되지 않은 Oracle Database 테이블 내에서 데이터 블록이 손실되면 복원 작업이 완료될 때까지 전체 테이블을 사용할 수 없습니다.

데이터 압축

데이터 압축을 위해 Oracle은 HCC와 고급 압축을 모두 제공합니다. 고급 압축은 관계형 데이터(테이블), 비정형 데이터(파일), 인덱스, Data Guard 다시 실행 데이터, 네트워크 데이터, RMAN 백업 및 기타 유형의 데이터에 대한 데이터베이스 스토리지 공간을 줄여 성능을 개선하고 스토리지 비용을 절감합니다. 또한 고급 압축은 메모리 및 네트워크 대역폭을 포함한 데이터베이스 인프라 구성 요소의 성능을 개선할 수 있습니다.

Oracle 설명서에 따르면 고급 압축의 평균 압축률은 2배 이상입니다. 따라서 일반적으로 100GiB의 데이터가 50GiB의 스토리지 공간에 상주할 수 있습니다. Oracle 데이터베이스를 로 마이그레이션 AWS할 때 OLTP 및 데이터 웨어하우징 데이터베이스 모두에서 Amazon RDS for Oracle 및 Oracle on Amazon EC2inAmazon 고급 압축을 사용할 수 있습니다. Exadata에서 사용하지 않았더라도에서 Oracle 데이터베이스와 함께 고급 압축 AWS 을 사용하여 성능을 개선하고 Amazon EBS 스토리지 비용을 절감할 수 있습니다. 고급 압축에는 Oracle 라이선스가 필요합니다.

ILM 전략

정보 수명 주기 관리(ILM)는 사용 빈도에 따라 데이터베이스의 정보를 관리하는 데 도움이 되는 프로세스, 정책 및 구성 요소를 제공합니다. Exadata에서 Oracle on으로 마이그레이션 AWS할 때는 마이그레이션 전후에 데이터를 제거할 수 있는지 여부를 결정해야 합니다 AWS. 에서는 규칙을 적용하여 특정 기간 동안만 데이터를 유지할 AWS수 있습니다. Oracle Partitioning 및 Oracle Advanced Compression을 구현하여 데이터 수명 주기 정책을 설정할 수 있습니다. 이를 통해 비즈니스 지원에 필요한 데이터만 유지하면서 성능을 개선할 수 있습니다.

예를 들어, 여러 테비바이트의 압축되지 않은 데이터를 소비하는 테이블이 있다고 가정해 보겠습니다. 현재 데이터는 12년이며 데이터를 14년 동안 보관해야 합니다. 모든 쿼리의 약 90%가 2년 미만의 데이터에 액세스합니다. 일반적으로 월별, 분기별, 전년 대비 데이터 사용량을 비교합니다. 30개월 후에는 데이터를 업데이트할 수 없지만 최대 12년 된 기록 데이터에 액세스해야 하는 경우가 있습니다. 이 경우 다음 ILM 정책을 고려할 수 있습니다.

  • 고급 압축을 구현합니다. 고급 압축을 통해 Oracle 히트 맵과 자동 데이터 최적화(ADO)를 활용합니다.

  • 날짜 열에 간격 파티셔닝을 설정합니다.

  • 매월 14년이 지난 파티션을 삭제하는 함수를 사용합니다.

  • 읽기 전용 테이블스페이스를 사용하여 30개월이 지난 데이터를 보관합니다. 읽기 전용 테이블스페이스의 주요 목적은 데이터베이스의 대규모 정적 부분을 백업하고 복구할 필요가 없도록 하는 것입니다(Oracle RMAN을 Oracle on Amazon EC2와 함께 사용하는 경우). 읽기 전용 테이블스페이스는 사용자가 수정할 수 없도록 기록 데이터를 보호하는 방법도 제공합니다. 테이블스페이스를 읽기 전용으로 설정하면 사용자의 업데이트 권한 수준에 관계없이 테이블스페이스의 모든 테이블에 대한 업데이트가 방지됩니다.

사용자는 활성 데이터, 자주 액세스하지 않는 데이터를 저장하고 데이터를 단일 Oracle 데이터베이스에 보관하는 경우가 많습니다. Oracle 데이터베이스 마이그레이션 중에 자주 액세스하지 않는 데이터 AWS, 과거 감사 데이터를 Amazon Amazon S3 Amazon Glacier로 직접 마이그레이션하고 데이터를 보관할 수 있습니다. 이를 통해 데이터베이스 성능에 영향을 주지 않고 장기 데이터 보존에 대한 거버넌스 및 규정 준수 요구 사항을 충족할 수 있습니다. 관계형 데이터베이스의 데이터가 오래되면 Amazon S3 또는 Amazon Glacier에 보관할 수 있습니다. Amazon Athena 또는 Amazon Glacier Select를 사용하여 아카이브된 데이터를 쉽게 쿼리할 수 있습니다.

OEM 통합

Oracle 워크로드를 로 마이그레이션 AWS할 때 Oracle Enterprise Manager(OEM) Cloud Control을 구현해야 할 수 있습니다 AWS. OEM은 Oracle 환경을 관리하기 위한 단일 인터페이스를 제공하는 Oracle의 관리 플랫폼입니다.

Oracle on Amazon EC2 및 Amazon RDS for Oracle은 OEM 환경의 대상이 될 수 있습니다. Amazon EC2의 Oracle은 OEM과 통합하기 위해 온프레미스의 Oracle과 동일한 프로세스를 따릅니다. Amazon RDS for Oracle에서 OEM을 활성화하려면

  1. 에 로그인 AWS Management Console 하고 https://console.aws.amazon.com/rds/ Amazon RDS 콘솔을 엽니다.

  2. 탐색 창에서 옵션 그룹을 선택합니다.

  3. OEM_AGENT 옵션 그룹 또는 기존 옵션 그룹에 옵션을 추가합니다.

  4. OEM 관리 서버 호스트 이름, 포트 및 OEM 에이전트 등록 암호를 포함한 OEM 구성 정보를 추가합니다.

Amazon RDS for Oracle 및 Oracle on Amazon EC2는 온프레미스에서 실행되는 OEM 환경의 대상일 수도 있습니다. 그러나 이렇게 하려면 방화벽을 통해 모든 OEM 포트에 액세스할 수 있어야 합니다.

Amazon CloudWatch 통합

Amazon CloudWatch는 로그, 지표 및 이벤트의 형태로 모니터링 및 운영 데이터를 수집합니다. 온프레미스에서 실행되는 AWS 리소스, 애플리케이션 및 서비스에 대한 통합 보기를 제공하는 자동화된 대시보드를 사용하여 데이터를 시각화합니다 AWS . Amazon EC2 및 Amazon RDS for Oracle에서 호스팅되는 Oracle 데이터베이스는 CloudWatch를 사용할 수 있습니다.

CloudWatch와 Amazon Simple Notification Service(Amazon SNS)가 통합되어 모든 활성 Amazon SNS 알림에 대한 지표를 수집, 확인 및 분석할 수 있습니다. 예를 들어 Oracle Database 알림 로그의 특정 Oracle 오류 메시지와 같은 지정된 작업이 발생하는 경우 이메일 알림 또는 SMS를 보내도록 경보를 설정할 수 있습니다.

CloudWatch 및 Amazon SNS를 Amazon EC2의 Oracle과 함께 사용하려면 CloudWatch 에이전트를 설치하여 Oracle 알림 로그, 감사 로그, 추적 로그, OEM 로그 및 리스너 로그를 CloudWatch로 푸시해야 합니다. Amazon RDS for Oracle을 배포하는 경우 이러한 로그를 CloudWatch로 전송할 수 있도록 Oracle 인스턴스를 수정해야 합니다. CloudWatch 통합에 대한 자세한 내용은 Amazon SNS 설명서의 CloudWatch를 사용하여 Amazon SNS 토폴로지 모니터링을 참조하세요. Amazon SNS

또한 Amazon RDS for Oracle에는 CPU 사용률, 데이터베이스 연결 수, 사용 가능한 메모리, 여유 스토리지 공간, 스토리지 IOPS, 디스크 처리량, 복제 지연 등 수십 가지 이벤트에 대한 CloudWatch 경보가 내장되어 있습니다.

온프레미스 Exadata에서 마이그레이션하여 OEM을 AWS 계속 사용하고 CloudWatch를 AWS의 Oracle 데이터베이스와 통합하는 대부분의 사용자.

데이터베이스 최적화 프로그램 통계

Oracle Database 옵티마이저 통계는 데이터베이스와 해당 테이블, 열, 인덱스 및 시스템에 대한 정보를 제공합니다. 최적화 프로그램은이 정보를 사용하여 쿼리의 테이블, 파티션 또는 인덱스에서 검색되는 행 및 바이트 수를 추정하고, 액세스 비용을 추정하고, 비용이 가장 낮은 SQL 실행 계획을 선택합니다.

Oracle RMAN을 통해 Exadata 온프레미스 데이터베이스를 Amazon EC2로 복원하면 Oracle은 Exadata 환경을 반영하는 통계를 자동으로 제공합니다. Exadata 데이터베이스를 Amazon EC2로 복원하거나 Amazon RDS for Oracle에서 초기 로드가 완료되는 즉시 가능한 한 빨리 통계를 수집하는 것이 좋습니다. 이는 Oracle DBMS_STATS 패키지를 실행하여 수행할 수 있습니다.

AWR 설정

Oracle Automatic Workload Repository(AWR)는 Oracle 데이터베이스에 대한 성능 관련 통계를 저장합니다. 기본적으로 Oracle Database는 1시간마다 한 번씩 스냅샷을 생성하고 스냅샷을 8일 동안 유지합니다. 스냅샷을 수동으로 생성하거나 삭제하고 스냅샷 설정을 수정할 수 있습니다.

프로덕션 Oracle 데이터베이스의 경우 AWR 보존 기간을 60일 또는 90일로 늘리고 AWR 간격을 15분 또는 30분으로 줄여야 합니다. 이러한 설정은 month-over-month 비교를 지원하며 AWR 데이터를 볼 때 더 세분화된 기능을 제공합니다. 이러한 변경 사항은 비교적 작은(기비바이트 단위로 측정) 데이터베이스 공간을 소비하며 추가 기록의 이점을 제공합니다. AWR 보존 기간을 60일로 설정하고 AWR 간격을 15분으로 설정하려면 다음 명령을 실행합니다(파라미터 값은 분 단위).

BEGIN DBMS_WORKLOAD_REPOSITORY.modify_snapshot_settings (interval => 15, retention => 86400 ); END; /

Oracle RMAN 또는 Oracle Data Guard를 사용하여 Exadata 온프레미스 데이터베이스를 Amazon EC2의 Oracle로 마이그레이션하는 경우 데이터베이스가 Exadata에서 실행되는 동안 캡처된 AWR 스냅샷을 삭제해야 합니다. 이렇게 하려면의 DBMS_WORKLOAD_REPOSITORY.DROP_SNAPSHOT_RANGE 절차를 사용합니다 AWS.

Oracle RAC 고려 사항

기본적으로 Exadata는 Oracle Real Application Clusters(RAC)를 사용하므로 가용성을 극대화하고 수평 확장성을 활성화하기 위해 여러 서버에서 단일 Oracle 데이터베이스를 실행할 수 있습니다. Oracle RAC는 공유 스토리지를 사용합니다. 가장 작은 Exadata 제품에는 Oracle RAC를 사용하여 구성된 두 개의 노드가 포함되어 있습니다.

RPO 요구 사항이 0이고 RTO 요구 사항이 2분 이하인 경우 다중 AZ를 사용하여 Amazon RDS for Oracle을 구현할 수 있습니다. 이 구성은 Oracle RAC를 사용하는 관리형 Oracle 데이터베이스를 포함하여 업계의 모든 관리형 Oracle 클라우드 데이터베이스와 동일하거나 더 나은 99.95%의 월간 가동 시간 약정을 제공합니다.

또한 Oracle on Amazon EC2를 사용하면 Oracle Maximum Availability Architecture(MAA)의 많은 구성 요소를 사용하여 고가용성 데이터베이스를 구현할 수 있습니다. 이러한 구성 요소에는 Active Data Guard, RMAN, Flashback Technologies, 에디션 기반 재정의 및 GoldenGate가 포함되지만 이에 국한되지 않습니다.

Oracle RAC를 구현하기 위한 다양한 대안도 있습니다 AWS. 에서 RAC 옵션에 대해 자세히 알아보려면 계정 AWS 팀에 문의하는 AWS것이 좋습니다.

동종 마이그레이션에 대한 추가 모범 사례

개발자는 Exadata를 구현할 때 SQL 튜닝 기법과 모범 사례를 무시하는 경우가 많습니다. Exadata는 많은 설계 문제를 숨기므로 SQL 문은 허용 가능한 경과 시간 내에 완료되므로 실행 계획 또는 리소스 소비를 평가하지 않고 프로덕션에 배포될 수 있습니다. Exadata 온프레미스 데이터베이스를의 Oracle로 마이그레이션할 때 다음 추가 사례를 따르세요 AWS.

  • 최신 Oracle 릴리스 업데이트(RU) 또는 릴리스 업데이트 개정(RUR)을 적용합니다.

  • COMPATIBLE 초기화 파라미터에 세 가지 수준(예: 19.0.0)만 포함되어 있는지 확인합니다. 로 마이그레이션한 후 업그레이드가 수행되는 경우 업그레이드 프로세스 중에이 파라미터가 수정되었는지 AWS확인합니다.

  • I/O를 최소화하기 위해 시퀀스 번호 캐싱을 고려합니다. 기본값은 20입니다. 시퀀스 번호 캐싱이 충분하지 않으면 경합이 발생할 수 있으며, 이는 DML의 서비스 시간 증가로 표시됩니다.

  • 시퀀스를 사용하는 경우 시퀀스 불일치를 방지하기 위해 소스 데이터베이스(프레미스의 Exadata)에 대해 시퀀스 값을 검증합니다.

  • 애플리케이션 계층에서 연결 풀링이 구현되지 않거나 애플리케이션 계층 수가 매우 많은 데이터베이스 연결이 발생하는 경우 Oracle Database Resident Connection Pooling(DRCP)을 구현하는 것이 좋습니다. 이 기능은 데이터베이스 서버의 메모리 및 컴퓨팅 리소스를 효율적으로 처리합니다.

  • HugePages 사용을 고려하세요. Oracle은 Linux용 표준 HugePages를 사용할 것을 권장합니다. HugePages를 활성화하면 운영 체제가 기본값(일반적으로 4KB)보다 큰 메모리 페이지를 지원할 수 있습니다. 매우 큰 페이지 크기를 사용하면 페이지 테이블 항목에 액세스하는 데 필요한 시스템 리소스의 양을 줄여 시스템 성능을 개선할 수 있습니다.

  • 의 Oracle 데이터베이스에 데이터베이스 링크가 AWS 있는 경우 OPEN_LINKSOPEN_LINKS_PER_INSTANCE 초기화 파라미터가 기본값(4)으로 설정되지 않았는지 확인합니다. 이 값이 너무 낮으면 최대값에 도달하면 데이터베이스 링크가 있는 SQL 문이 대기열에 추가되기 시작하여 성능에 부정적인 영향을 미칩니다.

  • 초기 데이터 로드는 네트워크를 통해 전송되지 않을 수 있습니다. 예를 들어 이론적으로 1Gbps 링크를 통해 100TiB를 전송하는 데 중단 없이 최소 9일이 걸립니다. 더 나은 방법은 AWS Snow Family 디바이스를 사용하여 데이터베이스를 로 마이그레이션하는 것입니다 AWS.

  • Exadata별 숨겨진 파라미터를 제거합니다(Oracle MOS Note 1274318.1 참조). 이러한 숨겨진 Exadata 초기화 파라미터는 활성화해서는 안 됩니다 AWS. 불안정성, 성능 문제, 손상 및 충돌을 일으킬 수 있습니다.

  • 데이터를 Oracle on으로 마이그레이션한 후 SYSTEM 유효하지 않은 객체와 그렇지 않은SYS 객체를 모두 해결해 보세요 AWS.

  • Oracle System Global Area(SGA)에서 자주 액세스하는 정적 테이블을 캐싱하는 것이 좋습니다.

  • Oracle SGA 구성이 더 큰 메모리 최적화 인스턴스를 선택하여 추가 I/O 문제를 완화합니다 AWS. 대상 인스턴스에서 로드 테스트 중에 Oracle SGA 권고 보고서를 사용하여 최적의 Oracle SGA 구성을 찾을 수 있습니다.

  • 많은 전체 테이블 스캔을 처리하는 테이블에 인덱스를 생성합니다. V$SEGMENT_STATISTICS 뷰에는 후보 세그먼트가 나열됩니다.

  • 리소스 집약적인 상위 쿼리를 식별하고 더 나은 실행 계획을 위해 최적화합니다. Oracle 튜닝 팩에 따라 라이선스가 부여된 Oracle SQL 튜닝 어드바이저는 자동 SQL 튜닝에 유용할 수 있습니다. 경우에 따라 쿼리를 다시 작성하거나 복잡한 쿼리를 더 작은 청크로 분할해야 할 수 있습니다.

  • Amazon ElastiCache와 같은 캐싱 솔루션과 Oracle Active Data Guard와 같은 Amazon RDS for Oracle 읽기 전용 복제본을 구현하여 읽기 전용 워크로드를 처리하는 것이 좋습니다.

  • 쿼리 최적화 기법에 대해 개발자를 교육하고 표준 운영 절차를 구축하여 쿼리를 프로덕션에 배포하기 전에 평가합니다.

  • 의 데이터베이스 객체 수가 Exadata 온프레미스 데이터베이스와 AWS 동일한지 확인합니다. 테이블, 인덱스, 프로시저, 트리거, 함수, 패키지, 제약 조건 및 기타 객체를 검하십시오.

  • 가능하면 애플리케이션 수정을 고려하세요. (경우에 따라 패키징된 ISV 애플리케이션과 마찬가지로 애플리케이션을 수정할 수 없습니다.) 불필요한 호출을 피하고 필요한 호출 빈도를 줄이세요. SQL 문으로 검색되는 데이터 볼륨을 최소화해 보세요. 커밋 빈도가 비즈니스 로직에 적절하지만 과도하지 않은지 확인합니다. 애플리케이션 수준 캐싱의 사용을 개선해 보세요.

  • 데이터베이스는의 프라이빗 Virtual Private Cloud(VPC)에 있어야 합니다 AWS. 인바운드 및 아웃바운드 트래픽에 대한 네트워크 액세스를 최소 권한 모델로 제한합니다. 보안 그룹 소스는 AWS 계정의 보안 그룹, 접두사 목록 또는 특정 IP 주소 집합(x.x.x.x/32 형식 사용)을 참조해야 합니다. 보안 그룹 소스는 CIDR을 사용해서는 안 되며 보안 그룹은 퍼블릭 인터넷(0.0.0.0/0)에서 액세스할 수 없어야 합니다.