Migración de una base de datos de Oracle en las instalaciones a Amazon RDS para Oracle mediante Oracle Data Pump - Recomendaciones de AWS

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Migración de una base de datos de Oracle en las instalaciones a Amazon RDS para Oracle mediante Oracle Data Pump

Creado por Rizwan Wangde (AWS)

Numerosos patrones cubren la migración de bases de datos Oracle locales a Amazon Relational Database Service (Amazon RDS) para Oracle mediante Oracle Data Pump, una utilidad nativa de Oracle que es la forma preferida de migrar grandes cargas de trabajo de Oracle. Estos patrones suelen implicar la exportación de tablas o esquemas de aplicaciones a archivos de volcado, la transferencia de los archivos de volcado a un directorio de base de datos en Amazon RDS para Oracle y, a continuación, la importación de los esquemas de aplicación y los datos de los archivos de volcado.

Con este enfoque, la migración puede tardar más en función del tamaño de los datos y del tiempo que se tarde en transferir los archivos de volcado a la instancia de Amazon RDS. Además, los archivos de volcado residen en el volumen Amazon Elastic Block Store (Amazon EBS) de la instancia de Amazon RDS, que debe ser lo suficientemente grande para la base de datos y los archivos de volcado. Si los archivos volcados se eliminan tras la importación, no se puede recuperar el espacio vacío, por lo que tendrá que pagar por el espacio no utilizado.

Este patrón mitiga estos problemas al realizar una importación directa en la instancia de Amazon RDS mediante la API de Oracle Data Pump (DBMS_DATAPUMP) a través de un enlace de base de datos. El patrón inicia una canalización de exportación e importación simultánea entre las bases de datos de origen y destino. Este patrón no requiere ajustar el tamaño de un volumen de EBS para los archivos de volcado porque no se crea ni almacena ningún archivo de volcado en el volumen. Este enfoque ahorra el costo mensual del espacio en disco no utilizado.

Requisitos previos 

  • Una cuenta de Amazon Web Services (AWS) activa.

  • Una nube privada virtual (VPC) configurada con subredes privadas en al menos dos zonas de disponibilidad, para proporcionar la infraestructura de red para la instancia de Amazon RDS.

  • Una base de datos de Oracle en un centro de datos local o autogestionada en Amazon Elastic Compute Cloud (Amazon EC2).

  • Una instancia de Amazon RDS for Oracle existente en una única zona de disponibilidad. El uso de una única zona de disponibilidad mejora el rendimiento de escritura durante la migración. Se puede habilitar una implementación Multi-AZ entre 24 y 48 horas antes de la transición.

    Esta solución también puede utilizar Amazon RDS Custom for Oracle como destino.

  • AWS Direct Connect (recomendado para bases de datos de gran tamaño).

  • La conectividad de red y las reglas de firewall locales están configuradas para permitir una conexión entrante desde la instancia de Amazon RDS a la base de datos de Oracle en las instalaciones.

Limitaciones

  • El límite de tamaño de la base de datos en Amazon RDS for Oracle es de 64 tebibytes (TiB) a partir de diciembre de 2022.

  • El tamaño máximo de un único archivo en una instancia de base de datos de Amazon RDS for Oracle es de 16 TiB. Es importante saberlo porque es posible que necesite distribuir las tablas en varios espacios de tablas.

Versiones de producto

  • Base de datos de origen: base de datos de Oracle 10g, versión 1 y posteriores.

  • Base de datos de destino: para obtener la lista más reciente de versiones y ediciones compatibles en Amazon RDS, consulte Amazon RDS para Oracle en la documentación de AWS.

Pila de tecnología de origen

  • Base de datos de Oracle autoadministrada en las instalaciones o en la nube

Pila de tecnología de destino

  • Amazon RDS para Oracle o Amazon RDS Custom para Oracle

Arquitectura de destino

El siguiente diagrama muestra la arquitectura para migrar de una base de datos de Oracle en las instalaciones a Amazon RDS para Oracle en un entorno Single-AZ. Las direcciones de las flechas representan el flujo de datos en la arquitectura. El diagrama no muestra qué componente está iniciando la conexión.

Migración completa para una base de datos Oracle local.
  1. La instancia de Amazon RDS para Oracle se conecta a la base de datos de Oracle de origen en las instalaciones para realizar una migración a plena carga a través del enlace de la base de datos.

  2. AWS Database Migration Service (AWS DMS) se conecta a la base de datos Oracle de origen local para realizar una replicación continua mediante la captura de datos de cambios (CDC).

  3. Los cambios de los CDC se aplican a la base de datos de Amazon RDS para Oracle.

Servicios de AWS

  • AWS Database Migration Service (AWS DMS) le ayuda a migrar los almacenes de datos a una combinación de configuraciones locales y en la nube Nube de AWS o entre ellas. Este patrón usa CDC y la configuración Replicar solo cambios de datos.

  • AWS Direct Connectconecta su red interna a una AWS Direct Connect ubicación a través de un cable Ethernet de fibra óptica estándar. Con esta conexión, puede crear interfaces virtuales directamente con las públicas y, al Servicios de AWS mismo tiempo, omitir a los proveedores de servicios de Internet en su ruta de red.

  • Amazon Relational Database Service le ayuda a configurar, operar y escalar una base de datos relacional de Oracle en la nube de AWS.

Otras herramientas

Aunque AWS Direct Connect utiliza conexiones de red privadas y dedicadas entre la red local AWS, considere las siguientes opciones para aumentar la seguridad y el cifrado de los datos en tránsito:

TareaDescripciónHabilidades requeridas

Configurar la conectividad de red desde la base de datos de destino a la base de datos de origen.

Configure el firewall y la red en las instalaciones para permitir la conexión entrante desde la instancia de Amazon RDS de destino a la base de datos de Oracle de origen en las instalaciones.

Administrador de redes, ingeniero de seguridad

Crear un usuario de base de datos con los privilegios adecuados.

Cree un usuario de base de datos en la base de datos Oracle de origen local con privilegios para migrar datos entre el origen y el destino mediante Oracle Data Pump:

GRANT CONNECT to <migration_user>; GRANT DATAPUMP_EXP_FULL_DATABASE to <migration_user>; GRANT SELECT ANY TABLE to <migration_user>;
Administrador de base de datos

Prepare la base de datos fuente local para la migración a AWS DMS los CDC.

(Opcional) Prepare la base de datos Oracle de origen local para la migración a AWS DMS los CDC después de completar la carga completa de Oracle Data Pump:

  1. Configure los privilegios adicionales necesarios para gestionar FLASHBACK durante la migración de Oracle Data Pump:

    GRANT FLASHBACK ANY TABLE to <migration_user>; GRANT FLASHBACK ARCHIVE ADMINISTER to <migration_user>;
  2. Para configurar los privilegios de las cuentas de usuario necesarios en una fuente de Oracle autogestionada AWS DMS, consulte la AWS DMS documentación.

  3. Para preparar una base de datos fuente autogestionada de Oracle para su uso por los CDC AWS DMS, consulte la AWS DMS documentación.

Administrador de base de datos

Instalar y configurar SQL Developer.

Instale y configure SQL Developer para conectar y ejecutar consultas SQL en las bases de datos de origen y destino.

Administrador de base de datos, ingeniero de migraciones

Generar un script para crear los espacios de tabla.

Utilice el siguiente ejemplo de consulta SQL para generar el script en la base de datos de origen:

SELECT 'CREATE TABLESPACE ' tablespace_name ' DATAFILE SIZE 1G AUTOEXTEND ON MAXSIZE UNLIMITED;' from dba_tablespaces where tablespace_name not in ('SYSTEM', 'SYSAUX','TEMP','UNDOTBS1') order by 1;

El script se aplicará en la base de datos de destino.

Administrador de base de datos

Generar un script para crear usuarios, perfiles, roles y privilegios.

Para generar un script para crear los usuarios, perfiles, funciones y privilegios de la base de datos, utilice los scripts del documento de Oracle Support Cómo extraer DDL para usuario, incluidos los privilegios y roles mediante dbms_metadata.get_ddl (ID de documento 2739952.1) (se requiere una cuenta de Oracle).

El script se aplicará en la base de datos de destino.

Administrador de base de datos
TareaDescripciónHabilidades requeridas

Crear un enlace de base de datos a la base de datos origen y verificar la conectividad.

Para crear un enlace de base de datos a la base de datos de origen local, puede utilizar el siguiente comando de ejemplo:

CREATE DATABASE LINK link2src CONNECT TO <migration_user_account> IDENTIFIED BY <password> USING '(DESCRIPTION=(ADDRESS=(PROTOCOL=TCP)(HOST=<dns or ip address of remote db>) (PORT=<listener port>))(CONNECT_DATA=(SID=<remote SID>)))';

Para comprobar la conectividad, ejecute el siguiente comando SQL:

select * from dual@link2src;

La conectividad es correcta si la respuesta es X.

Administrador de base de datos

Ejecute los scripts para preparar la instancia de destino.

Ejecute los scripts generados anteriormente para preparar la instancia de Amazon RDS para Oracle:

  1. Espacios de tabla

  2. Perfiles

  3. Roles

Esto ayuda a garantizar que la migración de Oracle Data Pump pueda crear los esquemas y sus objetos.

Administrador de base de datos, ingeniero de migraciones
TareaDescripciónHabilidades requeridas

Migre los esquemas necesarios.

Para migrar los esquemas necesarios de la base de datos en las instalaciones de origen a la instancia de Amazon RDS de destino, utilice el código de la sección de información adicional:

Para ajustar el rendimiento de la migración, puede ajustar el número de procesos paralelos ejecutando el siguiente comando:

DBMS_DATAPUMP.SET_PARALLEL (handle => v_hdnl, degree => 4);
Administrador de base de datos

Recopile estadísticas de esquema para mejorar el rendimiento.

El comando Recopilar estadísticas del esquema devuelve las estadísticas del optimizador de consultas de Oracle recopiladas para los objetos de la base de datos. Con esta información, el optimizador puede seleccionar el mejor plan de ejecución para cualquier consulta relacionada con estos objetos:

EXECUTE DBMS_STATS.GATHER_SCHEMA_STATS(ownname => '<schema_name>');
Administrador de base de datos
TareaDescripciónHabilidades requeridas

Capturar el SCN en la base de datos en las instalaciones de origen de Oracle.

Capture el número de cambio del sistema (SCN) en la base de datos de Oracle en las instalaciones de origen. Debe utilizar el SCN para la importación a plena carga y como punto de partida para la replicación de los CDC.

Para generar el SCN actual en la base de datos de origen, ejecute la siguiente sentencia SQL:

SELECT current_scn FROM V$DATABASE;
Administrador de base de datos

Realizar la migración a plena carga de los esquemas.

Para migrar los esquemas necesarios (FULL LOAD) de la base de datos en las instalaciones de origen a la instancia de Amazon RDS de destino, haga lo siguiente:

En el código, <CURRENT_SCN_VALUE_IN_SOURCE_DATABASE> sustitúyalo por el SCN que capturó de la base de datos de origen:

DBMS_DATAPUMP.SET_PARAMETER (handle => v_hdnl, name => 'FLASHBACK_SCN', value => <CURRENT_SCN_VALUE_IN_SOURCE_DATABASE>);

Para ajustar el rendimiento de la migración, puede ajustar el número de procesos paralelos:

DBMS_DATAPUMP.SET_PARALLEL (handle => v_hdnl, degree => 4);
Administrador de base de datos

Deshabilitar los desencadenadores en los esquemas migrados.

Antes de comenzar la tarea AWS DMS exclusiva de los CDC, desactive la opción situada TRIGGERS debajo de los esquemas migrados.

Administrador de base de datos

Recopile estadísticas de esquema para mejorar el rendimiento.

El comando Gather Schema Statistics devuelve las estadísticas del optimizador de consultas de Oracle recopiladas para los objetos de la base de datos:

EXECUTE DBMS_STATS.GATHER_SCHEMA_STATS(ownname => '<schema_name>');

Con esta información, el optimizador puede seleccionar el mejor plan de ejecución para cualquier consulta relacionada con estos objetos.

Administrador de base de datos

Se utiliza AWS DMS para realizar una replicación continua desde el origen hasta el destino.

Se utiliza AWS DMS para realizar una replicación continua desde la base de datos de Oracle de origen a la instancia de Amazon RDS for Oracle de destino.

Para obtener más información, consulte Creación de tareas para la replicación continua utilizando AWS DMS y la entrada del blog Cómo trabajar con el soporte nativo de los CDC en AWS DMS.

Administrador de base de datos, ingeniero de migraciones
TareaDescripciónHabilidades requeridas

Habilitar la opción Multi-AZ en la instancia 48 horas antes de la transición.

Si se trata de una instancia de producción, recomendamos habilitar la implementación Multi-AZ en la instancia de Amazon RDS para ofrecer las ventajas de la alta disponibilidad (HA) y la recuperación de desastres (DR).

Administrador de base de datos, ingeniero de migraciones

Detenga la tarea AWS DMS exclusiva de los CDC (si los CDC estaban activados).

  1. Asegúrese de que la latencia de origen y la latencia de destino en las CloudWatch métricas de Amazon de la AWS DMS tarea muestren 0 segundos.

  2. Detenga la tarea AWS DMS exclusiva de los CDC.

Administrador de base de datos

Habilitar los desencadenadores.

Active lo TRIGGERS que deshabilitó antes de crear la tarea de los CDC.

Administrador de base de datos

AWS

Documentación de Oracle

Código 1: solo migración a carga completa, esquema de aplicación única

DECLARE v_hdnl NUMBER; BEGIN v_hdnl := DBMS_DATAPUMP.OPEN(operation => 'IMPORT', job_mode => 'SCHEMA', remote_link => '<DB LINK Name to Source Database>', job_name => null); DBMS_DATAPUMP.ADD_FILE( handle => v_hdnl, filename => 'import_01.log', directory => 'DATA_PUMP_DIR', filetype => dbms_datapump.ku$_file_type_log_file); DBMS_DATAPUMP.METADATA_FILTER(v_hdnl,'SCHEMA_EXPR','IN (''<schema_name>'')'); -- To migrate one selected schema DBMS_DATAPUMP.METADATA_FILTER (hdnl, 'EXCLUDE_PATH_EXPR','IN (''STATISTICS'')'); -- To prevent gathering Statistics during the import DBMS_DATAPUMP.SET_PARALLEL (handle => v_hdnl, degree => 4); -- Number of parallel processes performing export and import DBMS_DATAPUMP.START_JOB(v_hdnl); END; /

Código 2: solo migración a carga completa, esquemas de aplicaciones múltiples

DECLARE v_hdnl NUMBER; BEGIN v_hdnl := DBMS_DATAPUMP.OPEN(operation => 'IMPORT', job_mode => 'SCHEMA', remote_link => '<DB LINK Name to Source Database>', job_name => null); DBMS_DATAPUMP.ADD_FILE( handle => v_hdnl, filename => 'import_01.log', directory => 'DATA_PUMP_DIR', filetype => dbms_datapump.ku$_file_type_log_file); DBMS_DATAPUMP.METADATA_FILTER (v_hdnl, 'SCHEMA_LIST', '''<SCHEMA_1>'',''<SCHEMA_2>'', ''<SCHEMA_3>'''); -- To migrate multiple schemas DBMS_DATAPUMP.METADATA_FILTER (v_hdnl, 'EXCLUDE_PATH_EXPR','IN (''STATISTICS'')'); -- To prevent gathering Statistics during the import DBMS_DATAPUMP.SET_PARALLEL (handle => v_hdnl, degree => 4); -- Number of parallel processes performing export and import DBMS_DATAPUMP.START_JOB(v_hdnl); END; /

Código 3: migración a carga completa antes de una tarea exclusiva de CDC, esquema de aplicación única

DECLARE v_hdnl NUMBER; BEGIN v_hdnl := DBMS_DATAPUMP.OPEN(operation => 'IMPORT', job_mode => 'SCHEMA', remote_link => '<DB LINK Name to Source Database>', job_name => null); DBMS_DATAPUMP.ADD_FILE( handle => v_hdnl, filename => 'import_01.log', directory => 'DATA_PUMP_DIR', filetype => dbms_datapump.ku$_file_type_log_file); DBMS_DATAPUMP.METADATA_FILTER(v_hdnl,'SCHEMA_EXPR','IN (''<schema_name>'')'); -- To migrate one selected schema DBMS_DATAPUMP.METADATA_FILTER (v_hdnl, 'EXCLUDE_PATH_EXPR','IN (''STATISTICS'')'); -- To prevent gathering Statistics during the import DBMS_DATAPUMP.SET_PARAMETER (handle => v_hdnl, name => 'FLASHBACK_SCN', value => <CURRENT_SCN_VALUE_IN_SOURCE_DATABASE>); -- SCN required for AWS DMS CDC only task. DBMS_DATAPUMP.SET_PARALLEL (handle => v_hdnl, degree => 4); -- Number of parallel processes performing export and import DBMS_DATAPUMP.START_JOB(v_hdnl); END; /

Código 4: migración a carga completa antes de una tarea exclusiva para CDC, esquemas de aplicaciones múltiples

DECLARE v_hdnl NUMBER; BEGIN v_hdnl := DBMS_DATAPUMP.OPEN (operation => 'IMPORT', job_mode => 'SCHEMA', remote_link => '<DB LINK Name to Source Database>', job_name => null); DBMS_DATAPUMP.ADD_FILE (handle => v_hdnl, filename => 'import_01.log', directory => 'DATA_PUMP_DIR', filetype => dbms_datapump.ku$_file_type_log_file); DBMS_DATAPUMP.METADATA_FILTER (v_hdnl, 'SCHEMA_LIST', '''<SCHEMA_1>'',''<SCHEMA_2>'', ''<SCHEMA_3>'''); -- To migrate multiple schemas DBMS_DATAPUMP.METADATA_FILTER (v_hdnl, 'EXCLUDE_PATH_EXPR','IN (''STATISTICS'')'); -- To prevent gathering Statistics during the import DBMS_DATAPUMP.SET_PARAMETER (handle => v_hdnl, name => 'FLASHBACK_SCN', value => <CURRENT_SCN_VALUE_IN_SOURCE_DATABASE>); -- SCN required for AWS DMS CDC only task. DBMS_DATAPUMP.SET_PARALLEL (handle => v_hdnl, degree => 4); -- Number of parallel processes performing export and import DBMS_DATAPUMP.START_JOB(v_hdnl); END; /

Escenario en el que un enfoque de migración mixto puede funcionar mejor

En raras ocasiones, en las que la base de datos de origen contiene tablas con millones de filas y columnas LOBSEGMENT de gran tamaño, este patrón ralentizará la migración. Oracle migra a LOBSEGMENTs través del enlace de red de uno en uno. Extrae una sola fila (junto con los datos de la columna LOB) de la tabla de origen e inserta la fila en la tabla de destino, repitiendo el proceso hasta que se migren todas las filas. Oracle Data Pump a través del enlace de la base de datos no admite los mecanismos de carga masiva o de carga por LOBSEGMENTs ruta directa.

En las siguientes situaciones, se recomienda:

  • Omita las tablas identificadas durante la migración de Oracle Data Pump añadiendo el siguiente filtro de metadatos:

    dbms_datapump.metadata_filter(handle =>h1, name=>'NAME_EXPR', value => 'NOT IN (''TABLE_1'',''TABLE_2'')');
  • Utilice una AWS DMS tarea (migración a carga completa, con replicación de CDC si es necesaria) para migrar las tablas identificadas. AWS DMS extraerá varias filas de la base de datos Oracle de origen y las insertará en un lote en la instancia de Amazon RDS de destino, lo que mejora el rendimiento.