Emulación de las matrices asociativas PL/SQL de Oracle en Amazon Aurora PostgreSQL y Amazon RDS para PostgreSQL - Recomendaciones de AWS

Emulación de las matrices asociativas PL/SQL de Oracle en Amazon Aurora PostgreSQL y Amazon RDS para PostgreSQL

Rajkumar Raghuwanshi, Bhanu Ganesh Gudivada y Sachin Khanna, Amazon Web Services

Resumen

Este patrón describe cómo emular matrices asociativas PL/SQL de Oracle con posiciones de índice vacías en entornos de Amazon Aurora PostgreSQL y Amazon RDS para PostgreSQL. También describe algunas de las diferencias entre las matrices asociativas PL/SQL de Oracle y las matrices PostgreSQL con respecto a la forma en que cada una gestiona las posiciones de índice vacías durante las migraciones.

Ofrecemos una alternativa de PostgreSQL al uso de funciones de aws_oracle_ext para gestionar posiciones de índice vacías al migrar una base de datos de Oracle. Este patrón utiliza una columna adicional para almacenar las posiciones del índice y mantiene la gestión de matrices dispersas por parte de Oracle, a la vez que incorpora las capacidades nativas de PostgreSQL.

Oracle

En Oracle, las recopilaciones pueden inicializarse como vacías y rellenarse mediante el método de recopilación EXTEND, que añade elementos NULL a la matriz. Cuando se trabaja con matrices asociativas de PL/SQL indexadas por PLS_INTEGER, el método EXTEND añade elementos NULL secuencialmente, pero los elementos también se pueden inicializar en posiciones de índice no secuenciales. Cualquier posición de índice que no esté inicializada de forma explícita permanece vacía.

Esta flexibilidad permite estructuras de matriz dispersas en las que los elementos se pueden rellenar en posiciones arbitrarias. Al recorrer las recopilaciones utilizando un FOR LOOP con límites FIRST y LAST, solo se procesan los elementos inicializados (NULL o sin un valor definido), mientras que las posiciones vacías se omiten.

PostgreSQL (Amazon Aurora y Amazon RDS)

PostgreSQL gestiona los valores vacíos de forma diferente a los valores NULL. Almacena los valores vacíos como entidades distintas que utilizan un byte de almacenamiento. Cuando una matriz tiene valores vacíos, PostgreSQL asigna posiciones de índice secuenciales igual que los valores no vacíos. Sin embargo, la indexación secuencial requiere un procesamiento adicional porque el sistema debe recorrer en iteraciones todas las posiciones indexadas, incluidas las vacías. Esto hace que la creación de matrices tradicional sea ineficiente para conjuntos de datos dispersos.

AWS Schema Conversion Tool

AWS Schema Conversion Tool (AWS SCT) normalmente gestiona las migraciones de Oracle a PostgreSQL mediante funciones de aws_oracle_ext. En este patrón, proponemos un enfoque alternativo que utiliza las capacidades nativas de PostgreSQL, que combina los tipos de matrices de PostgreSQL con una columna adicional para almacenar las posiciones del índice. A continuación, el sistema puede recorrer en iteraciones las matrices utilizando únicamente la columna de índice.

Requisitos previos y limitaciones

Requisitos previos

  • Una Cuenta de AWS activa.

  • Un usuario de AWS Identity and Access Management (IAM) con permisos de administrador.

  • Una instancia compatible con Amazon RDS o Aurora PostgreSQL.

  • Una comprensión básica de las bases de datos relacionales.

Limitaciones

  • Algunos Servicios de AWS no están disponibles en todas las Regiones de AWS. Para obtener información sobre la disponibilidad en regiones, consulte Servicios de AWS by Region. Para ver los puntos de conexión específicos, consulte la página Service endpoints and quotas y elija el enlace del servicio.

Versiones de producto

Este patrón se probó con las siguientes versiones:

  • Amazon Aurora PostgreSQL 13.3

  • Amazon RDS para PostgreSQL 13.3

  • AWS SCT 1.0.674

  • Oracle 12c EE 12.2

Arquitectura

Pila de tecnología de origen

  • Base de datos de Oracle en las instalaciones

Pila de tecnología de destino

  • PostgreSQL de Amazon Aurora

  • Amazon RDS para PostgreSQL

Arquitectura de destino

En el diagrama se muestra lo siguiente:

  • Una instancia de base de datos de origen de Amazon RDS para Oracle.

  • Una instancia de Amazon EC2 con AWS SCT para convertir las funciones de Oracle al equivalente de PostgreSQL

  • Una base de datos de destino compatible con Amazon Aurora PostgreSQL.

Herramientas

Servicios de AWS

Otras herramientas

  • Oracle SQL Developer es un entorno de desarrollo integrado que simplifica el desarrollo y la administración de bases de datos de Oracle, tanto en implementaciones tradicionales como en implementaciones basadas en la nube.

  • pgAdmin es una herramienta de administración de código abierto para PostgreSQL. Proporciona una interfaz gráfica que permite crear, mantener y utilizar objetos de bases de datos. En este patrón, pgAdmin se conecta a la instancia de base de datos de RDS para PostgreSQL y consulta los datos. También puede utilizar el cliente de la línea de comandos psql.

Prácticas recomendadas

  • Pruebe los límites de los conjuntos de datos y los escenarios periféricos.

  • Considere la posibilidad de implementar la gestión de errores para condiciones de índice fuera de los límites.

  • Optimice las consultas para evitar analizar conjuntos de datos dispersos.

Epics

TareaDescripciónHabilidades requeridas

Cree un bloque PL/SQL de origen en Oracle.

Cree un bloque PL/SQL de origen en Oracle que utilice la siguiente matriz asociativa:

DECLARE TYPE country_codes IS TABLE OF VARCHAR2(100) INDEX BY pls_integer; cc country_codes; cc_idx NUMBER := NULL; BEGIN cc(7) := 'India'; cc(3) := 'UK'; cc(5) := 'USA'; cc(0) := 'China'; cc(-2) := 'Invalid'; dbms_output.put_line('cc_length:' || cc.COUNT); IF (cc.COUNT > 0) THEN cc_idx := cc.FIRST; FOR i IN 1..cc.COUNT LOOP dbms_output.put_line('cc_idx:' || cc_idx || ' country:' || cc(cc_idx)); cc_idx := cc.next(cc_idx); END LOOP; END IF; END;
Administrador de base de datos

Ejecute el bloque PL/SQL.

Ejecute el bloque PL/SQL de origen en Oracle. Si hay brechas entre los valores de índice de una matriz asociativa, no se almacena ningún dato en esas brechas. Esto permite que el bucle de Oracle itere únicamente a través de las posiciones del índice.

Administrador de base de datos

Revise la salida.

Se insertaron cinco elementos en la matriz (cc) a intervalos no consecutivos. El recuento de matrices se muestra en el resultado siguiente:

cc_length:5 cc_idx:-2 country:Invalid cc_idx:0 country:China cc_idx:3 country:UK cc_idx:5 country:USA cc_idx:7 country:India
Administrador de base de datos
TareaDescripciónHabilidades requeridas

Cree un bloque PL/pgSQL de destino en PostgreSQL.

Cree un bloque PL/pgSQL de destino en PostgreSQL que utilice la siguiente matriz asociativa:

DO $$ DECLARE cc character varying(100)[]; cc_idx integer := NULL; BEGIN cc[7] := 'India'; cc[3] := 'UK'; cc[5] := 'USA'; cc[0] := 'China'; cc[-2] := 'Invalid'; RAISE NOTICE 'cc_length: %', ARRAY_LENGTH(cc, 1); IF (ARRAY_LENGTH(cc, 1) > 0) THEN FOR i IN ARRAY_LOWER(cc, 1)..ARRAY_UPPER(cc, 1) LOOP RAISE NOTICE 'cc_idx:% country:%', i, cc[i]; END LOOP; END IF; END; $$;
Administrador de base de datos

Ejecute el bloque PL/pgSQL.

Ejecute el bloque PL/pgSQL de destino en PostgreSQL. Si hay brechas entre los valores de índice de una matriz asociativa, no se almacena ningún dato en esas brechas. Esto permite que el bucle de Oracle itere únicamente a través de las posiciones del índice.

Administrador de base de datos

Revise la salida.

La longitud de la matriz es superior a 5 porque NULL se almacena en las brechas entre las posiciones del índice. Como se muestra en el siguiente resultado, el bucle completa 10 iteraciones para recuperar 5 valores de la matriz.

cc_length:10 cc_idx:-2 country:Invalid cc_idx:-1 country:<NULL> cc_idx:0 country:China cc_idx:1 country:<NULL> cc_idx:2 country:<NULL> cc_idx:3 country:UK cc_idx:4 country:<NULL> cc_idx:5 country:USA cc_idx:6 country:<NULL> cc_idx:7 country:India
Administrador de base de datos
TareaDescripciónHabilidades requeridas

Cree un bloque PL/pgSQL de destino con una matriz y un tipo definido por el usuario.

Para optimizar el rendimiento y adaptarlo a la funcionalidad de Oracle, podemos crear un tipo definido por el usuario que almacene tanto las posiciones del índice como sus datos correspondientes. Este enfoque reduce las iteraciones innecesarias al mantener las asociaciones directas entre los índices y los valores.

DO $$ DECLARE cc country_codes[]; cc_append country_codes := NULL; i record; BEGIN cc_append.idx = 7; cc_append.val = 'India'; cc := array_append(cc, cc_append); cc_append.idx = 3; cc_append.val = 'UK'; cc := array_append(cc, cc_append); cc_append.idx = 5; cc_append.val = 'USA'; cc := array_append(cc, cc_append); cc_append.idx = 0; cc_append.val = 'China'; cc := array_append(cc, cc_append); cc_append.idx = - 2; cc_append.val = 'Invalid'; cc := array_append(cc, cc_append); RAISE NOTICE 'cc_length: %', ARRAY_LENGTH(cc, 1); IF (ARRAY_LENGTH(cc, 1) > 0) THEN FOR i IN ( SELECT * FROM unnest(cc) ORDER BY idx) LOOP RAISE NOTICE 'cc_idx:% country:%', i.idx, i.val; END LOOP; END IF; END; $$;
Administrador de base de datos

Ejecute el bloque PL/pgSQL.

Ejecute el bloque PL/pgSQL de destino. Si hay brechas entre los valores de índice de una matriz asociativa, no se almacena ningún dato en esas brechas. Esto permite que el bucle de Oracle itere únicamente a través de las posiciones del índice.

Administrador de base de datos

Revise la salida.

Como se muestra en el siguiente resultado, el tipo definido por el usuario almacena solo los elementos de datos rellenados, lo que significa que la longitud de la matriz coincide con el número de valores. Como resultado, las iteraciones de LOOP se optimizan para procesar solo los datos existentes, lo que elimina la necesidad de rastrear las posiciones vacías.

cc_length:5 cc_idx:-2 country:Invalid cc_idx:0 country:China cc_idx:3 country:UK cc_idx:5 country:USA cc_idx:7 country:India
Administrador de base de datos

Recursos relacionados

Documentación de AWS

Otra documentación