View a markdown version of this page

Emule las matrices PL/SQL asociativas de Oracle en Amazon Aurora PostgreSQL y Amazon RDS for PostgreSQL - Recomendaciones de AWS

Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.

Emule las matrices PL/SQL asociativas de Oracle en Amazon Aurora PostgreSQL y Amazon RDS for PostgreSQL

Rajkumar Raghuwanshi, Bhanu Ganesh Gudivada y Sachin Khanna, Amazon Web Services

Resumen

Este patrón describe cómo emular matrices PL/SQL asociativas de Oracle con posiciones de índice vacías en entornos Amazon Aurora PostgreSQL y Amazon RDS for PostgreSQL. También describe algunas de las diferencias entre las matrices PL/SQL asociativas de Oracle y las matrices PostgreSQL con respecto a la forma en que cada una gestiona las posiciones de índice vacías durante las migraciones.

Ofrecemos una alternativa de PostgreSQL al uso de funciones de aws_oracle_ext para gestionar posiciones de índice vacías al migrar una base de datos de Oracle. Este patrón utiliza una columna adicional para almacenar las posiciones del índice y mantiene la gestión de matrices dispersas por parte de Oracle, a la vez que incorpora las capacidades nativas de PostgreSQL.

Oracle

En Oracle, las recopilaciones pueden inicializarse como vacías y rellenarse mediante el método de recopilación EXTEND, que añade elementos NULL a la matriz. Cuando se trabaja con matrices PL/SQL asociativas indexadas porPLS_INTEGER, el EXTEND método agrega NULL elementos secuencialmente, pero los elementos también se pueden inicializar en posiciones de índice no secuenciales. Cualquier posición de índice que no esté inicializada de forma explícita permanece vacía.

Esta flexibilidad permite estructuras de matriz dispersas en las que los elementos se pueden rellenar en posiciones arbitrarias. Al recorrer las recopilaciones utilizando un FOR LOOP con límites FIRST y LAST, solo se procesan los elementos inicializados (NULL o sin un valor definido), mientras que las posiciones vacías se omiten.

PostgreSQL (Amazon Aurora y Amazon RDS)

PostgreSQL gestiona los valores vacíos de forma diferente a los valores NULL. Almacena los valores vacíos como entidades distintas que utilizan un byte de almacenamiento. Cuando una matriz tiene valores vacíos, PostgreSQL asigna posiciones de índice secuenciales igual que los valores no vacíos. Sin embargo, la indexación secuencial requiere un procesamiento adicional porque el sistema debe recorrer en iteraciones todas las posiciones indexadas, incluidas las vacías. Esto hace que la creación de matrices tradicional sea ineficiente para conjuntos de datos dispersos.

AWS Schema Conversion Tool

El AWS Schema Conversion Tool () normalmente gestiona las migraciones mediante funciones AWS SCT. Oracle-to-PostgreSQL aws_oracle_ext En este patrón, proponemos un enfoque alternativo que utiliza las capacidades nativas de PostgreSQL, que combina los tipos de matrices de PostgreSQL con una columna adicional para almacenar las posiciones del índice. A continuación, el sistema puede recorrer en iteraciones las matrices utilizando únicamente la columna de índice.

Requisitos previos y limitaciones

Requisitos previos 

  • Un activo Cuenta de AWS

  • Permisos de administrador en AWS Identity and Access Management (IAM)

  • Una instancia compatible con Amazon RDS o Aurora PostgreSQL

  • Habilidades de arquitecto o desarrollador de bases de datos con Oracle y PostgreSQL

Limitaciones

  • Algunas Servicios de AWS no están disponibles en todos. Regiones de AWS Para obtener información sobre la disponibilidad en regiones, consulte Servicios de AWS by Region. Para ver los puntos de conexión específicos, consulte la página Service endpoints and quotas y elija el enlace del servicio.

Versiones de producto

Este patrón se probó con las siguientes versiones:

  • Amazon Aurora PostgreSQL 13.3

  • Amazon RDS para PostgreSQL 13.3

  • AWS SCT 1.0.674

  • Oracle 19c EE

Arquitectura

Pila de tecnología de origen

  • On-premises Base de datos Oracle

Pila de tecnología de destino

  • PostgreSQL de Amazon Aurora

  • Amazon RDS para PostgreSQL

Arquitectura de destino

En el diagrama se muestra lo siguiente:

  • Una instancia de base de datos de origen de Amazon RDS para Oracle.

  • Una instancia de Amazon EC2 AWS SCT para convertir las funciones de Oracle al equivalente de PostgreSQL

  • Una base de datos de destino compatible con Amazon Aurora PostgreSQL.

Tools (Herramientas)

Servicios de AWS

Otras herramientas

  • Oracle SQL Developer es un entorno de desarrollo integrado que simplifica el desarrollo y la administración de bases de datos de Oracle, tanto en implementaciones tradicionales como en implementaciones basadas en la nube.

  • pgAdmin es una herramienta de administración de código abierto para PostgreSQL. Proporciona una interfaz gráfica que permite crear, mantener y utilizar objetos de bases de datos. En este patrón, pgAdmin se conecta a la instancia de base de datos de RDS para PostgreSQL y consulta los datos. También puede utilizar el cliente de la línea de comandos psql.

Prácticas recomendadas

  • Pruebe los límites de los conjuntos de datos y los escenarios periféricos.

  • Considere la posibilidad de implementar la gestión de errores para condiciones de índice fuera de los límites.

  • Optimice las consultas para evitar analizar conjuntos de datos dispersos.

Epics

TareaDescripciónHabilidades requeridas

Cree un PL/SQL bloque fuente en Oracle.

Cree un PL/SQL bloque de origen en Oracle que utilice la siguiente matriz asociativa:

DECLARE TYPE country_codes IS TABLE OF VARCHAR2(100) INDEX BY pls_integer; cc country_codes; cc_idx NUMBER := NULL; BEGIN cc(7) := 'India'; cc(3) := 'UK'; cc(5) := 'USA'; cc(0) := 'China'; cc(-2) := 'Invalid'; dbms_output.put_line('cc_length:' || cc.COUNT); IF (cc.COUNT > 0) THEN cc_idx := cc.FIRST; FOR i IN 1..cc.COUNT LOOP dbms_output.put_line('cc_idx:' || cc_idx || ' country:' || cc(cc_idx)); cc_idx := cc.next(cc_idx); END LOOP; END IF; END;
Administrador de base de datos

Ejecute el PL/SQL bloque.

Ejecute el PL/SQL bloque fuente en Oracle. Si hay brechas entre los valores de índice de una matriz asociativa, no se almacena ningún dato en esas brechas. Esto permite que el bucle de Oracle itere únicamente a través de las posiciones del índice.

Administrador de base de datos

Revise la salida.

Se insertaron cinco elementos en la matriz (cc) a intervalos no consecutivos. El recuento de matrices se muestra en el resultado siguiente:

cc_length:5 cc_idx:-2 country:Invalid cc_idx:0 country:China cc_idx:3 country:UK cc_idx:5 country:USA cc_idx:7 country:India
Administrador de base de datos
TareaDescripciónHabilidades requeridas

Cree un PL/pgSQL bloque de destino en PostgreSQL.

Cree un PL/pgSQL bloque de destino en PostgreSQL que utilice la siguiente matriz asociativa:

DO $$ DECLARE cc character varying(100)[]; cc_idx integer := NULL; BEGIN cc[7] := 'India'; cc[3] := 'UK'; cc[5] := 'USA'; cc[0] := 'China'; cc[-2] := 'Invalid'; RAISE NOTICE 'cc_length: %', ARRAY_LENGTH(cc, 1); IF (ARRAY_LENGTH(cc, 1) > 0) THEN FOR i IN ARRAY_LOWER(cc, 1)..ARRAY_UPPER(cc, 1) LOOP RAISE NOTICE 'cc_idx:% country:%', i, cc[i]; END LOOP; END IF; END; $$;
Administrador de base de datos

Ejecute el bloque. PL/pgSQL

Ejecute el PL/pgSQL bloque de destino en PostgreSQL. Si hay brechas entre los valores de índice de una matriz asociativa, no se almacena ningún dato en esas brechas. Esto permite que el bucle de PostgreSQL itere solo a través de las posiciones del índice.

Administrador de base de datos

Revise la salida.

La longitud de la matriz es superior a 5 porque NULL se almacena en las brechas entre las posiciones del índice. Como se muestra en el siguiente resultado, el bucle completa 10 iteraciones para recuperar 5 valores de la matriz.

cc_length:10 cc_idx:-2 country:Invalid cc_idx:-1 country:<NULL> cc_idx:0 country:China cc_idx:1 country:<NULL> cc_idx:2 country:<NULL> cc_idx:3 country:UK cc_idx:4 country:<NULL> cc_idx:5 country:USA cc_idx:6 country:<NULL> cc_idx:7 country:India
Administrador de base de datos
TareaDescripciónHabilidades requeridas

Cree un PL/pgSQL bloque de destino con una matriz y un tipo definido por el usuario.

Para optimizar el rendimiento y adaptarlo a la funcionalidad de Oracle, podemos crear un tipo definido por el usuario que almacene tanto las posiciones del índice como sus datos correspondientes. Este enfoque reduce las iteraciones innecesarias al mantener las asociaciones directas entre los índices y los valores.

DO $$ DECLARE cc country_codes[]; cc_append country_codes := NULL; i record; BEGIN cc_append.idx = 7; cc_append.val = 'India'; cc := array_append(cc, cc_append); cc_append.idx = 3; cc_append.val = 'UK'; cc := array_append(cc, cc_append); cc_append.idx = 5; cc_append.val = 'USA'; cc := array_append(cc, cc_append); cc_append.idx = 0; cc_append.val = 'China'; cc := array_append(cc, cc_append); cc_append.idx = - 2; cc_append.val = 'Invalid'; cc := array_append(cc, cc_append); RAISE NOTICE 'cc_length: %', ARRAY_LENGTH(cc, 1); IF (ARRAY_LENGTH(cc, 1) > 0) THEN FOR i IN ( SELECT * FROM unnest(cc) ORDER BY idx) LOOP RAISE NOTICE 'cc_idx:% country:%', i.idx, i.val; END LOOP; END IF; END; $$;
Administrador de base de datos

Ejecuta el PL/pgSQL bloque.

Ejecuta el PL/pgSQL bloque objetivo. Si hay brechas entre los valores de índice de una matriz asociativa, no se almacena ningún dato en esas brechas. Esto permite que el bucle de PostgreSQL itere solo a través de las posiciones del índice.

Administrador de base de datos

Revise la salida.

Como se muestra en el siguiente resultado, el tipo definido por el usuario almacena solo los elementos de datos rellenados, lo que significa que la longitud de la matriz coincide con el número de valores. Como resultado, las iteraciones de LOOP se optimizan para procesar solo los datos existentes, lo que elimina la necesidad de rastrear las posiciones vacías.

cc_length:5 cc_idx:-2 country:Invalid cc_idx:0 country:China cc_idx:3 country:UK cc_idx:5 country:USA cc_idx:7 country:India
Administrador de base de datos

Resolución de problemas

ProblemaSolución

Error de indexación fuera de los límites

  • Problema: ERROR: array subscript out of bounds al acceder a los elementos de la matriz

  • Causa: se intenta acceder a una posición de índice que no existe en la matriz de tipos definida por el usuario

Puede validar la existencia del índice antes del acceso utilizando un filtro de WHERE cláusulas en la idx columna al desanidar la matriz, o bien puede implementar controles de límites en el código. PL/pgSQL

Gestión de valores NULOS

  • Problema: aparecen valores NULL inesperados en los resultados de la consulta al recorrer la matriz

  • Causa: los elementos de la matriz no se inicializaron correctamente con ambos val campos antes de idx añadirlos

Asegúrese de que ambos campos del tipo definido por el usuario estén rellenados antes de usarlos. array_append() Añada comprobaciones NULL explícitas de la siguiente manera: IF cc_append.val IS NOT NULL THEN cc := array_append(cc, cc_append); END IF;

Recursos relacionados

AWS documentación

Otra documentación

Información adicional

Consideraciones sobre el rendimiento

  • Este enfoque reduce la sobrecarga de iteración en un 50% o más para las matrices dispersas en comparación con las matrices PostgreSQL nativas con marcadores de posición NULL.

  • La eficiencia del almacenamiento mejora porque solo se almacenan los datos reales, no las posiciones de índice vacías.

Notas de compatibilidad

  • Este patrón mantiene la semántica de matrices dispersas de Oracle y, al mismo tiempo, utiliza las capacidades de matrices nativas de PostgreSQL.

  • La solución es compatible con todas las versiones de PostgreSQL que admiten tipos compuestos definidos por el usuario.