View a markdown version of this page

Emule matrizes PL/SQL associativas Oracle no Amazon Aurora PostgreSQL e no Amazon RDS for PostgreSQL - Recomendações da AWS

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Emule matrizes PL/SQL associativas Oracle no Amazon Aurora PostgreSQL e no Amazon RDS for PostgreSQL

Rajkumar Raghuwanshi, Bhanu Ganesh Gudivada e Sachin Khanna, Amazon Web Services

Resumo

Esse padrão descreve como emular matrizes PL/SQL associativas Oracle com posições de índice vazias nos ambientes Amazon Aurora PostgreSQL e Amazon RDS for PostgreSQL. Ele também descreve algumas das diferenças entre matrizes PL/SQL associativas Oracle e matrizes PostgreSQL com relação à forma como cada uma lida com posições de índice vazias durante as migrações.

Fornecemos uma alternativa em PostgreSQL para o uso das funções aws_oracle_ext no tratamento de posições de índice vazias durante a migração de um banco de dados da Oracle. Este padrão faz uso de uma coluna adicional para armazenar as posições de índice e preserva o tratamento da Oracle para matrizes esparsas, ao mesmo tempo em que incorpora as funcionalidades nativas do PostgreSQL.

Oracle

Na Oracle, as coleções podem ser inicializadas como vazias e preenchidas utilizando o método EXTEND da coleção, que adiciona elementos NULL à matriz. Ao trabalhar com matrizes PL/SQL associativas indexadas porPLS_INTEGER, o EXTEND método adiciona NULL elementos sequencialmente, mas os elementos também podem ser inicializados em posições de índice não sequenciais. Qualquer posição de índice que não seja explicitamente inicializada permanece vazia.

Essa flexibilidade possibilita estruturas de matrizes esparsas nas quais os elementos podem ser preenchidos em posições arbitrárias. Ao realizar iteração pelas coleções usando um FOR LOOP com limites FIRST e LAST, apenas os elementos inicializados (sejam NULL ou com um valor definido) são processados, enquanto as posições vazias são ignoradas.

PostgreSQL (Amazon Aurora e Amazon RDS)

O PostgreSQL trata valores vazios de maneira diferente de valores NULL. Ele armazena valores vazios como entidades distintas que ocupam um byte de armazenamento. Quando uma matriz contém valores vazios, o PostgreSQL atribui posições de índice sequenciais da mesma forma que para valores não vazios. Porém, a indexação sequencial requer processamento adicional, pois o sistema precisa iterar por todas as posições indexadas, incluindo as vazias. Isso torna a criação tradicional de matrizes ineficiente para conjuntos de dados esparsos.

AWS Schema Conversion Tool

O AWS Schema Conversion Tool (AWS SCT) normalmente lida com Oracle-to-PostgreSQL migrações usando aws_oracle_ext funções. Neste padrão, propomos uma abordagem alternativa que emprega as funcionalidades nativas do PostgreSQL, combinando tipos de matrizes do PostgreSQL com uma coluna adicional para armazenar as posições de índice. Dessa forma, o sistema pode realizar iteração pelas matrizes usando apenas a coluna de índice.

Pré-requisitos e limitações

Pré-requisitos

  • Um ativo Conta da AWS

  • Permissões de administrador no AWS Identity and Access Management (IAM)

  • Uma instância compatível com Amazon RDS ou Aurora PostgreSQL

  • Habilidades de arquiteto ou desenvolvedor de banco de dados com Oracle e PostgreSQL

Limitações

  • Alguns Serviços da AWS não estão disponíveis em todos Regiões da AWS. Para conferir a disponibilidade de uma região, consulte Serviços da AWS by Region. Para endpoints específicos, consulte a página Cotas e endpoints de serviços e clique no link correspondente ao serviço desejado.

Versões do produto

Este padrão foi testado com as seguintes versões:

  • Amazon Aurora PostgreSQL 13.3

  • Amazon RDS para PostgreSQL 13.3

  • AWS SCT 1.0.674

  • Oracle 19c EE

Arquitetura

Pilha de tecnologia de origem

  • On-premises Banco de dados Oracle

Pilha de tecnologias de destino

  • Amazon Aurora PostgreSQL

  • Amazon RDS para PostgreSQL

Arquitetura de destino

O diagrama mostra o seguinte:

  • Uma instância de banco de dados de origem no Amazon RDS para Oracle

  • Uma instância do Amazon EC2 AWS SCT para converter funções Oracle para o equivalente do PostgreSQL

  • Um banco de dados de destino que seja compatível com o Amazon Aurora PostgreSQL

Ferramentas

Serviços da AWS

Outras ferramentas

  • O Oracle SQL Developer é um ambiente de desenvolvimento integrado que simplifica o desenvolvimento e o gerenciamento de bancos de dados Oracle em implantações tradicionais e baseadas em nuvem.

  • O pgAdmin é uma ferramenta de gerenciamento de código aberto para PostgreSQL. Ele fornece uma interface gráfica que ajuda você a criar, manter e usar objetos de banco de dados. Neste padrão, o pgAdmin se conecta à instância de banco de dados RDS para PostgreSQL e realiza consultas nos dados. Como alternativa, você pode usar o cliente de linha de comandos psql.

Práticas recomendadas

  • Teste os limites do conjunto de dados e os cenários de borda.

  • Considere implementar o tratamento de erros para condições de índice fora dos limites.

  • Otimize as consultas para evitar a verificação de conjuntos de dados esparsos.

Épicos

TarefaDescriptionHabilidades necessárias

Crie um PL/SQL bloco de origem no Oracle.

Crie um PL/SQL bloco de origem no Oracle que use a seguinte matriz associativa:

DECLARE TYPE country_codes IS TABLE OF VARCHAR2(100) INDEX BY pls_integer; cc country_codes; cc_idx NUMBER := NULL; BEGIN cc(7) := 'India'; cc(3) := 'UK'; cc(5) := 'USA'; cc(0) := 'China'; cc(-2) := 'Invalid'; dbms_output.put_line('cc_length:' || cc.COUNT); IF (cc.COUNT > 0) THEN cc_idx := cc.FIRST; FOR i IN 1..cc.COUNT LOOP dbms_output.put_line('cc_idx:' || cc_idx || ' country:' || cc(cc_idx)); cc_idx := cc.next(cc_idx); END LOOP; END IF; END;
DBA

Execute o PL/SQL quarteirão.

Execute o PL/SQL bloco de origem no Oracle. Se houver lacunas entre os valores dos índices de uma matriz associativa, nenhum dado será armazenado nessas lacunas. Isso permite que o loop da Oracle itere apenas pelas posições de índice.

DBA

Revise a saída.

Cinco elementos foram inseridos na matriz (cc) em intervalos não consecutivos. A contagem da matriz é mostrada na saída a seguir:

cc_length:5 cc_idx:-2 country:Invalid cc_idx:0 country:China cc_idx:3 country:UK cc_idx:5 country:USA cc_idx:7 country:India
DBA
TarefaDescriptionHabilidades necessárias

Crie um PL/pgSQL bloco de destino no PostgreSQL.

Crie um PL/pgSQL bloco de destino no PostgreSQL que use a seguinte matriz associativa:

DO $$ DECLARE cc character varying(100)[]; cc_idx integer := NULL; BEGIN cc[7] := 'India'; cc[3] := 'UK'; cc[5] := 'USA'; cc[0] := 'China'; cc[-2] := 'Invalid'; RAISE NOTICE 'cc_length: %', ARRAY_LENGTH(cc, 1); IF (ARRAY_LENGTH(cc, 1) > 0) THEN FOR i IN ARRAY_LOWER(cc, 1)..ARRAY_UPPER(cc, 1) LOOP RAISE NOTICE 'cc_idx:% country:%', i, cc[i]; END LOOP; END IF; END; $$;
DBA

Execute o PL/pgSQL quarteirão.

Execute o PL/pgSQL bloco de destino no PostgreSQL. Se houver lacunas entre os valores dos índices de uma matriz associativa, nenhum dado será armazenado nessas lacunas. Isso permite que o loop do PostgreSQL itere somente pelas posições do índice.

DBA

Revise a saída.

O comprimento da matriz é maior que cinco porque o valor NULL é armazenado nas lacunas entre as posições de índice. Como mostrado na saída a seguir, o loop realiza dez iterações para recuperar cinco valores na matriz.

cc_length:10 cc_idx:-2 country:Invalid cc_idx:-1 country:<NULL> cc_idx:0 country:China cc_idx:1 country:<NULL> cc_idx:2 country:<NULL> cc_idx:3 country:UK cc_idx:4 country:<NULL> cc_idx:5 country:USA cc_idx:6 country:<NULL> cc_idx:7 country:India
DBA
TarefaDescriptionHabilidades necessárias

Crie um PL/pgSQL bloco de destino com uma matriz e um tipo definido pelo usuário.

Para otimizar a performance e corresponder à funcionalidade da Oracle, podemos criar um tipo definido pelo usuário que armazena tanto as posições de índice quanto os dados correspondentes. Essa abordagem reduz iterações desnecessárias ao manter associações diretas entre os índices e os valores.

DO $$ DECLARE cc country_codes[]; cc_append country_codes := NULL; i record; BEGIN cc_append.idx = 7; cc_append.val = 'India'; cc := array_append(cc, cc_append); cc_append.idx = 3; cc_append.val = 'UK'; cc := array_append(cc, cc_append); cc_append.idx = 5; cc_append.val = 'USA'; cc := array_append(cc, cc_append); cc_append.idx = 0; cc_append.val = 'China'; cc := array_append(cc, cc_append); cc_append.idx = - 2; cc_append.val = 'Invalid'; cc := array_append(cc, cc_append); RAISE NOTICE 'cc_length: %', ARRAY_LENGTH(cc, 1); IF (ARRAY_LENGTH(cc, 1) > 0) THEN FOR i IN ( SELECT * FROM unnest(cc) ORDER BY idx) LOOP RAISE NOTICE 'cc_idx:% country:%', i.idx, i.val; END LOOP; END IF; END; $$;
DBA

Execute o PL/pgSQL quarteirão.

Execute o PL/pgSQL bloco alvo. Se houver lacunas entre os valores dos índices de uma matriz associativa, nenhum dado será armazenado nessas lacunas. Isso permite que o loop do PostgreSQL itere somente pelas posições do índice.

DBA

Revise a saída.

Como mostrado na saída a seguir, o tipo definido pelo usuário armazena apenas elementos de dados preenchidos, o que significa que o comprimento da matriz corresponde ao número de valores. Como resultado, as iterações do LOOP são otimizadas para processar apenas dados existentes, eliminando a necessidade de monitorar posições vazias.

cc_length:5 cc_idx:-2 country:Invalid cc_idx:0 country:China cc_idx:3 country:UK cc_idx:5 country:USA cc_idx:7 country:India
DBA

Solução de problemas

ProblemaSolução

Erro de índice fora dos limites

  • Problema: ERROR: array subscript out of bounds ao acessar elementos da matriz

  • Causa: tentativa de acessar uma posição de índice que não existe na matriz de tipos definida pelo usuário

Você pode validar a existência do índice antes do acesso usando um filtro de WHERE cláusula na idx coluna ao desaninhar a matriz ou pode implementar verificações de limites em seu código. PL/pgSQL

Manipulação de valores NULL

  • Problema: valores NULL inesperados que aparecem nos resultados da consulta ao iterar pela matriz

  • Causa: os elementos da matriz não foram inicializados corretamente com os val campos idx e antes de serem anexados

Certifique-se de que ambos os campos do tipo definido pelo usuário estejam preenchidos antes de usar. array_append() Adicione verificações NULL explícitas da seguinte forma: IF cc_append.val IS NOT NULL THEN cc := array_append(cc, cc_append); END IF;

Recursos relacionados

AWS documentação

Outras documentações

Mais informações

Considerações sobre a performance

  • Essa abordagem reduz a sobrecarga de iteração em 50% ou mais para matrizes esparsas em comparação com matrizes PostgreSQL nativas com espaços reservados NULL.

  • A eficiência do armazenamento melhora porque somente os dados reais são armazenados, não as posições vazias do índice.

Notas de compatibilidade

  • Esse padrão mantém a semântica de matriz esparsa da Oracle enquanto usa os recursos de matriz nativa do PostgreSQL.

  • A solução é compatível com todas as versões do PostgreSQL que oferecem suporte a tipos compostos definidos pelo usuário.