Intercalaciones de RDS para PostgreSQL para EBCDIC y otras migraciones de mainframe
Las versiones 10 y posteriores de RDS para PostgreSQL incluyen la versión 60.2 de ICU, que se basa en Unicode 10.0 e incluye intercalaciones del repositorio de datos de configuración regional común de Unicode, CLDR 32. Estas bibliotecas de internacionalización de software garantizan que las codificaciones de caracteres se presenten de forma coherente, independientemente del sistema operativo o la plataforma. Para obtener más información acerca de Unicode CLDR-32, consulte la Nota de la versión de CLDR 32
A partir de la versión 14.3, RDS para PostgreSQL también incluye intercalaciones que ayudan con la integración y conversión de datos desde sistemas basados en EBCDIC. El código de intercambio decimal extendido codificado en binario extendido o EBCDIC se usa comúnmente en los sistemas operativos de mainframe. Estas intercalaciones proporcionadas por Amazon RDS están definidas de forma limitada para ordenar solo los caracteres Unicode que se asignan directamente a las páginas de códigos EBCDIC. Los caracteres se ordenan por puntos de código EBCDIC para permitir la validación de los datos después de la conversión. Estas intercalaciones no incluyen formularios desnormalizados ni caracteres Unicode que no se asignen directamente a un carácter en la página de códigos EBCDIC de origen.
Las asignaciones de caracteres entre las páginas de códigos EBCDIC y los puntos de código Unicode se basan en tablas publicadas por IBM. El conjunto completo está disponible en IBM como un archivo comprimido
-
Unicode to EBCDIC collations table: algunas herramientas de migración de datos de mainframe utilizan LATIN1 o LATIN9 internamente para codificar y procesar datos. Estas herramientas utilizan esquemas de ida y vuelta para proteger la integridad de los datos y admitir la conversión inversa. Las herramientas que procesan datos mediante la intercalación LATIN1, que no requiere un tratamiento especial, pueden usar las intercalaciones de esta tabla.
-
Unicode to LATIN9 collations table: puede usar estas intercalaciones en cualquier base de datos de RDS para PostgreSQL.
En la siguiente tabla, encontrará intercalaciones disponibles en RDS para PostgreSQL que asignan páginas de códigos EBCDIC a puntos de código Unicode. Le recomendamos que utilice las intercalaciones de esta tabla para desarrollar aplicaciones que requieran una clasificación basada en el orden de las páginas de códigos de IBM.
Nombre de intercalación de PostgreSQL | Descripción de la asignación y el orden de clasificación de páginas de códigos |
---|---|
da-DK-cp277-x-icu |
Los caracteres Unicode que se asignan directamente a la página de código 277 de IBM EBCDIC (por tablas de conversión) se ordenan de acuerdo con la clasificación de puntos de códigos 277 de IBM CP. |
de-DE-cp273-x-icu |
Los caracteres Unicode que se asignan directamente a la página de código 273 de IBM EBCDIC (por tablas de conversión) se ordenan de acuerdo con la clasificación de puntos de códigos 273 de IBM CP. |
en-GB-cp285-x-icu |
Los caracteres Unicode que se asignan directamente a la página de código 285 de IBM EBCDIC (por tablas de conversión) se ordenan de acuerdo con la clasificación de puntos de códigos 285 de IBM CP. |
en-US-cp037-x-icu |
Los caracteres Unicode que se asignan directamente a la página de código 037 de IBM EBCDIC (por tablas de conversión) se ordenan de acuerdo con la clasificación de puntos de códigos 037 de IBM CP. |
es-ES-cp284-x-icu |
Los caracteres Unicode que se asignan directamente a la página de código 284 de IBM EBCDIC (por tablas de conversión) se ordenan de acuerdo con la clasificación de puntos de códigos 284 de IBM CP. |
fi-FI-cp278-x-icu |
Los caracteres Unicode que se asignan directamente a la página de código 278 de IBM EBCDIC (por tablas de conversión) se ordenan de acuerdo con la clasificación de puntos de códigos 278 de IBM CP. |
fr-FR-cp297-x-icu |
Los caracteres Unicode que se asignan directamente a la página de código 297 de IBM EBCDIC (por tablas de conversión) se ordenan de acuerdo con la clasificación de puntos de códigos 297 de IBM CP. |
it-IT-cp280-x-icu |
Los caracteres Unicode que se asignan directamente a la página de código 280 de IBM EBCDIC (por tablas de conversión) se ordenan de acuerdo con la clasificación de puntos de códigos 280 de IBM CP. |
nl-BE-cp500-x-icu |
Los caracteres Unicode que se asignan directamente a la página de código 500 de IBM EBCDIC (por tablas de conversión) se ordenan de acuerdo con la clasificación de puntos de códigos 500 de IBM CP. |
Amazon RDS proporciona un conjunto de intercalaciones adicionales que ordenan los puntos de código Unicode que se asignan a caracteres LATIN9 mediante las tablas publicadas por IBM, en el orden de los puntos de código originales de acuerdo con la página de códigos EBCDIC de los datos de origen.
Nombre de intercalación de PostgreSQL | Descripción de la asignación y el orden de clasificación de páginas de códigos |
---|---|
da-DK-cp1142m-x-icu |
Los caracteres Unicode que se asignan a los caracteres LATIN9 convertidos originalmente desde la página de código 1142 de IBM EBCDIC (según las tablas de conversión) se clasifican en el orden de los puntos de códigos 1142 de IBM CP. |
de-DE-cp1141m-x-icu |
Los caracteres Unicode que se asignan a los caracteres LATIN9 convertidos originalmente desde la página de código 1141 de IBM EBCDIC (según las tablas de conversión) se clasifican en el orden de los puntos de códigos 1141 de IBM CP. |
en-GB-cp1146m-x-icu |
Los caracteres Unicode que se asignan a los caracteres LATIN9 convertidos originalmente desde la página de código 1146 de IBM EBCDIC (según las tablas de conversión) se clasifican en el orden de los puntos de códigos 1146 de IBM CP. |
en-US-cp1140m-x-icu |
Los caracteres Unicode que se asignan a los caracteres LATIN9 convertidos originalmente desde la página de código 1140 de IBM EBCDIC (según las tablas de conversión) se clasifican en el orden de los puntos de códigos 1140 de IBM CP. |
es-ES-cp1145m-x-icu |
Los caracteres Unicode que se asignan a los caracteres LATIN9 convertidos originalmente desde la página de código 1145 de IBM EBCDIC (según las tablas de conversión) se clasifican en el orden de los puntos de códigos 1145 de IBM CP. |
fi-FI-cp1143m-x-icu |
Los caracteres Unicode que se asignan a los caracteres LATIN9 convertidos originalmente desde la página de código 1143 de IBM EBCDIC (según las tablas de conversión) se clasifican en el orden de los puntos de códigos 1143 de IBM CP. |
fr-FR-cp1147m-x-icu |
Los caracteres Unicode que se asignan a los caracteres LATIN9 convertidos originalmente desde la página de código 1147 de IBM EBCDIC (según las tablas de conversión) se clasifican en el orden de los puntos de códigos 1147 de IBM CP. |
it-IT-cp1144m-x-icu |
Los caracteres Unicode que se asignan a los caracteres LATIN9 convertidos originalmente desde la página de código 1144 de IBM EBCDIC (según las tablas de conversión) se clasifican en el orden de los puntos de códigos 1144 de IBM CP. |
nl-BE-cp1148m-x-icu |
Los caracteres Unicode que se asignan a los caracteres LATIN9 convertidos originalmente desde la página de código 1148 de IBM EBCDIC (según las tablas de conversión) se clasifican en el orden de los puntos de códigos 1148 de IBM CP. |
A continuación, encontrará un ejemplo de cómo utilizar una intercalación de RDS para PostgreSQL.
db1=>
SELECT pg_import_system_collations('pg_catalog');pg_import_system_collations ----------------------------- 36
db1=>
SELECT '¤' < 'a' col1;col1 ------ t
db1=>
SELECT '¤' < 'a' COLLATE "da-DK-cp277-x-icu" col1;col1 ------ f
Le recomendamos que utilice las intercalaciones de la Unicode to EBCDIC collations table y en la Unicode to LATIN9 collations table para el desarrollo de aplicaciones que requieran una clasificación basada en el orden de las páginas de códigos de IBM. Las siguientes intercalaciones (sufijo con la letra “b”) también son visibles en pg_collation
, pero están pensadas para que las utilicen las herramientas de integración y migración de datos del mainframe en AWS que asignan páginas de códigos con cambios de puntos de código específicos y requieren un tratamiento especial en la intercalación. En otras palabras, no se recomienda el uso de las siguientes intercalaciones.
-
da-DK-277b-x-icu
-
da-DK-1142b-x-icu
-
de-DE-cp273b-x-icu
-
de-DE-cp1141b-x-icu
-
en-GB-cp1146b-x-icu
-
en-GB-cp285b-x-icu
-
en-US-cp037b-x-icu
-
en-US-cp1140b-x-icu
-
es-ES-cp1145b-x-icu
-
es-ES-cp284b-x-icu
-
fi-FI-cp1143b-x-icu
-
fr-FR-cp1147b-x-icu
-
fr-FR-cp297b-x-icu
-
it-IT-cp1144b-x-icu
-
it-IT-cp280b-x-icu
-
nl-BE-cp1148b-x-icu
-
nl-BE-cp500b-x-icu
Para obtener más información sobre la migración de aplicaciones de entornos mainframe a AWS, consulte What is AWS Mainframe Modernization? (¿Qué es Mainframe Modernization?).
Para obtener más información sobre la administración de las intercalaciones en PostgreSQL, consulte Collation Support