Kolasi RDS for PostgreSQL untuk EBCDIC dan migrasi mainframe lainnya - Layanan Basis Data Relasional Amazon

Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.

Kolasi RDS for PostgreSQL untuk EBCDIC dan migrasi mainframe lainnya

RDS for PostgreSQL versi 10 dan yang lebih tinggi termasuk ICU versi 60.2, yang didasarkan pada Unicode 10.0 dan mencakup kolasi dari Unicode Common Locale Data Repository, CLDR 32. Pustaka internasionalisasi perangkat lunak ini memastikan bahwa pengodean karakter disajikan secara konsisten, terlepas dari sistem operasi atau platform. Untuk informasi selengkapnya tentang Unicode CLDR-32, lihat CLDR 32 Release Note di situs web Unicode CLDR. Anda dapat mempelajari lebih lanjut tentang komponen internasionalisasi untuk Unicode (ICU) di situs web ICU Technical Committee (ICU-TC). Untuk informasi tentang ICU-60, lihat Download ICU 60.

Mulai dari versi 14.3, RDS for PostgreSQL juga mencakup kolasi yang membantu integrasi data dan konversi dari sistem berbasis EBCDIC. Kode pertukaran desimal kode biner yang diperluas atau pengodean EBCDIC biasanya digunakan oleh sistem operasi mainframe. Kolasi yang disediakan Amazon RDS ini didefinisikan secara sempit untuk hanya mengurutkan karakter Unicode yang langsung dipetakan ke halaman kode EBCDIC. Karakter diurutkan dalam urutan titik kode EBCDIC untuk memungkinkan validasi data setelah konversi. Kolasi ini tidak menyertakan formulir denormalisasi, juga tidak menyertakan karakter Unicode yang tidak langsung memetakan ke karakter di halaman kode EBCDIC sumber.

Pemetaan karakter antara halaman kode EBCDIC dan titik kode Unicode didasarkan pada tabel yang diterbitkan oleh IBM. Set lengkap tersedia dari IBM sebagai file terkompresi yang dapat diunduh. RDS for PostgreSQL menggunakan pemetaan ini dengan alat yang disediakan oleh ICU untuk membuat kolasi yang tercantum dalam tabel di bagian ini. Nama kolasi mencakup bahasa dan negara seperti yang dipersyaratkan oleh ICU. Namun, halaman kode EBCDIC tidak menentukan bahasa, dan beberapa halaman kode EBCDIC mencakup beberapa negara. Itu artinya porsi bahasa dan negara dari nama kolasi dalam tabel bersifat arbitrer, dan tidak perlu cocok dengan lokal saat ini. Dengan kata lain, nomor halaman kode adalah bagian terpenting dari nama kolasi dalam tabel ini. Anda dapat menggunakan kolasi apa pun yang tertera dalam tabel berikut di basis data RDS for PostgreSQL.

  • Unicode to EBCDIC collations tableBeberapa alat migrasi data mainframe secara internal menggunakan LATIN1 atau LATIN9 untuk menyandikan dan memproses data. Alat tersebut menggunakan skema pulang-pergi untuk menjaga integritas data dan mendukung konversi terbalik. Kumpulan dalam tabel ini dapat digunakan oleh alat yang memproses data menggunakan LATIN1 pengkodean, yang tidak memerlukan penanganan khusus.

  • Unicode to LATIN9 collations table— Anda dapat menggunakan kolasi ini di RDS apa pun untuk basis data PostgreSQL.

Dalam tabel berikut, ada kolasi yang tersedia di RDS for PostgreSQL yang memetakan halaman kode EBCDIC ke titik kode Unicode. Kami menyarankan Anda menggunakan kolasi dalam tabel ini untuk pengembangan aplikasi yang memerlukan pengurutan berdasarkan urutan halaman kode IBM.

Nama kolasi PostgreSQL Deskripsi pemetaan halaman kode dan pengurutan urutan

da-DK-cp277-x-icu

Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 277 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 277

de-DE-cp273-x-icu

Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 273 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 273

en-GB-cp285-x-icu

Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 285 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 285

en-US-cp037-x-icu

Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 037 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 37

es-ES-cp284-x-icu

Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 284 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 284

fi-FI-cp278-x-icu

Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 278 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 278

fr-FR-cp297-x-icu

Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 297 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 297

it-IT-cp280-x-icu

Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 280 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 280

nl-BE-cp500-x-icu

Karakter Unicode yang langsung memetakan ke Kode EBCDIC IBM Halaman 500 (sesuai tabel konversi) diurutkan dalam urutan titik kode IBM CP 500

Amazon RDS menyediakan satu set kumpulan tambahan yang mengurutkan titik kode Unicode yang dipetakan ke LATIN9 karakter menggunakan tabel yang diterbitkan oleh IBM, dalam urutan titik kode asli sesuai dengan halaman kode EBCDIC dari data sumber.

Nama kolasi PostgreSQL Deskripsi pemetaan halaman kode dan pengurutan urutan

DA-DK-CP1142 m-x-icu

Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1142 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1142

De-De-CP1141 m-x-icu

Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1141 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1141

EN-GB-CP1146 m-x-icu

Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1146 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1146

en-AS-CP1140 m-x-icu

Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1140 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1140

ES-ES-CP1145 m-x-icu

Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1145 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1145

fi-fi-CP1143 m-x-icu

Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1143 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1143

fr-FR-CP1147 m-x-icu

Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1147 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1147

IT-IT-CP1144 m-x-icu

Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1144 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1144

nl-BE-CP1148 m-x-icu

Karakter unicode yang dipetakan ke LATIN9 karakter yang awalnya dikonversi dari IBM EBCDIC Code Page 1148 (per tabel konversi) diurutkan dalam urutan titik kode IBM CP 1148

Berikut ini, Anda dapat menemukan contoh penggunaan RDS untuk kolasi PostgreSQL.

db1=> SELECT pg_import_system_collations('pg_catalog'); pg_import_system_collations ----------------------------- 36 db1=> SELECT '¤' < 'a' col1; col1 ------ t db1=> SELECT '¤' < 'a' COLLATE "da-DK-cp277-x-icu" col1; col1 ------ f

Kami menyarankan Anda menggunakan kolasi di Unicode to EBCDIC collations table dan di Unicode to LATIN9 collations table untuk pengembangan aplikasi yang memerlukan pengurutan berdasarkan urutan halaman kode IBM. Kumpulan berikut (akhiran dengan huruf “b”) juga terlihat dipg_collation, tetapi dimaksudkan untuk digunakan oleh integrasi data mainframe dan alat migrasi di AWS halaman kode peta dengan pergeseran titik kode tertentu dan memerlukan penanganan khusus dalam pemeriksaan. Dengan kata lain, penggunaan kolasi berikut tidak direkomendasikan.

  • DA-DK-277 b-x-icu

  • DA-DK-1142 b-x-icu

  • De-de-CP273 b-x-icu

  • De-De-CP1141 b-x-icu

  • EN-GB-CP1146 b-x-icu

  • EN-GB-CP285 b-x-icu

  • id-US-CP037 b-x-icu

  • en-AS-CP1140 b-x-icu

  • ES-ES-CP1145 b-x-icu

  • es-ES-CP284 b-x-icu

  • fi-fi-CP1143 b-x-icu

  • fr-FR-CP1147 b-x-icu

  • FR-FR-CP297 b-x-icu

  • IT-IT-CP1144 b-x-icu

  • IT-IT-CP280 b-x-icu

  • nl-BE-CP1148 b-x-icu

  • NL-BE-CP500 b-x-icu

Untuk mempelajari lebih lanjut tentang memigrasi aplikasi dari lingkungan mainframe ke AWS, lihat Apa itu Modernisasi AWS Mainframe? .

Untuk mempelajari selengkapnya tentang mengelola kolasi PostgreSQL, lihat Collation Support dalam dokumentasi PostgreSQL.