Amazon Redshift tidak akan lagi mendukung pembuatan Python UDFs baru mulai 1 November 2025. Jika Anda ingin menggunakan Python UDFs, buat UDFs sebelum tanggal tersebut. Python yang ada UDFs akan terus berfungsi seperti biasa. Untuk informasi lebih lanjut, lihat posting blog
Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Tipe SUPER
Gunakan tipe data SUPER untuk menyimpan data atau dokumen semi-terstruktur sebagai nilai. Meskipun Amazon Redshift mampu menyimpan nilai tersebut menggunakan VARCHAR, kami menyarankan Anda menggunakan tipe data SUPER sebagai gantinya.
Data semi-terstruktur tidak sesuai dengan struktur kaku dan tabular dari model data relasional yang digunakan dalam database SQL. Ini berisi tag yang mereferensikan entitas yang berbeda dalam data. Mereka dapat berisi nilai-nilai kompleks seperti array, struktur bersarang, dan struktur kompleks lainnya yang terkait dengan format serialisasi, seperti JSON. Tipe data SUPER adalah seperangkat array tanpa skema dan nilai struktur yang mencakup semua jenis skalar Amazon Redshift lainnya.
Tipe data SUPER mendukung hingga 16 MB data untuk objek SUPER individu. Untuk informasi selengkapnya tentang tipe data SUPER, termasuk contoh penerapannya dalam tabel, lihatData semi-terstruktur di Amazon Redshift.
Amazon Redshift menyediakan dukungan bawaan untuk mencerna format data semi-terstruktur berikut menggunakan perintah COPY:
JSON
ARRAY
TEXT
CSV
Objek SUPER yang lebih besar dari 1MB hanya dapat dicerna dari format file berikut:
-
Parquet
-
JSON
-
TEXT
-
CSV
Tipe data SUPER memiliki properti berikut:
-
Nilai skalar Amazon Redshift:
-
Sebuah nol
-
Sebuah boolean
-
Angka, seperti smallint, integer, bigint, desimal, atau floating point (seperti float4 atau float8)
-
Nilai string, seperti varchar atau char
-
-
Nilai yang kompleks:
-
Array nilai, termasuk skalar atau kompleks
-
Struktur, juga dikenal sebagai tuple atau objek, yang merupakan peta nama dan nilai atribut (skalar atau kompleks)
-
Salah satu dari dua jenis nilai kompleks mengandung skalar atau nilai kompleksnya sendiri tanpa batasan keteraturan.
Pengkodean kompresi default untuk tipe data SUPER adalah ZSTD. Untuk informasi lebih lanjut tentang pengkodean kompresi, lihatPengkodean kompresi.
Tipe data SUPER mendukung persistensi data semi-terstruktur dalam bentuk skema. Meskipun model data hierarkis dapat berubah, versi data lama dapat hidup berdampingan di kolom SUPER yang sama.
Amazon Redshift menggunakan PartiQL untuk mengaktifkan navigasi ke dalam array dan struktur. Amazon Redshift juga menggunakan sintaks PartiQL untuk mengulangi array SUPER. Untuk informasi selengkapnya, lihat PartiQL — bahasa kueri yang kompatibel dengan SQL untuk Amazon Redshift.
Amazon Redshift menggunakan pengetikan dinamis untuk memproses data SUPER tanpa skema tanpa perlu mendeklarasikan tipe data sebelum Anda menggunakannya dalam kueri. Untuk informasi selengkapnya, lihat Pengetikan dinamis.
Anda dapat menerapkan kebijakan masking data dinamis ke nilai skalar pada jalur kolom tipe SUPER. Untuk informasi selengkapnya tentang masking data dinamis, lihatPenutupan data dinamis. Untuk informasi tentang penggunaan masking data dinamis dengan tipe data SUPER, lihatMenggunakan masking data dinamis dengan jalur tipe data SUPER.
Kami menyarankan Anda mengatur opsi r_enable_case_sensitive_super_attribute
konfigurasi ke true saat bekerja dengan data SUPER. Untuk informasi selengkapnya, lihat enable_case_sensitive_super_attribute.