Tipo SUPER - Amazon Redshift

Amazon Redshift dejará de admitir la creación de nuevas UDF de Python a partir del 1 de noviembre de 2025. Si desea utilizar las UDF de Python, créelas antes de esa fecha. Las UDF de Python existentes seguirán funcionando con normalidad. Para obtener más información, consulte la publicación del blog.

Tipo SUPER

Utilice el tipo de datos SUPER para almacenar datos o documentos semiestructurados como valores. Aunque Amazon Redshift es capaz de almacenar estos valores mediante VARCHAR, le recomendamos que utilice el tipo de datos SUPER en su lugar.

Los datos semiestructurados no se ajustan a la estructura rígida y tabular del modelo de datos relacionales utilizado en las bases de datos SQL. Contiene etiquetas que referencian entidades distintas dentro de los datos. Pueden contener valores complejos, como matrices, estructuras anidadas y otras estructuras complejas, que están asociadas a formatos de serialización, como JSON. El tipo de datos SUPER es un conjunto de valores de estructura y matriz sin esquema que abarcan todos los demás tipos escalares de Amazon Redshift.

El tipo de datos SUPER admite hasta 16 MB de datos para un objeto SUPER individual. Para obtener más información sobre el tipo de datos SUPER, incluidos ejemplos de su implementación en una tabla, consulte Datos semiestructurados en Amazon Redshift.

Amazon Redshift ofrece compatibilidad integrada para ingerir los siguientes formatos de datos semiestructurados mediante el comando COPY:

  • JSON

  • ARRAY

  • TEXT

  • CSV

Solo se puede hacer la ingesta de objetos SUPER de más de 1 MB a partir de los siguientes formatos de archivo:

  • Parquet

  • JSON

  • TEXT

  • CSV

El tipo de datos SUPER presenta las siguientes propiedades:

  • un valor escalar de Amazon Redshift:

    • un nulo

    • un booleano

    • un número, como smallint, entero, bigint, decimal o de coma flotante (como float4 o float8)

    • un valor de cadena, como varchar o char

  • un valor complejo:

    • una matriz de valores, incluidos los escalares o los complejos

    • una estructura, también conocida como tupla u objeto, que es un mapa de nombres y valores de atributos (escalar o complejo)

Cualquiera de los dos tipos de valores complejos contiene sus propios valores escalares o complejos sin ninguna restricción de regularidad.

La codificación de compresión predeterminada para el tipo de datos SUPER es ZSTD. Para obtener más información acerca de la codificación de compresión, consulte Codificaciones de compresión.

El tipo de datos SUPER admite la persistencia de datos semiestructurados en un formato sin esquema. Aunque el modelo de datos jerárquico puede cambiar, las versiones antiguas de los datos pueden coexistir en la misma columna SUPER.

Amazon Redshift utiliza PartiQL para habilitar la navegación en matrices y estructuras. Amazon Redshift también utiliza la sintaxis de PartiQL para iterar sobre las matrices SUPER. Para obtener más información, consulte PartiQL: un lenguaje de consulta compatible con SQL para Amazon Redshift.

Amazon Redshift utiliza la escritura dinámica para procesar datos SUPER sin esquema sin necesidad de declarar los tipos de datos antes de utilizarlos en la consulta. Para obtener más información, consulte Escritura dinámica.

Puede aplicar políticas de enmascaramiento de datos dinámico a valores escalares en las rutas de las columnas de tipo SUPER. Para obtener más información sobre el enmascaramiento dinámico de datos, consulte Enmascaramiento de datos dinámico. Para obtener más información acerca del uso del enmascaramiento dinámico de datos con el tipo de datos SUPER, consulte Uso del enmascaramiento dinámico de datos con rutas de tipos de datos SUPER.

Le recomendamos que establezca la opción de configuración r_enable_case_sensitive_super_attribute en true cuando trabaje con datos SUPER. Para obtener más información, consulte enable_case_sensitive_super_attribute.