Consideraciones y limitaciones - AWS Glue

Consideraciones y limitaciones

Las siguientes consideraciones y limitaciones se aplican a la generación de estadísticas de columnas.

Consideraciones
  • El uso del muestreo para generar estadísticas reduce el tiempo de ejecución, pero puede generar estadísticas inexactas.

  • El catálogo de datos no almacena versiones diferentes de las estadísticas.

  • Solo puede ejecutar una tarea de generación de estadísticas a la vez por tabla.

  • Si una tabla se cifra con la clave AWS KMS de cliente registrada en el catálogo de datos, AWS Glue utiliza la misma clave para cifrar las estadísticas.

La tarea de estadísticas de las columnas permite generar estadísticas:
  • Cuando el rol de IAM tiene permisos de tabla completos (IAM o Lake Formation).

  • Cuando el rol de IAM tiene permisos sobre la tabla mediante el modo de acceso híbrido de Lake Formation.

La tarea de estadísticas de columnas no admite la generación de estadísticas para:
  • Tablas con control de acceso basado en celdas de Lake Formation

  • Lagos de datos transaccionales: Fundación Linux Delta Lake, Apache Hudi

  • Tablas en bases de datos federadas: recursos compartidos de datos Hive metastore, Amazon Redshift

  • Columnas anidadas, matrices y tipos de datos de estructura.

  • Tabla que se comparte con usted desde otra cuenta