Gerar estatísticas de colunas para tabelas Iceberg - AWS Glue

Gerar estatísticas de colunas para tabelas Iceberg

Siga estas etapas para configurar um cronograma para gerar estatísticas no Catálogo de Dados usando o console do AWS Glue ou a AWS CLI, ou execute a operação StartColumnStatisticsTaskRun.

Para gerar estatísticas de colunas
  1. Faça login no console do AWS Glue em https://console.aws.amazon.com/glue/.

  2. Escolha Tabelas em Catálogo de Dados.

  3. Escolha uma tabela Iceberg na lista.

  4. Escolha Estatísticas de colunas, Gerar sob demanda no menu Ações.

    Você também pode escolher o botão Gerar estatísticas na guia Estatísticas da coluna na seção inferior da página Tabelas.

  5. Na página Gerar estatísticas, forneça os detalhes da geração de estatísticas. Siga as etapas de 6 a 11 na seção Gerar estatísticas de colunas em uma programação para configurar a geração de estatísticas para tabelas do Iceberg.

    Você também pode optar por gerar estatísticas de colunas sob demanda seguindo as instruções na Gerar estatísticas de colunas sob demanda.

    nota

    A opção de amostragem não está disponível para tabelas Iceberg.

    O AWS Glue calcula o número de valores distintos de cada coluna da tabela Iceberg para um novo arquivo Puffin comprometido com o ID de snapshot especificado em sua localização no Amazon S3.