Dicas - AWS Clean Rooms

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Dicas

As dicas para análises de SQL fornecem diretivas de otimização que orientam as estratégias de execução de consultas AWS Clean Rooms, permitindo que você melhore o desempenho da consulta e reduza os custos de computação. As dicas sugerem como o mecanismo de análise do Spark deve gerar seu plano de execução.

Sintaxe

SELECT /*+ hint_name(parameters), hint_name(parameters) */ column_list FROM table_name;

As dicas são incorporadas às consultas SQL usando a sintaxe de estilo de comentário e devem ser colocadas diretamente após a palavra-chave SELECT.

Tipos de dicas compatíveis

AWS Clean Rooms suporta duas categorias de dicas: dicas de junção e dicas de particionamento.

Combinando várias dicas

Você pode especificar várias dicas em uma única consulta separando-as com vírgulas:

-- Combine join and partitioning hints SELECT /*+ BROADCAST(d), REPARTITION(8) */ e.name, d.dept_name FROM employees e JOIN departments d ON e.dept_id = d.id; -- Multiple join hints SELECT /*+ BROADCAST(s), MERGE(d) */ * FROM employees e JOIN students s ON e.id = s.id JOIN departments d ON e.dept_id = d.id; -- Hints within separate hint blocks within the same query SELECT /*+ REPARTITION(100) */ /*+ COALESCE(500) */ /*+ REPARTITION_BY_RANGE(3, c) */ * FROM t;

Considerações e limitações

  • As dicas são sugestões de otimização, não comandos. O otimizador de consultas pode ignorar dicas com base nas restrições de recursos ou nas condições de execução.

  • As dicas são incorporadas diretamente nas cadeias de caracteres de consulta SQL para e. CreateAnalysisTemplate StartProtectedQuery APIs

  • As dicas devem ser colocadas diretamente após a palavra-chave SELECT.

  • Os parâmetros nomeados não são compatíveis com dicas e gerarão uma exceção.

  • Os nomes das colunas nas dicas REPARTITION e REPARTITION_BY_RANGE devem existir no esquema de entrada.

  • Os nomes das colunas nas dicas de REBALANCE devem aparecer na lista de saída SELECT.

  • Os parâmetros numéricos devem ser números inteiros positivos entre 1 e 2147483647. Não há suporte para notações científicas como 1e1

  • As dicas não são suportadas em consultas SQL de privacidade diferencial.

  • As dicas para consultas SQL não são suportadas em PySpark trabalhos. Para fornecer diretrizes para planos de execução em um PySpark trabalho, use a API de data frame. Consulte a documentação da DataFrame API Apache Spark para obter mais informações.