Execução de consultas de SQL - AWS Clean Rooms

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

Execução de consultas de SQL

nota

Será possível realizar consultas apenas se o membro responsável por pagar pelos custos de computação da consulta tiver ingressado na colaboração como membro ativo.

Como membro que pode consultar, você pode executar uma consulta SQL da seguinte forma:

  • Criar uma consulta SQL manualmente usando o editor de código SQL.

  • Usando um modelo de análise SQL aprovado.

  • Usando a interface do usuário do Analysis Builder para criar uma consulta sem precisar escrever código SQL.

Quando o membro que pode consultar executa uma consulta SQL nas tabelas da colaboração, AWS Clean Rooms assume as funções relevantes para acessar as tabelas em seu nome. AWS Clean Rooms aplica as regras de análise conforme necessário à consulta de entrada e sua saída.

As regras de análise e as restrições de saída são aplicadas automaticamente. AWS Clean Rooms retorna somente os resultados que estão em conformidade com as regras de análise definidas.

AWS Clean Rooms oferece suporte a consultas SQL que podem ser diferentes de outros mecanismos de consulta. Para obter as especificações, consulte a AWS Clean Rooms Referência SQL. Se você quiser executar consultas em tabelas de dados protegidas com privacidade diferencial, será necessário garantir que suas consultas sejam compatíveis com a estrutura de consulta de uso geral da privacidade diferencial do AWS Clean Rooms .

nota

Ao usar a Computação Criptográfica para o Clean Rooms, nem todas as operações SQL geram resultados válidos. Por exemplo, você pode conduzir um COUNT em uma coluna criptografada, mas conduzir um SUM em números criptografados leva a erros. Além disso, as consultas também podem gerar resultados incorretos. Por exemplo, consultas em SUM colunas seladas produzem erros. No entanto, uma GROUP BY consulta em colunas seladas parece ter sucesso, mas produz grupos diferentes daqueles produzidos por uma GROUP BY consulta em texto não criptografado.

O membro que paga pelos custos de computação da consulta é cobrado pelas consultas executadas na colaboração.

O membro que pode consultar pode selecionar vários membros que podem receber resultados para receber os resultados de uma única consulta. Para obter mais informações, consulte Consultar tabelas configuradas usando o editor de código SQL. Para obter informações gerais sobre o recebimento dos resultados da consulta, consulteRecebendo e usando os resultados da análise.

Pré-requisitos

Antes de executar uma consulta SQL, verifique se você tem o seguinte:

  • Uma associação ativa em AWS Clean Rooms colaboração

  • Acesso a pelo menos uma tabela configurada na colaboração

  • Confirmação de que o membro responsável pelos custos de computação da consulta é um membro ativo da colaboração

Para obter informações sobre como consultar dados ou visualizar consultas chamando a operação da AWS Clean Rooms StartProtectedQuery API diretamente ou usando o AWS SDKs, consulte a Referência da AWS Clean Rooms API.

Para ter mais informações sobre o registro de consultas, consulte Login de análise AWS Clean Rooms.

nota

Se você executar uma consulta em tabelas de dados criptografadas, os resultados das colunas criptografadas serão criptografados.

Configuração de propriedades do Spark para consultas SQL

AWS Clean Rooms permite que você personalize opcionalmente o comportamento do tempo de execução do Spark configurando propriedades compatíveis do Spark para consultas SQL ao usar o mecanismo de análise do Spark. Esse recurso está disponível apenas para análises usando o mecanismo de análise Spark em AWS Clean Rooms, não para o mecanismo de AWS Clean Rooms análise. Essas propriedades permitem que você ajuste os parâmetros de desempenho, uso de memória e execução de consultas. Com esse recurso, você tem maior controle sobre como suas consultas baseadas em Spark são processadas, permitindo a otimização com base em seus requisitos específicos de carga de trabalho.

Agora você pode ajustar configurações como partições aleatórias, limites de junção de transmissão e parâmetros adaptáveis de execução de consultas diretamente do AWS Clean Rooms console para análises do mecanismo de análise do Spark. Esse recurso é particularmente útil para consultas complexas ou grandes conjuntos de dados em que as configurações padrão podem não ser ideais. Ao ajustar essas propriedades do Spark, você pode potencialmente melhorar o desempenho das consultas, reduzir o consumo de recursos e gerenciar melhor o uso da memória para suas análises de colaboração baseadas no Spark.

Para aproveitar esse recurso, você encontrará uma nova seção de propriedades do Spark na interface de consulta para análises do mecanismo de análise do Spark. Você pode selecionar em uma lista de propriedades compatíveis e especificar valores personalizados. Você também pode configurar as propriedades do Spark programaticamente usando a API. StartProtectedQuery Essa opção de configuração avançada permite que analistas e engenheiros de dados otimizem suas análises usando o mecanismo de análise Spark para aumentar a eficiência e a escalabilidade.

Para obter mais informações sobre as propriedades do Spark, incluindo valores padrão, consulte Propriedades do Spark na documentação do Apache Spark.

Os tópicos a seguir explicam como consultar dados em uma colaboração usando o console AWS Clean Rooms .