Esecuzione di query SQL - AWS Clean Rooms

Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.

Esecuzione di query SQL

Nota

Puoi eseguire le query solo se il membro responsabile del pagamento dei costi di elaborazione delle query ha aderito alla collaborazione come membro attivo.

In qualità di membro che può eseguire interrogazioni, puoi eseguire una query SQL nei seguenti modi:

  • Creazione manuale di una query SQL utilizzando l'editor di codice SQL.

  • Utilizzo di un modello di analisi SQL approvato.

  • Utilizzo dell'interfaccia utente di Analysis Builder per creare una query senza dover scrivere codice SQL.

Quando il membro che può eseguire una query esegue una query SQL sulle tabelle della collaborazione, AWS Clean Rooms assume i ruoli pertinenti per accedere alle tabelle per suo conto. AWS Clean Roomsapplica le regole di analisi necessarie alla query di input e al relativo output.

Le regole di analisi e i vincoli di output vengono applicati automaticamente. AWS Clean Roomsrestituisce solo i risultati conformi alle regole di analisi definite.

AWS Clean Roomssupporta query SQL che possono essere diverse dagli altri motori di query. Per le specifiche, vedere AWS Clean RoomsSQL Reference. Se desideri eseguire query su tabelle di dati protette con privacy differenziale, devi assicurarti che le query siano compatibili con la struttura di query generica di Differential Privacy. AWS Clean Rooms

Nota

Quando si utilizza Cryptographic Computing for Clean Rooms, non tutte le operazioni SQL generano risultati validi. Ad esempio, è possibile eseguire un comando COUNT su una colonna crittografata, ma eseguire un comando SUM su numeri crittografati genera errori. Inoltre, le interrogazioni potrebbero produrre risultati errati. Ad esempio, le interrogazioni con colonne SUM sigillate producono errori. Tuttavia, un'GROUPBYinterrogazione su colonne sigillate sembra avere esito positivo, ma produce gruppi diversi da quelli prodotti da un'GROUPBYinterrogazione su testo in chiaro.

Al membro che paga i costi di elaborazione delle query viene addebitato il costo delle query eseguite nell'ambito della collaborazione.

Il membro che può eseguire le interrogazioni può selezionare più membri che possono ricevere risultati per ricevere i risultati di una singola query. Per ulteriori informazioni, consulta Interrogazione di tabelle configurate utilizzando l'editor di codice SQL. Per informazioni generali sulla ricezione dei risultati delle interrogazioni, vedereRicezione e utilizzo dei risultati delle analisi.

Prerequisiti

Prima di eseguire una query SQL, assicurati di disporre di quanto segue:

  • Un'iscrizione attiva alla AWS Clean Rooms collaborazione

  • Accesso ad almeno una tabella configurata nella collaborazione

  • Conferma che il membro responsabile dei costi di elaborazione delle query è un membro attivo della collaborazione

Per informazioni su come interrogare i dati o visualizzare le query chiamando direttamente l'operazione AWS Clean Rooms StartProtectedQuery API o utilizzando la AWSSDKs, consulta l'AWS Clean RoomsAPI Reference.

Per informazioni sulla registrazione delle query, vedere. Registrazione dell'analisi AWS Clean Rooms

Nota

Se si esegue una query su tabelle di dati crittografate, i risultati delle colonne crittografate vengono crittografati.

Configurazione delle proprietà Spark per le query SQL

AWS Clean Roomsconsente di personalizzare facoltativamente il comportamento di runtime di Spark configurando le proprietà Spark supportate per le query SQL. Queste proprietà consentono di ottimizzare le prestazioni, l'utilizzo della memoria e i parametri di esecuzione delle query. Con questa funzionalità, hai un maggiore controllo sul modo in cui vengono elaborate le query basate su Spark, consentendone l'ottimizzazione in base ai requisiti specifici del carico di lavoro.

Ora puoi regolare impostazioni come le partizioni shuffle, le soglie di broadcast join e i parametri di esecuzione delle query adattive direttamente dalla console. AWS Clean Rooms Questa funzionalità è particolarmente utile per query complesse o set di dati di grandi dimensioni in cui le configurazioni predefinite potrebbero non essere ottimali. Ottimizzando queste proprietà di Spark, puoi potenzialmente migliorare le prestazioni delle query, ridurre il consumo di risorse e gestire meglio l'utilizzo della memoria per le analisi di collaborazione basate su Spark.

Per sfruttare questa funzionalità, troverai una nuova sezione delle proprietà di Spark nell'interfaccia di interrogazione. Puoi selezionare da un elenco di proprietà supportate e specificare valori personalizzati. Puoi anche configurare le proprietà Spark a livello di codice utilizzando l'API. StartProtectedQuery Questa opzione di configurazione avanzata consente agli analisti e agli ingegneri di dati di ottimizzare le loro query per una maggiore efficienza e scalabilità.

Per ulteriori informazioni sulle proprietà di Spark, inclusi i valori predefiniti, consulta Spark Properties nella documentazione di Apache Spark.

I seguenti argomenti spiegano come interrogare i dati in una collaborazione utilizzando la console. AWS Clean Rooms