SQL クエリの実行 - AWS Clean Rooms

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

SQL クエリの実行

注記

クエリを実行できるのは、クエリの計算コストを負担するメンバーがアクティブメンバーとしてコラボレーションに参加している場合のみです。

クエリを実行できるメンバーは、次の方法で SQL クエリを実行できます。

  • SQL コードエディタを使用して SQL クエリを手動で構築する。

  • 承認された SQL 分析テンプレートを使用する。

  • Analysis Builder UI を使用して、SQL コードを記述することなくクエリを構築します。

クエリを実行できるメンバーがコラボレーション内のテーブルに対して SQL クエリを実行すると、 は関連するロールを AWS Clean Rooms 引き受け、ユーザーに代わってテーブルにアクセスします。 は、必要に応じて分析ルールを入力クエリとその出力 AWS Clean Rooms に適用します。

分析ルールと出力制約は自動的に適用されます。 は、定義された分析ルールに準拠した結果 AWS Clean Rooms のみを返します。

AWS Clean Rooms は、他のクエリエンジンとは異なる SQL クエリをサポートします。仕様については、「AWS Clean Rooms SQL リファレンス」を参照してください。差分プライバシーで保護されているデータテーブルでクエリを実行する場合は、クエリが AWS Clean Rooms 差分プライバシーの汎用クエリ構造と互換性があることを確認する必要があります。

注記

Cryptographic Computing for Clean Rooms を使用する場合、すべての SQL オペレーションが有効な結果を生成するわけではありません。例えば、暗号化された列に対して COUNT を実行することはできますが、暗号化された数値に対して SUM を実行するとエラーが発生します。また、誤ったクエリ結果が得られることもあります。例えば、シール列に SUM を実行するクエリではエラーが発生します。一方、シール列に対する GROUP BY クエリは成功するように見えますが、クリアテキストに対する GROUP BY クエリで生成されるグループとは異なるグループが生成されます。

クエリの計算コストを負担するメンバーに、コラボレーションで実行されたクエリの料金が請求されます。

クエリできるメンバーは、結果を受け取ることができる複数のメンバーを選択して、1 つのクエリから結果を受け取ることができます。詳細については、「SQL コードエディタを使用して設定済みテーブルのクエリを実行する」を参照してください。クエリ結果の受信に関する一般的な情報については、「」を参照してください分析結果の受信と使用

前提条件

SQL クエリを実行する前に、以下があることを確認してください。

  • AWS Clean Rooms コラボレーションのアクティブなメンバーシップ

  • コラボレーションで少なくとも 1 つの設定済みテーブルへのアクセス

  • クエリコンピューティングコストを担当するメンバーがアクティブなコラボレーションメンバーであることの確認

AWS Clean Rooms StartProtectedQuery API オペレーションを直接呼び出すか、 AWS SDKs を使用してデータをクエリまたはクエリを表示する方法については、 AWS Clean Rooms API リファレンスを参照してください。

クエリログ記録の詳細については、「分析ログイン AWS Clean Rooms」を参照してください。

注記

暗号化されたデータテーブルにクエリを実行すると、暗号化された列の結果は暗号化されます。

SQL クエリの Spark プロパティ設定

AWS Clean Rooms では、Spark 分析エンジンの使用時に SQL クエリでサポートされている Spark プロパティを設定することで、オプションで Spark ランタイムの動作をカスタマイズできます。この機能は、分析エンジンではなく AWS Clean Rooms、 で Spark 分析エンジンを使用する AWS Clean Rooms 分析でのみ使用できます。これらのプロパティを使用すると、パフォーマンス、メモリ使用量、クエリ実行パラメータを微調整できます。この機能を使用すると、Spark ベースのクエリの処理方法をより詳細に制御できるため、特定のワークロード要件に基づいて最適化できます。

シャッフルパーティション、ブロードキャスト結合しきい値、アダプティブクエリ実行パラメータなどの設定を、Spark 分析エンジン分析の AWS Clean Rooms コンソールから直接調整できるようになりました。この機能は、デフォルト設定が最適でない可能性のある複雑なクエリや大規模なデータセットに特に役立ちます。これらの Spark プロパティを微調整することで、クエリのパフォーマンスを向上させ、リソースの消費量を減らし、Spark ベースのコラボレーション分析のメモリ使用量をより適切に管理できます。

この機能を活用するには、Spark 分析エンジン分析のクエリインターフェイスに新しい Spark プロパティセクションがあります。サポートされているプロパティのリストから を選択し、カスタム値を指定できます。StartProtectedQuery API を使用してプログラムで Spark プロパティを設定することもできます。この高度な設定オプションにより、データアナリストやエンジニアは Spark 分析エンジンを使用して分析を最適化し、効率とスケーラビリティを向上させることができます。

デフォルト値を含む Spark プロパティの詳細については、Apache Spark ドキュメントの「Spark プロパティ」を参照してください。

以下のトピックでは、 AWS Clean Rooms コンソールを使用してコラボレーション内のデータにクエリを実行する方法を説明します。