SQL 쿼리 실행 - AWS Clean Rooms

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

SQL 쿼리 실행

참고

쿼리 컴퓨팅 비용을 지불해야 하는 구성원이 활성 구성원으로 공동 작업에 참여한 경우에만 쿼리를 실행할 수 있습니다.

쿼리할 수 있는 멤버는 다음을 통해 SQL 쿼리를 실행할 수 있습니다.

  • SQL 코드 편집기를 사용하여 SQL 쿼리를 수동으로 빌드합니다.

  • 승인된 SQL 분석 템플릿 사용.

  • 분석 빌더 UI를 사용하여 SQL 코드를 작성할 필요 없이 쿼리를 빌드합니다.

쿼리할 수 있는 구성원이 공동 작업의 테이블에서 SQL 쿼리를 실행하면는 사용자를 대신하여 테이블에 액세스하기 위한 관련 역할을 AWS Clean Rooms 수임합니다.는 필요에 따라 분석 규칙을 입력 쿼리 및 해당 출력에 AWS Clean Rooms 적용합니다.

분석 규칙 및 출력 제약 조건은 자동으로 적용됩니다.는 정의된 분석 규칙을 준수하는 결과 AWS Clean Rooms 만 반환합니다.

AWS Clean Rooms 는 다른 쿼리 엔진과 다를 수 있는 SQL 쿼리를 지원합니다. 사양은 AWS Clean Rooms SQL 참조를 참조하세요. 차등 프라이버시로 보호되는 데이터 테이블에서 쿼리를 실행하려면 쿼리가 AWS Clean Rooms 차등 프라이버시의 범용 쿼리 구조와 호환되는지 확인해야 합니다.

참고

Clean Rooms에 암호화 컴퓨팅을 사용하는 경우 일부 SQL 작업에서는 올바른 결과가 생성되지 않습니다. 예를 들어, 암호화된 열에서 COUNT를 수행할 수 있지만 암호화된 번호에서 SUM을 수행하면 오류가 발생합니다. 또한 쿼리로 인해 잘못된 결과가 나올 수도 있습니다. 예를 들어 SUM이 열을 봉인하는 쿼리는 오류를 발생시킵니다. 하지만 봉인된 열에 대한 GROUP BY 쿼리는 성공한 것 같지만 일반 텍스트에 대한 GROUP BY 쿼리로 생성된 그룹과는 다른 그룹을 생성합니다.

쿼리 컴퓨팅 비용을 지불하는 멤버에게는 공동 작업에서 실행한 쿼리에 대한 요금이 부과됩니다.

쿼리할 수 있는 구성원은 결과를 받을 수 있는 여러 구성원을 선택하여 단일 쿼리에서 결과를 받을 수 있습니다. 자세한 내용은 SQL 코드 편집기를 사용하여 구성된 테이블 쿼리 단원을 참조하십시오. 쿼리 결과 수신에 대한 일반적인 정보는 섹션을 참조하세요분석 결과 수신 및 사용.

사전 조건

SQL 쿼리를 실행하기 전에 다음이 있는지 확인합니다.

  • AWS Clean Rooms 공동 작업의 활성 멤버십

  • 공동 작업에서 하나 이상의 구성된 테이블에 대한 액세스

  • 쿼리 컴퓨팅 비용을 담당하는 구성원이 활성 공동 작업 구성원인지 확인

AWS Clean Rooms StartProtectedQuery API 작업을 직접 호출하거나 AWS SDKs. AWS Clean Rooms

쿼리 로깅에 대한 자세한 내용은 의 분석 로깅 AWS Clean Rooms 섹션을 참조하세요.

참고

암호화된 데이터 테이블에서 쿼리를 실행하면 암호화된열의 결과가 암호화됩니다.

SQL 쿼리에 대한 Spark 속성 구성

AWS Clean Rooms 를 사용하면 Spark 분석 엔진을 사용할 때 SQL 쿼리에 지원되는 Spark 속성을 구성하여 선택적으로 Spark 런타임 동작을 사용자 지정할 수 있습니다. 이 기능은 분석 엔진이 AWS Clean Rooms아닌에서 Spark 분석 엔진을 사용하는 AWS Clean Rooms 분석에만 사용할 수 있습니다. 이러한 속성을 사용하면 성능, 메모리 사용량 및 쿼리 실행 파라미터를 미세 조정할 수 있습니다. 이 기능을 사용하면 Spark 기반 쿼리가 처리되는 방식을 더 잘 제어할 수 있으므로 특정 워크로드 요구 사항에 따라 최적화할 수 있습니다.

이제 Spark 분석 엔진 분석을 위해 AWS Clean Rooms 콘솔에서 직접 셔플 파티션, 브로드캐스트 조인 임계값, 적응형 쿼리 실행 파라미터와 같은 설정을 조정할 수 있습니다. 이 기능은 기본 구성이 최적이 아닐 수 있는 복잡한 쿼리 또는 대규모 데이터 세트에 특히 유용합니다. 이러한 Spark 속성을 미세 조정하면 쿼리 성능을 개선하고, 리소스 소비를 줄이고, Spark 기반 공동 작업 분석을 위한 메모리 사용량을 더 잘 관리할 수 있습니다.

이 기능을 활용하기 위해 Spark 분석 엔진 분석을 위한 쿼리 인터페이스에서 새로운 Spark 속성 섹션을 찾을 수 있습니다. 지원되는 속성 목록에서 선택하고 사용자 지정 값을 지정할 수 있습니다. StartProtectedQuery API를 사용하여 프로그래밍 방식으로 Spark 속성을 구성할 수도 있습니다. 이 고급 구성 옵션을 사용하면 데이터 분석가와 엔지니어가 Spark 분석 엔진을 사용하여 분석을 최적화하여 효율성과 확장성을 높일 수 있습니다.

기본값을 포함한 Spark 속성에 대한 자세한 내용은 Apache Spark 설명서의 Spark 속성을 참조하세요.

다음 항목에서는 AWS Clean Rooms 콘솔을 사용하여 공동 작업에서 데이터를 쿼리하는 방법을 설명합니다.