기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
SQL 분석 템플릿 생성
사전 조건
SQL 분석 템플릿을 생성하기 전에 다음이 있어야 합니다.
-
활성 AWS Clean Rooms 공동 작업
-
공동 작업에서 구성된 테이블 하나 이상에 대한 액세스
에서 테이블을 구성하는 방법에 대한 자세한 내용은 섹션을 AWS Clean Rooms참조하세요AWS Clean Rooms에서 구성된 테이블 생성하기.
-
분석 템플릿을 생성할 수 있는 권한
-
SQL 쿼리 구문에 대한 기본 지식
다음 절차에서는 AWS Clean Rooms 콘솔
AWS SDKs. AWS Clean Rooms
SQL 분석 템플릿을 생성하려면
-
에 로그인 AWS Management 콘솔 하고 공동 작업 생성자 역할을 AWS 계정 할를 사용하여 AWS Clean Rooms 콘솔
을 엽니다. -
왼쪽 탐색 창에서 공동 작업을 선택합니다.
-
공동 작업을 선택합니다.
-
템플릿 탭에서 직접 생성한 분석 템플릿 섹션으로 이동합니다.
-
분석 템플릿 생성을 선택합니다.
-
분석 템플릿 생성 페이지의 세부 정보에서
-
분석 템플릿의 이름을 입력합니다.
-
(선택 사항) 설명을 입력합니다.
-
형식에서 SQL 옵션을 선택한 상태로 둡니다.
-
-
테이블의 경우 공동 작업과 관련된 구성된 테이블을 확인하세요.
-
정의의 경우,
-
분석 템플릿의 정의를 입력합니다.
-
정의를 가져오려면 가져오기 대상을 선택합니다.
-
(선택 사항) SQL 편집기에서 매개 변수 이름 앞에 콜론(
:)을 입력하여 매개 변수를 지정합니다.예:
WHERE table1.date + :date_period > table1.date
-
-
이전에 매개 변수를 추가한 경우 매개 변수 — 선택 사항에서 각 매개 변수 이름에 대해 유형 및 기본값(선택 사항)을 선택합니다.
-
합성 데이터의 경우 모델 훈련을 위해 합성 데이터를 생성하려면 분석 템플릿 출력이 합성이어야 함 확인란을 선택합니다.
자세한 내용은 프라이버시 강화 합성 데이터 세트 생성을 참조하세요.
-
열 분류의 경우 드롭다운 목록에서 열을 선택합니다. 5개 이상의 열이 필요합니다.
-
드롭다운 목록에서 분류를 선택합니다. 각 열의 데이터 유형을 식별합니다.
분류 유형은 다음과 같습니다.
-
숫자 - 측정값 또는 개수와 같은 연속 숫자 값
-
범주형 - 레이블 또는 유형과 같은 개별 값 또는 범주
-
-
열을 제거하려면 제거를 선택합니다.
-
다른 열을 추가하려면 다른 열 추가를 선택합니다. 드롭다운 목록에서 열 및 분류를 선택합니다.
-
예측 값의 경우 드롭다운 목록에서 열을 선택합니다. 이는 사용자 지정 모델이 합성 데이터 세트에 대해 훈련된 후 예측에 사용하는 열입니다.
-
-
고급 설정을 사용하면 프라이버시 수준 및 프라이버시 임계값을 설정할 수 있습니다. 필요에 맞게 설정을 조정합니다.
-
프라이버시 수준에 엡실론 값을 입력하여 생성된 데이터 세트에서 프라이버시를 보호하기 위해 합성 모델이 추가하는 노이즈의 양을 결정합니다. 값은 0.0001에서 10 사이여야 합니다.
-
값이 낮을수록 노이즈가 커져 개인 정보 보호가 강화되지만이 데이터에 대해 훈련된 다운스트림 사용자 지정 모델의 유틸리티는 잠재적으로 감소할 수 있습니다.
-
값이 높을수록 노이즈가 줄어들어 정확도는 높아지지만 개인 정보 보호는 줄어들 수 있습니다.
프라이버시 임계값에 멤버십 추론 공격이 원래 데이터 세트의 구성원을 식별할 수 있는 가장 높은 허용 확률을 입력합니다. 값은 50.0에서 100 사이여야 합니다.
-
50%의 점수는 멤버십 추론 공격이 무작위 추측보다 비멤버와 멤버를 성공적으로 구분할 수 없음을 나타냅니다.
-
프라이버시 제한이 없는 경우 100%를 입력합니다.
최적의 값은 특정 사용 사례 및 개인 정보 보호 요구 사항에 따라 달라집니다. 개인 정보 임계값을 초과하면 ML 입력 채널 생성이 실패하고 합성 데이터 세트를 사용하여 모델을 훈련할 수 없습니다.
-
-
주의
합성 데이터 생성은 특정 개인이 원래 데이터세트에 있는지 또는 해당 개인의 학습 속성이 있는지 여부에 관계없이 개별 속성을 유추하지 못하도록 보호합니다. 그러나 개인 식별 정보(PII)를 포함하여 원래 데이터 세트의 리터럴 값이 합성 데이터 세트에 나타나는 것을 방지하지는 않습니다.
데이터 주체를 다시 식별할 수 있으므로 하나의 데이터 주체에만 연결된 입력 데이터 세트의 값을 사용하지 않는 것이 좋습니다. 예를 들어 한 명의 사용자만 우편번호에 거주하는 경우 합성 데이터 세트에 해당 우편번호가 있으면 사용자가 원래 데이터 세트에 있음을 확인할 수 있습니다. 고정밀 값을 잘라내거나 흔하지 않은 카탈로그를 다른 카탈로그로 대체하는 등의 기법을 사용하여이 위험을 완화할 수 있습니다. 이러한 변환은 ML 입력 채널을 생성하는 데 사용되는 쿼리의 일부일 수 있습니다.
-
-
리소스에 대해 태그를 활성화하려면 새 태그 추가를 선택한 다음 키 및 값 페어를 입력합니다.
-
생성(Create)을 선택합니다.
-
이제 공동 작업 구성원에게 분석 템플릿을 검토할 수 있음을 알릴 준비가 되었습니다. (자체 데이터를 쿼리하려는 경우 선택 사항)