Quick Sight에서 Databricks 사용 - Amazon Quick Suite

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

Quick Sight에서 Databricks 사용

이 섹션을 사용하여 Quick Sight에서 Databricks로 연결하는 방법을 알아봅니다.

Databricks에 연결하기
  1. 먼저 새 데이터 세트를 생성합니다. 왼쪽 탐색 창에서 데이터를 선택합니다.

  2. 생성을 선택한 다음 새 데이터 세트를 선택합니다.

  3. Databricks 데이터 소스 카드를 선택합니다.

  4. 데이터 소스 이름의 경우 Databricks 데이터 소스 연결(예: Databricks CS)의 설명이 포함된 이름을 입력합니다. Databricks에 연결하여 많은 데이터 세트를 생성할 수 있으므로 이름은 단순하게 유지하는 것이 좋습니다.

  5. 연결 유형에서 사용 중인 네트워크 유형을 선택합니다.

    • 퍼블릭 네트워크 - 데이터를 공개적으로 공유하는 경우.

    • VPC - 데이터가 VPC 내에 있는 경우.

    참고

    VPC를 사용 중인데 목록에 없는 경우 관리자에게 문의하세요.

  6. 데이터베이스 서버의 경우 Databricks 연결 세부 정보에 지정된 작업 공간의 호스트 이름을 입력합니다.

  7. HTTP 경로의 경우 Databricks 연결 세부 정보에 지정된 스파크 인스턴스의 부분 URL을 입력합니다.

  8. 포트에는 Databricks 연결 세부 정보에 지정된 포트를 입력합니다.

  9. 사용자 이름비밀번호에 연결 보안 인증 정보를 입력합니다.

  10. 연결이 제대로 작동하는지 확인하려면 연결 검증을 클릭합니다.

  11. 완료하고 데이터 소스를 만들려면 데이터 소스 만들기를 클릭합니다.

Databricks용 새 Quick Sight 데이터 세트 추가

Databricks 데이터에 대한 기존 데이터 소스 연결이 있으면 분석에 사용할 Databricks 데이터 세트를 생성할 수 있습니다.

Databricks를 사용하여 데이터 세트 생성하기
  1. 왼쪽에서 데이터를 선택한 다음 아래로 스크롤하여 Databricks 연결에 사용할 데이터 소스 카드를 찾습니다. 데이터 소스가 여러 개 있는 경우 페이지 상단의 검색 창을 사용하여 이름이 일부 일치하는 데이터 소스를 찾을 수 있습니다.

  2. Databricks 데이터 소스 카드를 선택한 다음 데이터 세트 생성을 선택합니다.

  3. 연결하려는 테이블을 지정하려면 먼저 사용할 카탈로그와 스키마를 선택합니다. 그런 다음 테이블에서 사용할 테이블을 선택합니다. 자체 SQL 문을 사용하려면 사용자 지정 SQL 사용을 선택합니다.

  4. 편집/미리 보기를 선택합니다.

  5. (선택 사항) 데이터를 더 많이 추가하려면 다음 단계를 사용합니다.

    1. 오른쪽 상단에서 데이터 추가를 선택합니다.

    2. 다른 데이터에 연결하려면 데이터 소스 전환을 선택하고 다른 데이터 세트를 선택합니다.

    3. UI 프롬프트에 따라 데이터 추가를 완료합니다.

    4. 동일한 데이터 세트에 새 데이터를 추가한 후 이 조인 구성(빨간색 점 2개)을 선택합니다. 각 추가 테이블에 대해 조인을 설정합니다.

    5. 계산된 필드를 추가하고자 하는 경우 계산된 필드 추가를 선택합니다.

    6. SageMaker AI에서 모델을 추가하려면 SageMaker로 보강을 선택하세요. 이 옵션은 Quick Suite Enterprise 에디션에서만 사용할 수 있습니다.

    7. 생략할 필드의 확인란을 선택 취소하십시오.

    8. 변경하고자 하는 데이터 유형을 업데이트하세요.

  6. 마치면 저장을 선택하여 데이터 세트를 저장하고 닫습니다.

Databricks 연결에 대한 Quick Sight 관리자 안내서

Amazon Quick Sight를 사용하여 Databricks에 연결할 수 있습니다 AWS. AWS Marketplace 또는 Databricks 웹 사이트를 통해에 가입했는지 AWS 여부에 따라 Databricks에 연결할 수 있습니다.

Databricks에 연결하려면 먼저 연결에 필요한 기존 리소스를 만들거나 식별해야 합니다. 이 섹션을 사용하면 Quick Sight에서 Databricks로 연결하는 데 필요한 리소스를 수집하는 데 도움이 됩니다.

  • Databricks 연결 세부 정보를 얻는 방법을 알아보려면 Databricks ODBC 및 JDBC 연결을 참조하십시오.

  • 인증을 위해 Databricks 보안 인증(개인 액세스 토큰 또는 사용자 이름 및 암호)을 얻는 방법을 알아보려면 Databricks 설명서인증 요구 사항을 참조하십시오.

    Databricks 클러스터에 연결하려면 Can Attach ToCan Restart 권한이 필요합니다. 이러한 권한은 Databricks에서 관리됩니다. 자세한 내용은 Databricks 설명서권한 요구 사항을 참조하십시오.

  • Databricks에 대한 프라이빗 연결을 설정하는 경우 Quick Sight와 함께 사용하도록 VPC를 구성하는 방법에 대해 자세히 알아보려면 Quick Sight 설명서의 Amazon Quick Sight를 사용하여 VPC에 연결을 참조하세요. 연결이 보이지 않는 경우 시스템 관리자에게 문의하여 네트워크에 Amazon Route 53용 오픈 인바운드 엔드포인트가 있는지 확인하십시오. Databricks 작업 공간의 호스트 이름은 퍼블릭 IP를 사용하며, Route 53 보안 그룹의 경우 DNS 포트 53에서 트래픽을 허용하려면 DNS TCP 및 DNS UDP 인바운드 및 아웃바운드 규칙이 있어야 합니다. 관리자는 2개의 인바운드 규칙을 포함하는 보안 그룹을 생성해야 합니다. 하나는 VPC CIDR에 대한 포트 53의 DNS(TCP)용이고 다른 하나는 VPC CIDR에 대한 포트 53의 DNS(UDP)용입니다.

    퍼블릭 연결 대신 PrivateLink를 사용하는 경우 Databricks 관련 세부 정보는 Databricks 설명서Enable AWS PrivateLink를 참조하세요.