Amazon DataZone 카탈로그에서 자산 검색 및 보기 - Amazon DataZone

Amazon DataZone 카탈로그에서 자산 검색 및 보기

Amazon DataZone은 데이터를 검색하는 간소화된 방법을 제공합니다. 데이터 포털에 액세스할 수 있는 권한이 있는 모든 Amazon DataZone 사용자는 Amazon DataZone 카탈로그에서 자산을 검색하고 자산 이름과 할당된 메타데이터를 볼 수 있습니다. 세부 정보 페이지를 검토하여 자산을 자세히 살펴볼 수 있습니다.

참고

자산에 포함된 실제 데이터를 보려면 먼저 자산을 구독하고 구독 요청을 승인하고 액세스 권한을 부여받아야 합니다.

Amazon DataZone 검색(신규 도메인 및 기존 도메인)에는 키워드 및 시맨틱 일치를 기반으로 한 결과가 포함됩니다. 검색 알고리즘은 키워드 일치 항목을 우선적으로 처리한 후 시맨틱 일치 항목을 추가합니다.

시맨틱 검색 기능은 다양한 역할과 직무를 가진 사용자들이 조직의 데이터 자산을 더 효과적으로 검색, 액세스 및 활용할 수 있도록 함으로써 의사 결정, 협업 및 전반적인 데이터 기반 역량을 향상시킵니다. 시맨틱 검색을 통해 키워드 입력 시 단순 키워드 일치 결과 외에도 동의어 기반 및 의미 기반 검색 결과가 제공됩니다. 예를 들어, 시맨틱 검색에서 'flower'를 검색어로 입력하면 이름에 'rose'라는 단어가 포함된 데이터 자산이 검색 결과에 반환됩니다. 'movie'를 검색어로 입력하면 이름에 'film'이라는 단어가 포함된 데이터 자산이 검색 결과에 반환됩니다. 'football'을 검색어로 입력하면 이름에 'soccer'라는 단어가 포함된 데이터 자산이 검색 결과에 반환될 수 있습니다.

키워드 검색을 사용하면 구독한 자산을 검색하는 동안 다양한 키워드를 입력할 수 있습니다. 예를 들어 Catalog Sales Data라는 자산이 있는 경우 catalog_sales, Catalog Sales, CatalogSales, catalogsales 키워드 중 하나를 입력 키워드를 입력하면 검색 결과에 반환됩니다.

Amazon DataZone은 또한 열 및 테이블 이름과 같은 기술적 식별자에 대해 정확한 일치 및 부분 일치 기능을 지원하여 검색 환경을 개선합니다. 이 새로운 기능을 사용하면 키워드를 큰따옴표(" ")로 묶어 검색을 수행하여 기술 이름과 정확히 일치하거나 부분적으로 일치하는 결과를 얻을 수 있습니다. 이 기능은 키워드 및 시맨틱 검색 기능 기반으로 설계되어 개념과 관련 용어를 통해 자산을 검색할 수 있도록 지원합니다. 기술 식별자에 대한 정밀도 계층을 추가함으로써, 이 개선 사항은 복잡한 기술적 명명 규칙을 가진 대규모 데이터 카탈로그를 관리할 수 있게 합니다.

데이터를 검색할 때 사용 사례를 지원하기 위해 특정 기술 자산을 찾아야 할 수 있습니다. 기술 식별자를 검색할 수 있는 기능을 통해 자산을 정확하게 검색할 수 있어 시간을 절약하고 검색 프로세스를 간소화할 수 있습니다. 예를 들어 “customer_id”와 같은 쿼리는 정확한 식별자를 가진 열이나 테이블을 반환하는 반면, “sales_”와 같은 부분 쿼리는 sales_summary 및 sales_data_2024와 같은 관련 자산을 식별할 수 있습니다. 이 개선 사항은 데이터 소비자가 필요한 자산을 효율적으로 찾을 수 있도록 하여 생산성을 향상시킵니다.

카탈로그에서 자산을 검색하려면
  1. Amazon DataZone 데이터 포털 URL로 이동하여 AWS Single Sign-On(SSO) 또는 AWS 자격 증명을 사용하여 로그인합니다. Amazon DataZone 관리자인 경우 https://console.aws.amazon.com/datazone에서 Amazon DataZone 콘솔로 이동하여 도메인이 생성된 AWS 계정으로 로그인한 다음 데이터 포털 열기를 선택합니다.

  2. 데이터 포털 홈 페이지의 검색 창에 찾고 있는 자산의 이름을 입력할 수 있습니다.

  3. 네임스페이스를 검색하려면 페이지 오른쪽 상단에서 카탈로그를 선택하여 카탈로그를 엽니다. 카탈로그는 데이터 소유자 및 용어집 용어와 같은 기준을 검색하여 자산을 찾을 수 있는 패싯 검색 환경을 제공합니다.

  4. 검색 상자 중 하나에 검색어를 입력합니다. 검색을 실행한 후 다양한 필터를 적용하여 결과를 좁힐 수 있습니다. 필터에는 자산 유형, 소스 계정 및 자산이 속한 AWS 리전이 포함됩니다.

  5. 특정 자산에 대한 세부 정보를 보려면 자산을 선택하여 세부 정보 페이지를 엽니다. 세부 정보 페이지에는 다음 정보가 포함되어 있습니다.

    • 자산 이름, 데이터 소스(AWS Glue, Amazon Redshift 또는 Amazon S3), 유형(테이블, 뷰 또는 S3 객체), 열 수 및 크기입니다.

    • 자산에 대한 설명입니다.

    • 자산의 현재 게시된 개정, 소유자, 구독에 대한 승인 필요 여부, 네임페이스 및 업데이트 기록.

    • 용어집의 용어 및 메타데이터 양식을 포함하는 개요 탭입니다.

    • 비즈니스 및 기술 열 이름, 데이터 유형, 열의 비즈니스 설명을 포함하여 자산의 스키마를 표시하는 스키마 탭입니다. 스키마 탭은 테이블 및 뷰(Amazon S3 객체 제외)에만 표시됩니다.

    • 도메인 구독자 목록이 포함된 구독 탭입니다.

    • 자산의 과거 개정 목록을 포함하는 기록 탭입니다.