SUPER 형식 - Amazon Redshift

Amazon Redshift는 2025년 11월 1일부터 새 Python UDF 생성을 더 이상 지원하지 않습니다. Python UDF를 사용하려면 이 날짜 이전에 UDF를 생성하세요. 기존 Python UDF는 정상적으로 계속 작동합니다. 자세한 내용은 블로그 게시물을 참조하세요.

SUPER 형식

SUPER 데이터 형식을 사용하여 반정형 데이터나 문서를 값으로 저장합니다. Amazon Redshift는 VARCHAR를 사용하여 이러한 값을 저장할 수 있지만 SUPER 데이터 형식을 대신 사용하는 것이 좋습니다.

반정형 데이터는 SQL 데이터베이스에 사용되는 관계형 데이터 모델의 엄격한 테이블형 구조를 따르지 않습니다. 여기에는 데이터 내의 고유한 엔티티를 참조하는 태그가 포함됩니다. 여기에는 배열, 중첩 구조 및 JSON과 같은 직렬화 형식과 연결된 기타 복잡한 구조와 같은 복소수 값이 포함될 수 있습니다. SUPER 데이터 형식은 Amazon Redshift의 다른 모든 스칼라 형식을 포함하는 스키마 없는 배열 및 구조 값 집합입니다.

SUPER 데이터 형식은 개별 SUPER 객체에 대해 최대 16MB의 데이터를 지원합니다. 테이블에 이를 구현하는 예를 포함하여 SUPER 데이터 유형에 대한 자세한 내용은 Amazon Redshift의 반정형 데이터을 참조하세요.

Amazon Redshift는 COPY 명령을 사용하여 다음과 같은 반정형 데이터 형식을 수집할 수 있도록 기본적으로 지원합니다.

  • JSON

  • ARRAY

  • TEXT

  • CSV

1MB보다 큰 SUPER 객체는 다음 파일 형식에서만 수집할 수 있습니다.

  • Parquet

  • JSON

  • TEXT

  • CSV

SUPEWER 데이터 형식은 다음과 같은 속성을 가집니다.

  • Amazon Redshift 스칼라 값:

    • null

    • 부울

    • smallint, integer, bigint, decimal 또는 부동 소수점(예: float4 또는 float8)과 같은 숫자

    • varchar 또는 char와 같은 문자열 값

  • 복소수 값:

    • 스칼라 또는 복소수를 포함한 값의 배열

    • 속성 이름 및 값(스칼라 또는 복소수)의 맵인 구조체(튜플 또는 객체라고도 함)

두 가지 형식의 복소수 값은 규칙성에 대한 제한 없이 자체 스칼라 또는 복소수 값을 포함합니다.

SUPER 데이터 형식의 기본 압축 인코딩은 ZSTD입니다. 압축 인코딩에 대한 자세한 내용은 압축 인코딩 섹션을 참조하세요.

SUPER 데이터 형식은 스키마 없는 형태로 반정형 데이터의 지속성을 지원합니다. 계층적 데이터 모델은 변경될 수 있지만 이전 버전의 데이터는 동일한 SUPER 열에 공존할 수 있습니다.

Amazon Redshift는 PartiQL을 사용하여 배열 및 구조체에 대한 탐색을 활성화합니다. Amazon Redshift는 SUPER 배열을 반복하는 데도 PartiQL 구문을 사용합니다. 자세한 내용은 PartiQL - Amazon Redshift용 SQL 호환 쿼리 언어 섹션을 참조하세요.

Amazon Redshift는 동적 형식 지정을 사용하여 쿼리에 사용하기 전에 데이터 유형을 선언할 필요 없이 스키마 없는 SUPER 데이터를 처리합니다. 자세한 내용은 동적 형식 지정 섹션을 참조하세요.

SUPER 형식 열의 경로에 있는 스칼라 값에 동적 데이터 마스킹 정책을 적용할 수 있습니다. 동적 데이터 마스킹에 대한 자세한 내용은 동적 데이터 마스킹 섹션을 참조하세요. SUPER 데이터 유형에 동적 데이터 마스킹을 사용하는 방법에 대한 자세한 내용은 SUPER 데이터 유형 경로와 함께 동적 데이터 마스킹 사용 섹션을 참조하세요.

SUPER 데이터로 작업할 때는 r_enable_case_sensitive_super_attribute 구성 옵션을 true로 설정하는 것이 좋습니다. 자세한 내용은 enable_case_sensitive_super_attribute 섹션을 참조하세요.