ColumnDataType - AWS Glue

ColumnDataType

지정된 열의 값을 Apache Spark에서 제공된 유형으로 캐스팅할 수 있는지 여부를 확인합니다. with threshold 식을 수락하여 열에 있는 값의 하위 세트를 확인합니다.

구문

ColumnDataType <COL_NAME> = <EXPECTED_TYPE>
  • COL_NAME - 데이터 품질 규칙을 평가할 열의 이름입니다.

    지원되는 열 유형: 문자열 유형

    지원되는 열 유형: Byte, Decimal, Double, Float, Integer, Long, Short

  • EXPECTED_TYPE - 열에 있는 값의 예상 유형입니다.

    지원되는 값: Boolean, Date, Timestamp, Integer, Double, Float, Long

    지원되는 열 유형: Byte, Decimal, Double, Float, Integer, Long, Short

  • EXPRESSION - 예상 유형이어야 하는 값의 백분율을 지정하는 선택적 표현식입니다.

    지원되는 열 유형: Byte, Decimal, Double, Float, Integer, Long, Short

예: 열 데이터 형식 정수 역할의 문자열

다음 예제 규칙은 문자열 유형인 지정된 열의 값을 정수로 캐스팅할 수 있는지 여부를 확인합니다.

ColumnDataType "colA" = "INTEGER"

예: 열 데이터 형식 정수 역할의 문자열에서 값의 하위 세트 확인

다음 예제 규칙은 문자열 유형인 지정된 열의 값 중 90%를 정수로 캐스팅할 수 있는지 여부를 확인합니다.

ColumnDataType "colA" = "INTEGER" with threshold > 0.9