

 Amazon Redshift는 패치 198부터 새 Python UDF 생성을 더 이상 지원하지 않습니다. 기존 Python UDF는 2026년 6월 30일까지 계속 작동합니다. 자세한 내용은 [블로그 게시물](https://aws.amazon.com/blogs/big-data/amazon-redshift-python-user-defined-functions-will-reach-end-of-support-after-june-30-2026/)을 참조하세요.

# 데이터 처리 옵션
<a name="t_setting-data-handling-options"></a>

이 주제에서는 Redshift Spectrum이 예기치 않은 형식으로 데이터를 처리하는 방식을 구성하는 방법을 설명합니다.

외부 테이블을 만들 때 테이블 파라미터를 설정하여 외부 테이블에서 쿼리되는 데이터를 조정할 수 있습니다. 그러지 않으면 스캔 오류가 발생할 수 있습니다. 자세한 내용은 [CREATE EXTERNAL TABLE](r_CREATE_EXTERNAL_TABLE.md)에서 테이블 속성을 참조하세요. 예시는 [데이터 처리 예](r_CREATE_EXTERNAL_TABLE_examples.md#r_CREATE_EXTERNAL_TABLE_examples-data-handling) 섹션을 참조하세요. 오류 목록은 [SVL\$1SPECTRUM\$1SCAN\$1ERROR](r_SVL_SPECTRUM_SCAN_ERROR.md) 단원을 참조하세요.

외부 테이블을 만들 때 다음 테이블 속성을 설정하여 외부 테이블에서 쿼리되는 데이터의 입력 처리를 지정할 수 있습니다.
+ `column_count_mismatch_handling`은 파일에 포함된 행 값이 외부 테이블 정의에 지정된 열 수보다 적거나 많은지 식별합니다.
+ `invalid_char_handling` - VARCHAR, CHAR 및 문자열 데이터를 포함하는 열에서 잘못된 문자의 입력 처리를 지정합니다. `invalid_char_handling`에 REPLACE를 지정하는 경우 사용할 대체 문자를 지정할 수 있습니다.
+ `numeric_overflow_handling` - 정수 및 십진수 데이터가 포함된 열에서 캐스트 오버플로우 처리를 지정합니다.
+ VARBYTE 데이터를 포함하는 열의 잉여 바이트에 대한 입력 처리를 지정하는 `surplus_bytes_handling`.
+ `surplus_char_handling` - VARCHAR, CHAR 및 문자열 데이터를 포함하는 열에서 잉여 문자의 입력 처리를 지정합니다.

최대 오류 수를 초과하는 쿼리를 취소하도록 구성 옵션을 설정할 수 있습니다. 자세한 내용은 [spectrum\$1query\$1maxerror](r_spectrum_query_maxerror.md) 섹션을 참조하세요.