Amazon Redshift 自 2025 年 11 月 1 日起不再支援建立新的 Python UDF。如果您想要使用 Python UDF,請在該日期之前建立 UDF。現有 Python UDF 將繼續正常運作。如需詳細資訊,請參閱部落格文章
資料處理選項
本主題說明如何設定 Redshift Spectrum 處理非預期格式資料的方式。
您可以在建立外部資料表時設定資料表參數,以調整外部資料表中查詢的資料。否則,可能會發生掃描錯誤。如需詳細資訊,請參閱 CREATE EXTERNAL TABLE 中的 TABLE PROPERTIES。如需範例,請參閱 資料處理範例。如需錯誤清單,請參閱 SVL_SPECTRUM_SCAN_ERROR。
您可以在建立外部資料表時設定下列 TABLE PROPERTIES,以指定外部資料表中查詢之資料的輸入處理方式。
-
column_count_mismatch_handling,識別檔案包含的列值是否少於或多於外部資料表定義中指定的欄數。 -
invalid_char_handling,指定包含 VARCHAR、CHAR 和字串資料之欄中無效字元的輸入處理。當您為invalid_char_handling指定 REPLACE 時,您可以指定要使用的取代字元。 -
numeric_overflow_handling,指定包含整數和小數資料之欄中的強制轉換溢位處理。 -
surplus_bytes_handling,指定包含 VARBYTE 資料之欄中多餘位元組的輸入處理。 -
surplus_char_handling,指定包含 VARCHAR、CHAR 和字串資料之欄中多餘字元的輸入處理。
您可以設定組態選項來取消超過錯誤數目上限的查詢。如需更多詳細資訊,請參閱 spectrum_query_maxerror。