Amazon Redshift 自 2025 年 11 月 1 日起不再支援建立新的 Python UDF。如果您想要使用 Python UDF,請在該日期之前建立 UDF。現有 Python UDF 將繼續正常運作。如需詳細資訊,請參閱部落格文章
從單欄資料格式 COPY
COPY 可以從 Amazon S3 載入下列單欄格式的資料:
-
ORC
-
Parquet
如需從單欄式資料格式使用 COPY 的範例,請參閱COPY 範例。
COPY 支援單欄格式資料,但有下列考量事項:
-
Amazon S3 儲存貯體必須位於 Amazon Redshift 資料庫所在的同一 AWS 區域。
-
若要透過 VPC 端點存取您的 Amazon S3 資料,請按照《Amazon Redshift 管理指南》中的使用 Amazon Redshift Spectrum 搭配增強型 VPC 路由所述,使用 IAM 政策和 IAM 角色來設定存取。
-
COPY 不會自動套用壓縮編碼。
-
僅支援下列 COPY 參數:
-
ACCEPTINVCHARS:從 ORC 或 Parquet 檔案複製時。
-
-
如果 COPY 於載入時發生錯誤,命令會失敗。單欄資料類型不支援 ACCEPTANYDATE 和 MAXERROR。
錯誤訊息會傳送給 SQL 用戶端。一些錯誤會記錄在 STL_LOAD_ERRORS 和 STL_ERROR 中。
-
COPY 會依欄在單欄資料檔案中出現的同樣順序,將值插入目標資料表的欄。目標資料表的欄數和資料檔案的欄數必須相符。
-
如果您在 COPY 操作中指定的檔案包含下列其中一個副檔名,則不需要新增任何參數,我們就會將資料解壓縮:
.gz.snappy.bz2
從 Parquet 和 ORC 檔案格式 COPY 需用到 Redshift Spectrum 和儲存貯體存取權。若要針對這些格式使用 COPY,請確定沒有任何 IAM 政策會封鎖使用 Amazon S3 預先簽章的 URL。Amazon Redshift 產生的預先簽章 URL 有效期為 1 小時,如此 Amazon Redshift 就有足夠的時間從 Amazon S3 儲存貯體載入所有檔案。COPY 從單欄資料格式掃描的每個檔案都會產生唯一的預先簽章 URL。對於包含
s3:signatureAge動作的儲存貯體政策,請務必將值設定為至少 3,600,000 毫秒。如需詳細資訊,請參閱使用 Amazon Redshift Spectrum 搭配增強型 VPC 路由。-
單欄資料格式的 COPY 不支援搭配 REGION 參數使用。即使您的 Amazon S3 儲存貯體和資料庫位於相同的 AWS 區域 中,仍可能會遇到錯誤,例如
PARQUET 型 COPY 不支援 REGION 引數。 -
單欄格式的 COPY 現在支援並行擴展。若要啟用並行擴展,請參閱設定並行擴展佇列。