從單欄資料格式 COPY - Amazon Redshift

Amazon Redshift 自 2025 年 11 月 1 日起不再支援建立新的 Python UDF。如果您想要使用 Python UDF,請在該日期之前建立 UDF。現有 Python UDF 將繼續正常運作。如需詳細資訊,請參閱部落格文章

從單欄資料格式 COPY

COPY 可以從 Amazon S3 載入下列單欄格式的資料:

  • ORC

  • Parquet

如需從單欄式資料格式使用 COPY 的範例,請參閱COPY 範例

COPY 支援單欄格式資料,但有下列考量事項:

  • Amazon S3 儲存貯體必須位於 Amazon Redshift 資料庫所在的同一 AWS 區域。

  • 若要透過 VPC 端點存取您的 Amazon S3 資料,請按照《Amazon Redshift 管理指南》中的使用 Amazon Redshift Spectrum 搭配增強型 VPC 路由所述,使用 IAM 政策和 IAM 角色來設定存取。

  • COPY 不會自動套用壓縮編碼。

  • 僅支援下列 COPY 參數:

  • 如果 COPY 於載入時發生錯誤,命令會失敗。單欄資料類型不支援 ACCEPTANYDATE 和 MAXERROR。

  • 錯誤訊息會傳送給 SQL 用戶端。一些錯誤會記錄在 STL_LOAD_ERRORS 和 STL_ERROR 中。

  • COPY 會依欄在單欄資料檔案中出現的同樣順序,將值插入目標資料表的欄。目標資料表的欄數和資料檔案的欄數必須相符。

  • 如果您在 COPY 操作中指定的檔案包含下列其中一個副檔名,則不需要新增任何參數,我們就會將資料解壓縮:

    • .gz

    • .snappy

    • .bz2

  • 從 Parquet 和 ORC 檔案格式 COPY 需用到 Redshift Spectrum 和儲存貯體存取權。若要針對這些格式使用 COPY,請確定沒有任何 IAM 政策會封鎖使用 Amazon S3 預先簽章的 URL。Amazon Redshift 產生的預先簽章 URL 有效期為 1 小時,如此 Amazon Redshift 就有足夠的時間從 Amazon S3 儲存貯體載入所有檔案。COPY 從單欄資料格式掃描的每個檔案都會產生唯一的預先簽章 URL。對於包含 s3:signatureAge 動作的儲存貯體政策,請務必將值設定為至少 3,600,000 毫秒。如需詳細資訊,請參閱使用 Amazon Redshift Spectrum 搭配增強型 VPC 路由

  • 單欄資料格式的 COPY 不支援搭配 REGION 參數使用。即使您的 Amazon S3 儲存貯體和資料庫位於相同的 AWS 區域 中,仍可能會遇到錯誤,例如 PARQUET 型 COPY 不支援 REGION 引數

  • 單欄格式的 COPY 現在支援並行擴展。若要啟用並行擴展,請參閱設定並行擴展佇列