本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
連線參數
下表詳細說明每個資料存放區AWS Glue連線支援的 Python 屬性。
Amazon Redshift 連線參數
Amazon Redshift 的連線支援下列 Python AWS Glue連線參數。
| 金錀 | Type | 說明 | Constraints | 必要 |
|---|---|---|---|---|
auto_create |
類型:boolean |
指出若使用者不存在,是否應建立他們。預設為 false。 |
true, false |
否 |
aws_secret_arn |
類型:string |
用來擷取連線之其他參數的機密 ARN。 | 有效 ARN | 否 |
cluster_identifier |
類型:string - maxLength:63 |
Amazon Redshift 叢集的叢集識別碼。 | ^(?!.*—)[a-z][a-z0-9-]{0,61}[a-z0-9]$ | 否 |
database |
類型:string - maxLength:127 |
要連線到之資料庫的名稱。 | 否 | |
database_metadata_current_db_only |
類型:boolean |
指出應用程式是否支援多資料庫資料共用目錄。預設為 true 以指出應用程式不會為了回溯相容性而支援多資料庫資料共用目錄。 |
true, false |
否 |
db_groups |
類型:string |
db_user 針對目前工作階段所聯結之現有資料庫群組名稱的逗號分隔清單。 |
否 | |
db_user |
類型:string |
要與 Amazon Redshift 搭配使用的使用者 ID。 | 否 | |
host |
類型:string - maxLength:256 |
Amazon Redshift 叢集的主機名稱。 | 否 | |
iam |
類型:boolean |
為連線啟用或停用 IAM 型驗證的旗標。預設為 false。 |
true, false |
否 |
iam_disable_cache |
類型:boolean |
此選項會指定是否快取 IAM 憑證。預設為 true。當對於 API 閘道的請求遭到限流時,這可以提高效能。 |
true, false |
否 |
max_prepared_statements |
類型:integer |
可以一次開啟的預備陳述式數量上限。 | 否 | |
numeric_to_float |
小數轉浮點數 | 指定是否將從小數轉換 NUMERIC 資料類型值。根據預設,會將 NUMERIC 值做為 decimal.Decimal Python 物件接收。對於偏好最高精確度的使用案例,不建議啟用此選項,因為結果可能會四捨五入。啟用此選項之前,請參閱 decimal.Decimaldecimal.Decimal 與 float 之間的權衡。預設為 false。 |
true, false |
否 |
port |
類型:integer |
Amazon Redshift 叢集的連接埠號碼。 | 範圍 1150-65535 | 否 |
profile |
類型:string - maxLength:256 |
包含 AWS CLI 使用的憑證和設定的設定檔名稱。 | 否 | |
region |
類型:string |
叢集所在的AWS區域。 | 有效AWS區域 | 否 |
serverless_acct_id |
類型:string - maxLength:256 |
與 Amazon Redshift 無伺服器資源相關聯的AWS帳戶 ID。 | 否 | |
serverless_work_group |
類型:string - maxLength:256 |
Amazon Redshift Serverless 端點的工作群組名稱。 | 否 | |
ssl |
類型:boolean |
如果已啟用 SSL,則為 true。 |
true, false |
否 |
ssl_mode |
類型:enum[verify-ca, verify-full, null]) |
Amazon Redshift 的連線安全性。verify-ca(必須使用 SSL,且必須驗證伺服器憑證。) 和 verify-full (必須使用 SSL。伺服器憑證必須經過驗證,且伺服器主機名稱必須符合憑證上的主機名稱屬性。) 受到支援。如需詳細資訊,請參閱 Amazon Redshift 文件中的設定連線的安全選項。預設為 verify-ca。 |
verify-ca, verify-full |
否 |
timeout |
類型:integer |
對伺服器的連線在逾時前要經過的秒數。 | 0 | 否 |
Athena 連線參數
Athena 的連線支援下列 Python AWS Glue連線參數。
| 金錀 | Type | 說明 | Constraints | 必要 |
|---|---|---|---|---|
aws_access_key_id |
類型:string - maxLength:256 |
指定與 IAM 帳戶相關聯的AWS存取金鑰。建議您將此資訊存放在 aws_secret 中。 |
長度:16-128 | 否 |
aws_secret_access_key |
類型:string - maxLength:256 |
AWS存取金鑰的私密部分。建議您將此資訊存放在 aws_secret 中。 |
否 | |
aws_secret_arn |
類型:string |
用來擷取連線之其他參數的機密 ARN。 | 有效 ARN | 否 |
catalog_name |
類型:string - maxLength:256 |
包含透過驅動程式存取的資料庫和資料表的目錄。如需有關目錄的資訊,請參閱 DataCatalog。 | 否 | |
duration_seconds |
類型:number |
角色工作階段的持續時間 (以秒為單位)。此設定的值可介於 1 小時至 12 小時。根據預設,持續時間設定為 3600 秒 (1 小時)。 | 範圍從 900 秒 (15 分鐘) 到角色的工作階段持續時間上限設定。 | 否 |
encryption_option |
類型:enum[SSE_S3, SSE_KMS, CSE_KMS, null]) |
Amazon S3 的靜態加密 請參閱 Athena 指南中的靜態加密一節。 | SSE_S3, SSE_KMS, CSE_KMS |
否 |
kms_key |
類型:string - maxLength:256 |
AWS KMS如果在 CSE_KMS中使用 金鑰encrytion_option。 |
否 | |
poll_interval |
類型:number |
在 Athena 中輪詢查詢結果狀態的間隔,以秒為單位。 | 否 | |
profile_name |
類型:string - maxLength:256 |
AWS組態設定檔的名稱,其登入資料應該用來驗證對 Athena 的請求。 | 否 | |
region_name |
類型:string |
執行查詢AWS的區域。 | 有效AWS區域 | 否 |
result_reuse_enable |
類型:boolean |
啟用重複使用先前的查詢結果。 | true, false |
否 |
result_reuse_minutes |
類型:integer |
指定 Athena 應考慮重複使用的之前查詢結果的最長期限 (以分鐘為單位)。預設為 60。 | >= 1 | 否 |
role_arn |
類型:string |
要用於執行查詢的角色。 | 有效 ARN | 否 |
schema_name |
類型:string - maxLength:256 |
要用於資料庫的預設結構描述名稱。 | 否 | |
s3_staging_dir |
類型:string - maxLength:1024 |
Amazon S3 中存放查詢結果的位置。 | 需要 s3_staging_dir 或 work_group |
|
work_group |
類型:string |
將在其中執行查詢的工作群組。如需有關工作群組的資訊,請參閱工作群組。 | ^[a-zA-Z0-9._-]{1,128}$ | 需要 s3_staging_dir 或 work_group |
Snowflake 連線參數
Snowflake 的連線支援下列 Python AWS Glue連線參數。
Snowflake 連線參數
| 金錀 | Type | 說明 | Constraints | 必要 |
|---|---|---|---|---|
account |
類型:string - maxLength:256 |
Snowflake 帳戶識別碼。帳戶識別碼不包含 snowflakecomputing.com 尾碼。 |
是 | |
arrow_number_to_decimal |
類型:boolean |
預設為 False,這表示 NUMBER 資料欄值會以雙精度浮點數 (float64) 傳回。將此設定為 True,以在呼叫 fetch_pandas_all() 和 fetch_pandas_batches() 方法時傳回 DECIMAL 資料欄值做為十進位數 (decimal.Decimal)。 |
true, false |
否 |
autocommit |
類型:boolean |
預設為 false,這會遵守 Snowflake 參數 AUTOCOMMIT。設定為 true 或 false,分別在工作階段中啟用或停用 autocommit 模式。 |
true, false |
否 |
aws_secret_arn |
類型:string |
用來擷取連線之其他參數的機密 ARN。 | 有效 ARN | 否 |
client_prefetch_threads |
類型:integer |
用來下載結果集的執行緒數量 (預設為 4)。增加值可改善擷取效能,但需要更多記憶體。 | 否 | |
database |
類型:string - maxLength:256 |
要使用的資料庫名稱。 | 否 | |
login_timeout |
類型:integer |
登入請求的逾時,以秒為單位。預設為 60 秒。如果 HTTP 回應不是 success,則登入請求會在逾時長度之後放棄。 |
否 | |
network_timeout |
類型:integer |
所有其他操作的逾時,以秒為單位。預設為 none (無限)。如果 HTTP 回應不是 success,一般請求會在逾時長度之後放棄。 |
否 | |
paramstyle |
類型:string - maxLength:256 |
從 Python 程式碼執行 SQL 查詢時,用於參數替換的預留位置語法。用戶端繫結預設為 pyformat。指定 qmark 或 numeric 以變更伺服器端繫結的繫結變數格式。 |
否 | |
role |
類型:string - maxLength:256 |
要使用的預設角色名稱。 | 否 | |
schema |
類型:string - maxLength:256 |
要用於資料庫的預設結構描述名稱。 | 否 | |
timezone |
類型:string - maxLength:128 |
預設為無,它會遵守 Snowflake 參數 TIMEZONE。設定為有效的時區 (例如 America/Los_Angeles) 以設定工作階段時區。 |
格式類似於 America/Los_Angeles 的時區 |
否 |
validate_default_parameters |
類型:boolean |
如果指定的資料庫、結構描述或倉儲不存在,請設定為 true 以引發例外狀況。預設為 false。 |
否 | |
warehouse |
類型:string - maxLength:256 |
要使用的預設倉儲名稱。 | 否 |