連線參數 - Amazon SageMaker AI

本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。

連線參數

下表詳細說明每個資料存放區AWS Glue連線支援的 Python 屬性。

Amazon Redshift 連線參數

Amazon Redshift 的連線支援下列 Python AWS Glue連線參數。

金錀 Type 說明 Constraints 必要
auto_create 類型:boolean 指出若使用者不存在,是否應建立他們。預設為 false true, false
aws_secret_arn 類型:string 用來擷取連線之其他參數的機密 ARN。 有效 ARN
cluster_identifier 類型:string - maxLength:63 Amazon Redshift 叢集的叢集識別碼。 ^(?!.*—)[a-z][a-z0-9-]{0,61}[a-z0-9]$
database 類型:string - maxLength:127 要連線到之資料庫的名稱。
database_metadata_current_db_only 類型:boolean 指出應用程式是否支援多資料庫資料共用目錄。預設為 true 以指出應用程式不會為了回溯相容性而支援多資料庫資料共用目錄。 true, false
db_groups 類型:string db_user 針對目前工作階段所聯結之現有資料庫群組名稱的逗號分隔清單。
db_user 類型:string 要與 Amazon Redshift 搭配使用的使用者 ID。
host 類型:string - maxLength:256 Amazon Redshift 叢集的主機名稱。
iam 類型:boolean 為連線啟用或停用 IAM 型驗證的旗標。預設為 false true, false
iam_disable_cache 類型:boolean 此選項會指定是否快取 IAM 憑證。預設為 true。當對於 API 閘道的請求遭到限流時,這可以提高效能。 true, false
max_prepared_statements 類型:integer 可以一次開啟的預備陳述式數量上限。
numeric_to_float 小數轉浮點數 指定是否將從小數轉換 NUMERIC 資料類型值。根據預設,會將 NUMERIC 值做為 decimal.Decimal Python 物件接收。對於偏好最高精確度的使用案例,不建議啟用此選項,因為結果可能會四捨五入。啟用此選項之前,請參閱 decimal.Decimal 上的 Python 文件,以了解 decimal.Decimalfloat 之間的權衡。預設為 false true, false
port 類型:integer Amazon Redshift 叢集的連接埠號碼。 範圍 1150-65535
profile 類型:string - maxLength:256 包含 AWS CLI 使用的憑證和設定的設定檔名稱。
region 類型:string 叢集所在的AWS區域。 有效AWS區域
serverless_acct_id 類型:string - maxLength:256 與 Amazon Redshift 無伺服器資源相關聯的AWS帳戶 ID。
serverless_work_group 類型:string - maxLength:256 Amazon Redshift Serverless 端點的工作群組名稱。
ssl 類型:boolean 如果已啟用 SSL,則為 true true, false
ssl_mode 類型:enum[verify-ca, verify-full, null]) Amazon Redshift 的連線安全性。verify-ca(必須使用 SSL,且必須驗證伺服器憑證。) 和 verify-full (必須使用 SSL。伺服器憑證必須經過驗證,且伺服器主機名稱必須符合憑證上的主機名稱屬性。) 受到支援。如需詳細資訊,請參閱 Amazon Redshift 文件中的設定連線的安全選項。預設為 verify-ca verify-ca, verify-full
timeout 類型:integer 對伺服器的連線在逾時前要經過的秒數。 0

Athena 連線參數

Athena 的連線支援下列 Python AWS Glue連線參數。

金錀 Type 說明 Constraints 必要
aws_access_key_id 類型:string - maxLength:256 指定與 IAM 帳戶相關聯的AWS存取金鑰。建議您將此資訊存放在 aws_secret 中。 長度:16-128
aws_secret_access_key 類型:string - maxLength:256 AWS存取金鑰的私密部分。建議您將此資訊存放在 aws_secret 中。
aws_secret_arn 類型:string 用來擷取連線之其他參數的機密 ARN。 有效 ARN
catalog_name 類型:string - maxLength:256 包含透過驅動程式存取的資料庫和資料表的目錄。如需有關目錄的資訊,請參閱 DataCatalog
duration_seconds 類型:number 角色工作階段的持續時間 (以秒為單位)。此設定的值可介於 1 小時至 12 小時。根據預設,持續時間設定為 3600 秒 (1 小時)。 範圍從 900 秒 (15 分鐘) 到角色的工作階段持續時間上限設定。
encryption_option 類型:enum[SSE_S3, SSE_KMS, CSE_KMS, null]) Amazon S3 的靜態加密 請參閱 Athena 指南中的靜態加密一節。 SSE_S3, SSE_KMS, CSE_KMS
kms_key 類型:string - maxLength:256 AWS KMS如果在 CSE_KMS中使用 金鑰encrytion_option
poll_interval 類型:number 在 Athena 中輪詢查詢結果狀態的間隔,以秒為單位。
profile_name 類型:string - maxLength:256 AWS組態設定檔的名稱,其登入資料應該用來驗證對 Athena 的請求。
region_name 類型:string 執行查詢AWS的區域。 有效AWS區域
result_reuse_enable 類型:boolean 啟用重複使用先前的查詢結果。 true, false
result_reuse_minutes 類型:integer 指定 Athena 應考慮重複使用的之前查詢結果的最長期限 (以分鐘為單位)。預設為 60。 >= 1
role_arn 類型:string 要用於執行查詢的角色。 有效 ARN
schema_name 類型:string - maxLength:256 要用於資料庫的預設結構描述名稱。
s3_staging_dir 類型:string - maxLength:1024 Amazon S3 中存放查詢結果的位置。 需要 s3_staging_dirwork_group
work_group 類型:string 將在其中執行查詢的工作群組。如需有關工作群組的資訊,請參閱工作群組 ^[a-zA-Z0-9._-]{1,128}$ 需要 s3_staging_dirwork_group

Snowflake 連線參數

Snowflake 的連線支援下列 Python AWS Glue連線參數。

Snowflake 連線參數

金錀 Type 說明 Constraints 必要
account 類型:string - maxLength:256 Snowflake 帳戶識別碼。帳戶識別碼不包含 snowflakecomputing.com 尾碼。
arrow_number_to_decimal 類型:boolean 預設為 False,這表示 NUMBER 資料欄值會以雙精度浮點數 (float64) 傳回。將此設定為 True,以在呼叫 fetch_pandas_all()fetch_pandas_batches() 方法時傳回 DECIMAL 資料欄值做為十進位數 (decimal.Decimal)。 true, false
autocommit 類型:boolean 預設為 false,這會遵守 Snowflake 參數 AUTOCOMMIT。設定為 truefalse,分別在工作階段中啟用或停用 autocommit 模式。 true, false
aws_secret_arn 類型:string 用來擷取連線之其他參數的機密 ARN。 有效 ARN
client_prefetch_threads 類型:integer 用來下載結果集的執行緒數量 (預設為 4)。增加值可改善擷取效能,但需要更多記憶體。
database 類型:string - maxLength:256 要使用的資料庫名稱。
login_timeout 類型:integer 登入請求的逾時,以秒為單位。預設為 60 秒。如果 HTTP 回應不是 success,則登入請求會在逾時長度之後放棄。
network_timeout 類型:integer 所有其他操作的逾時,以秒為單位。預設為 none (無限)。如果 HTTP 回應不是 success,一般請求會在逾時長度之後放棄。
paramstyle 類型:string - maxLength:256 從 Python 程式碼執行 SQL 查詢時,用於參數替換的預留位置語法。用戶端繫結預設為 pyformat。指定 qmarknumeric 以變更伺服器端繫結的繫結變數格式。
role 類型:string - maxLength:256 要使用的預設角色名稱。
schema 類型:string - maxLength:256 要用於資料庫的預設結構描述名稱。
timezone 類型:string - maxLength:128 預設為無,它會遵守 Snowflake 參數 TIMEZONE。設定為有效的時區 (例如 America/Los_Angeles) 以設定工作階段時區。 格式類似於 America/Los_Angeles 的時區
validate_default_parameters 類型:boolean 如果指定的資料庫、結構描述或倉儲不存在,請設定為 true 以引發例外狀況。預設為 false
warehouse 類型:string - maxLength:256 要使用的預設倉儲名稱。