本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
存取資料表資料
有多種方式可存取 Amazon S3 資料表儲存貯體中的資料表。您可以使用 將資料表與 AWS 分析服務整合 AWS Glue Data Catalog,或使用 Amazon S3 Tables Iceberg REST 端點或 Amazon S3 Tables Catalog for 直接存取資料表Apache Iceberg。您使用的存取方法將取決於您的目錄設定、治理模型和存取控制需求。以下是這些存取方法的概觀。
- AWS Glue Data Catalog 整合
這是在 S3 資料表儲存貯體中使用資料表的建議存取方法。此整合可讓您透過 跨多個 AWS 分析服務統一檢視資料資產 AWS Glue Data Catalog。整合之後,您可以使用 Athena 和 Amazon Redshift 等服務查詢資料表。對資料表的存取是使用 IAM 許可進行管理。若要使用此整合存取資料表,您使用的 IAM 身分需要存取 S3 Tables 資源和動作、 AWS Glue Data Catalog 物件,以及您正在使用的查詢引擎。如需詳細資訊,請參閱S3 Tables 的存取管理。
- 直接存取
如果您需要使用 AWS Partner Network (APN) 目錄實作、自訂目錄實作,或只需要對單一資料表儲存貯體中的資料表執行基本讀取/寫入操作,請使用此方法。對資料表的存取是使用 IAM 許可進行管理。若要存取資料表,您使用的 IAM 身分需要存取資料表資源和 S3 資料表動作。如需詳細資訊,請參閱S3 Tables 的存取管理。
透過 AWS Glue Data Catalog 整合存取資料表
您可以將 S3 資料表儲存貯體與 整合 AWS Glue Data Catalog ,以從 AWS 分析服務存取資料表,例如 Amazon Athena、Amazon Redshift 和 Quick。整合會將 AWS Glue Data Catalog 資料表資源填入 ,並聯合對這些資源的存取。若需有關整合的詳細資訊,請參閱 將 Amazon S3 Tables 與 AWS 分析服務整合。
下列 AWS 分析服務可以透過此整合存取資料表:
使用 AWS GlueIceberg REST 端點存取資料表
一旦 S3 資料表儲存貯體與 整合 AWS Glue Data Catalog,您也可以使用端點 AWS Glue Iceberg REST從支援 的第三方查詢引擎連線至 S3 資料表Iceberg。如需詳細資訊,請參閱使用 AWS GlueIceberg REST 端點存取 Amazon S3 Tables。
當您想要從 Spark、PyIceberg 或其他與 Iceberg 相容的用戶端存取資料表時,建議使用 AWS GlueIceberg REST 端點。
下列用戶端可以透過 AWS GlueIceberg REST 端點直接存取資料表:
任何 Iceberg 用戶端,包括 Spark、PyIceberg 等。
直接存取資料表
您可以透過將 S3 Tables 管理作業橋接至 Apache Iceberg 分析應用程式的方法,直接從開放原始碼查詢引擎存取資料表。有兩種直接存取方法:Amazon S3 Tables Iceberg REST 端點。或 Amazon S3 Tables Catalog for Apache Iceberg。建議使用 REST 端點。
如果您存取自我管理目錄實作中的資料表,或只需對單一資料表儲存貯體中的資料表執行基本讀取/寫入操作,建議您直接存取。對於其他存取案例,我們建議 AWS Glue Data Catalog 整合。
資料表的直接存取,是透過連接到資料表和資料表儲存貯體的 IAM 身分型政策或資源型政策來管理。
透過 Amazon S3 Tables Iceberg REST 端點存取資料表
您可以使用 Amazon S3 Tables Iceberg REST 端點,透過 HTTP 端點直接從任何與 Iceberg REST 相容的用戶端存取資料表。如需詳細資訊,請參閱 使用 Amazon S3 Tables Iceberg REST 端點存取資料表。
下列 AWS 分析服務和查詢引擎可以使用 Amazon S3 Tables Iceberg REST 端點直接存取資料表:
支援的查詢引擎
任何 Iceberg 用戶端,包括 Spark、PyIceberg 等。
透過 Amazon S3 Tables Catalog for Apache Iceberg 直接存取資料表
您也可以透過使用 S3 Tables 用戶端目錄,直接從查詢引擎 (例如 Apache Spark) 存取資料表。如需詳細資訊,請參閱 使用 Amazon S3 Tables Catalog for Apache Iceberg 存取 Amazon S3 Tables。不過,S3 建議使用 Amazon S3 Tables Iceberg REST 端點進行直接存取,因為該端點支援更多應用程式,而不需要特定的語言或引擎程式碼。
下列查詢引擎可以使用用戶端目錄直接存取資料表: