

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 將您的資料帶入 AWS Glue Data Catalog
<a name="bring-your-data-overview"></a>

您可以在 AWS Glue Data Catalog （資料目錄） 中建立聯合目錄，並在 Amazon S3 資料湖和 Amazon Redshift 資料倉儲中統一資料。您也可以整合營運資料庫中的資料，例如 PostgreSQL Amazon DynamoDB、Google BigQuery、MySQL 等第三方資料來源。Data Catalog 提供集中式中繼資料儲存庫，可讓您更輕鬆地管理和探索不同系統中的資料。

Data Catalog 透過聯合連接器與超過 30 個外部資料來源整合。透過此整合，您可以從這些外部來源查詢資料，而不必建置資料管道來 AWS 先將資料擷取至 。

為外部資料編製目錄之後，您可以使用 AWS Lake Formation 來集中管理 Data Catalog 中的資料存取許可。資料湖管理員可以使用標籤型存取控制 (LF 標籤） 和具名資源方法，將精細的存取許可授予相同帳戶或跨帳戶的其他 IAM 主體 （使用者或角色）。

透過使用 LF-Tags 資料管理員可以根據網域和敏感度層級等屬性邏輯組織資源，簡化許可管理，同時確保跨分析和機器學習服務的一致存取控制，包括 Athena、Amazon EMR AWS Glue 或 Redshift Spectrum。

Data Catalog 提供下列方法來管理外部資料集和外部中繼存放區的資料和許可：
+ **將 Amazon S3 Table 儲存貯體與 Data Catalog 整合** – 您可以將 Amazon S3 Tables 發佈和分類為 Data Catalog 物件，並從 Lake Formation 主控台或使用 AWS Glue API 操作將目錄註冊為 Lake Formation 資料位置。
+ 將 **Amazon Redshift 資料倉儲中的資料帶入 AWS Glue Data Catalog**：向 Data Catalog 註冊現有的 [Amazon Redshift](https://docs.aws.amazon.com/redshift/index.html) 命名空間或叢集，並在 Data Catalog 中建立多層聯合目錄。

  您可以使用任何與 Apache Iceberg REST 目錄 OpenAPI 規格相容的查詢引擎來存取資料，例如 Amazon EMR Serverless 和 Amazon Athena。
+ **將遠端Iceberg REST目錄與 Data Catalog** 聯合 – 將遠端Iceberg REST目錄與 Data Catalog 聯合，並使用 AWS 分析引擎安全地存取存放在 Amazon S3 中的遠端Iceberg資料表。
+ **從外部資料來源聯合到 Data Catalog** – 使用連線將 Data Catalog 連接到外部資料來源 AWS Glue ，並使用 Lake Formation 建立聯合目錄以集中管理資料集的存取許可。不需要將中繼資料遷移至 Data Catalog。
+ **建立目錄以管理 Data Catalog 中的 Amazon Redshift 資料表** – 您目前可能沒有可用的 Amazon Redshift 生產者叢集或 Amazon Redshift 資料共用，但想要使用 Data Catalog 建立和管理 Amazon Redshift 資料表。您可以使用 `glue:CreateCatalog` API 操作建立 AWS Glue 受管目錄，或使用 AWS Lake Formation 主控台將目錄類型設定為 `Managed`和 `Catalog source` **Redshift 來開始。**
+ **使用 Data Catalog 發佈 Amazon Redshift 資料共用** – 將 [Amazon Redshift](https://docs.aws.amazon.com/redshift/index.html) 資料共用發佈至 Data Catalog，並使用 Lake Formation 集中管理資料共用的資料存取並限制使用者存取。

  您可以使用 Amazon Redshift Spectrum 查詢資料。
+  **將 Data Catalog 連接到外部 Hive 中繼存放**區 – 將 Data Catalog 連接到外部中繼存放區，以使用 Lake Formation 管理 Amazon S3 中資料集的存取許可。不需要將中繼資料遷移至 Data Catalog。
+ **將 Lake Formation 與 AWS 資料交換整合** – Lake Formation 支援透過 授權存取您的資料 AWS Data Exchange。如果您想要授權 Lake Formation 資料，請參閱*AWS Data Exchange 《 使用者指南*》中的[什麼是 AWS Data Exchange](https://docs.aws.amazon.com/data-exchange/latest/userguide/what-is.html) 。

**Topics**
+ [目錄聯合到遠端 Iceberg 目錄](catalog-federation.md)
+ [將 Amazon Redshift 資料帶入 AWS Glue Data Catalog](managing-namespaces-datacatalog.md)
+ [在 中聯合到外部資料來源 AWS Glue Data Catalog](federated-catalog-data-connection.md)
+ [Amazon S3 Tables 與 AWS Glue Data Catalog 和 整合 AWS Lake Formation](create-s3-tables-catalog.md)
+ [變更 S3 Tables 整合的存取控制](manage-s3tables-catalog-integration.md)
+ [在 中建立 Amazon Redshift 受管目錄 AWS Glue Data Catalog](create-rms-catalog.md)
+ [管理 Amazon Redshift 資料共用中資料的許可](data-sharing-redshift.md)
+ [管理使用外部中繼存放區的資料集許可](data-sharing-hms.md)