

本文為英文版的機器翻譯版本，如內容有任何歧義或不一致之處，概以英文版為準。

# 使用 Athena 主控台以連線到資料來源
<a name="connect-to-a-data-source-console-steps"></a>

您可以使用 Athena 主控台來建立和設定資料來源連線。

**建立與資料來源的連線**

1. 前往 [https://console.aws.amazon.com/athena/](https://console.aws.amazon.com/athena/home) 開啟 Athena 主控台。

1. 如果未顯示主控台的導覽窗格，請選擇左側的展開選單。  
![選擇展開選單。](http://docs.aws.amazon.com/zh_tw/athena/latest/ug/images/nav-pane-expansion.png)

1. 在導覽窗格中，選擇**資料來源和目錄**。

1. 在**資料來源和目錄**頁面上，選擇**建立資料來源**。

1. 針對 **Choose a data source** (選擇資料來源)，請參考下列指導方針，選擇您希望 Athena 查詢的資料來源：
   + 選擇與您的資料來源對應的連線選項。使用 Athena 預先建置的資料來源連接器可以設定包括 MySQL、Amazon DocumentDB 和 PostgreSQL 在內的來源。
   + 如果想要查詢 Simple Storage Service (Amazon S3) 中的資料，而且沒有使用 Apache Hive 中繼存放區或此頁面上的其他任何一個聯合查詢資料來源選項，請選擇 **S3 - AWS Glue Data Catalog**。Athena 使用 AWS Glue Data Catalog 以將資料來源的中繼資料和結構描述資訊存放在 Simple Storage Service (Amazon S3) 中。這是預設的 (非聯合) 選項。如需詳細資訊，請參閱[使用 AWS Glue Data Catalog 連線到您的資料](data-sources-glue.md)。如需使用此工作流程的步驟，請參閱 [在 Athena 中註冊和使用資料目錄](gdc-register.md)。
   + 選擇 **S3 - Apache Hive metastore** (S3 - Apache Hive 中繼存放區) 可查詢使用 Apache Hive 中繼存放區的 Simple Storage Service (Amazon S3) 資料集。如需有關此選項的詳細資訊，請參閱 [將 Athena 連接至 Apache Hive 中繼存放區](connect-to-data-source-hive-connecting-athena-to-an-apache-hive-metastore.md)。
   + 如果想要建立用於 Athena 的資料來源連接器，請選擇 **Custom or shared connector** (自訂或共用連接器)。如需寫入資料來源連接器的相關資訊，請參閱[使用 Athena Query Federation SDK 開發資料來源連接器](connect-data-source-federation-sdk.md)。

1. 選擇**下一步**。

1. 在**輸入資料來源詳細資訊**頁面上，針對**資料來源名稱**，使用自動產生的名稱，或在從 Athena 查詢資料來源時，輸入要在 SQL 陳述式中使用的唯一名稱。名稱最多可包含 127 個字元，且在您的帳戶中必須是唯一的。建立後便無法變更。有效字元包括 a-z、A-Z、0-9、\_ (底線)、@ (at 符號) 和 - (連字號)。Athena 已保留名稱 `awsdatacatalog`、`hive`、`jmx` 和 `system`，這些名稱不能用於資料來源名稱。

1. 如果您選擇的資料來源使用 AWS Glue 連線。

   1. 對於 **AWS Glue 連線詳細資訊**，請輸入所需的資訊。連線包含連接到特定資料來源所需的屬性。所需的屬性會因連線類型而異。如需有關連接器相關屬性的詳細資訊，請參閱 [可用資料來源連接器](connectors-available.md)。如需有關其他連線屬性的詳細資訊，請參閱《AWS Glue 使用者指南**》中的 [AWS Glue 連線屬性](https://docs.aws.amazon.com/glue/latest/dg/connection-properties.html)。
**警告**  
不允許在 Glue Connection 中更新下列屬性。您必須建立新的連線。  
VPC 組態 – `security_group_ids`、 `subnet_ids`

   1.  如需 **Glue Data Catalog IAM 角色**，請參閱 [AWS Glue Data Catalog 沒有 Lambda 許可的聯合連接器](connect-to-a-data-source-permissions.md#connect-to-a-data-source-permissions-managed)。
**注意**  
針對 **Lambda 執行 IAM 角色**，請選擇下列其中一個選項：  
**建立和使用新的執行角色** – （預設） Athena 會建立執行角色，然後用來 AWS Lambda 代表您存取 中的資源。Athena 需要此角色來建立您的聯合資料來源。
**使用現有的執行角色** – 使用此選項可選擇現有的執行角色。針對此選項，從**執行角色**下拉式清單中選擇您要使用的執行角色。

1. 如果您選擇的資料來源不使用 AWS Glue 連線。

   1. 針對 **Lambda function** (Lambda 函數)，選擇 **Create Lambda function** (建立 Lambda 函數)。您所選連接器的函數頁面會在 AWS Lambda 主控台中開啟。此頁面包含連接器的詳細資訊。

   1. 在 **Application settings** (應用程式設定) 下，仔細閱讀每個應用程式設定的說明，然後輸入符合您需求的數值。

      您看到的應用程式設定會根據資料來源的連接器而有所不同。所需最低設定包括：
      + **AthenaCatalogName** – 小寫的 Lambda 函數名稱，表示其目標資料來源，例如 `cloudwatchlogs`。
      + **SpillBucket** – 您帳戶中的 Simple Storage Service (Amazon S3) 儲存貯體，存放超過 Lambda 函數回應大小限制的資料。
**注意**  
溢出的資料不會在後續執行中重複使用，並且可安全刪除。Athena 不會替您刪除此資料。若要管理這些物件，請考慮新增一個會刪除您 Simple Storage Service (Amazon S3) 溢出儲存貯體中的舊資料的物件生命週期政策。如需詳細資訊，請參閱《Amazon S3 使用者指南》中的[管理儲存生命週期](https://docs.aws.amazon.com/AmazonS3/latest/userguide/object-lifecycle-mgmt.html)。

   1. 選擇 **I acknowledge that this app creates custom IAM roles and resource policies** (我認可此應用程式建立自訂的 IAM 角色和資源政策)。如需詳細資訊，請選擇 **Info (資訊)** 連結。

   1. 選擇**部署**。部署完成後，Lambda 函數會出現在 Lambda 主控台的 **Resources** (資源) 區段中。

      將資料來源連接器部署到您的帳戶之後，即可使 Athena 與其連接。

   1. 返回 Athena 主控台的 **Enter data source details** (輸入資料來源) 頁面。

   1. 在 **Connection details** (連線詳細資訊) 區段中，選擇 **Select or enter a Lambda function** (選取或輸入 Lambda 函數) 搜尋方塊旁的重新整理圖示。

   1. 選擇您剛才在 Lambda 主控台中建立的函數名稱。隨即顯示 Lambda 函數的 ARN。

1. (選用) 在 **Tags** (標籤) 中，新增要與此資料來源相關聯的鍵值對。如需標籤的詳細資訊，請參閱[標記 Athena 資源](tags.md)。

1. 選擇**下一步**。

1. 在**檢閱和建立**頁面上，檢閱資料來源詳細資訊。若要進行變更，請選擇**編輯**。

1. 閱讀 **Athena 將在您的帳戶中建立資源**中的資訊。若您同意，請選取**我確認 Athena 會代表我建立資源**。

1. 選擇 **Create data source (建立資料來源)**。**Athena ** 會在您的帳戶中建立下列資源。
   + 適用於**AWS Glue Data Catalog 沒有 Lambda 的聯合連接器**
**注意**  
如果您的資料來源位於 VPC 中，Athena 也會在您的帳戶中建立彈性網路界面 (ENI) 以連線至 VPC。
     + AWS Glue 連線
     + AWS Glue 目錄
   + 適用於**AWS Glue Data Catalog 搭配 Lambda 的聯合連接器**
     + AWS Glue 連線
     + Lambda 執行 IAM 角色
     + Lambda 函式
   + 對於 **Athena 資料目錄聯合連接器**
     + Lambda 執行 IAM 角色
     + Lambda 函式

該頁面的 **Data source details** (資料來源詳細資訊) 區段顯示了有關新連接器的資訊。您現在可以在 Athena 查詢中使用此連接器。

如需有關在查詢中使用資料連接器的資訊，請參閱 [執行聯合查詢](running-federated-queries.md)。