

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 连接到数据
<a name="datasets.connecting-to-data"></a>

有关连接到以下数据来源的更多信息，请选择可供您参考的小节。
+ **AWS Glue Data Catalog**— 您可以使用数据目录来定义对存储在 AWS 云中的数据对象的引用，包括以下服务：
  + Amazon Redshift
  + Aurora MySQL
  + Aurora PostgreSQL
  + Amazon RDS for MySQL
  + Amazon RDS for PostgreSQL

  DataBrew 识别应用于数据目录资源的所有 Lake Formation 权限，因此 DataBrew 用户只有在获得授权后才能访问这些资源。

  要创建数据集，需要指定数据目录数据库名称和表名。 DataBrew 处理其他连接细节。
+ **AWS Data Exchange** — 您可以从 Data Exchange 中提供的数百种第三方 AWS 数据源中进行选择。通过订阅这些数据源，您始终可以获得最多的数据 up-to-date版本。

  要创建数据集，请指定您已订阅或有权使用的 Data Exchange 数据产品的名称。
+  **JDBC 驱动程序连接**-您可以通过连接到 JDBC 兼容的数据源 DataBrew 来创建数据集。 DataBrew 支持通过 JDBC 连接到以下来源：
  + Amazon Redshift
  + Microsoft SQL Server
  + MySQL
  + Oracle
  + PostgreSQL
  + Snowflake

**Topics**
+ [

# 将驱动程序与 AWS Glue DataBrew
](dbms-driver-connections.md)
+ [

# 支持的 JDBC 驱动程序
](jdbc-drivers.md)

# 将驱动程序与 AWS Glue DataBrew
<a name="dbms-driver-connections"></a>

*数据库驱动程序*是实施数据库连接协议 [例如，Java 数据库连接（JDBC）] 的文件或 URL。该驱动程序充当特定数据库管理系统（DBMS）和另一个系统之间的适配器或转换器。

在这种情况下，它允许 AWS Glue DataBrew 连接到您的数据。然后，您可以从支持的数据来源访问数据库对象，例如表或视图。您正在使用的数据来源可能称为数据库、数据仓库或具有其他名称。但在本文档中，我们将所有数据提供者均称为数据来源或连接。<a name="jdbc"></a><a name="download-jars"></a>

要使用 JDBC 驱动程序或 jar 文件，请下载所需的一个或多个文件并将其放入 S3 存储桶中。用于访问数据的 IAM 角色需要对两个驱动程序文件都具有读取权限。

**注意**  
With AWS Glue 4.0，本机支持作为数据来源连接到 Snowflake。您无需提供自定义 `jar` 文件。在中 AWS Glue DataBrew，选择 Snowflake 作为外部源连接，并提供您的 Snowflake 实例的 URL。URL 将使用表单 `https://account_identifier.snowflakecomputing.com` 中的主机名。  
 请提供数据访问凭证、Snowflake 数据库名称和 Snowflake 架构名称。此外，如果您的 Snowflake 用户没有设置默认仓库，则需要提供仓库名称。  
 Snowflake 连接使用 AWS Secrets Manager 密钥来提供凭据信息。您的项目和作业角色必须具有读取此密钥的权限。  

![\[屏幕截图显示的是连接访问向导，其中选择 Snowflake 作为“外部来源”。请填写其他字段以完成连接：“JDBC URL”和“数据库访问凭证”。\]](http://docs.aws.amazon.com/zh_cn/databrew/latest/dg/images/databrew-connection-access-snowflake-new.png)


**要将驱动程序与 DataBrew**

1. 使用产品提供的方法，查明您使用的是哪个版本的数据来源。

1. 查找需要的最新版本的连接器和驱动程序。可以在数据提供者网站上找到此信息。

1. 下载所需版本的 JDBC 文件。这些文件通常存储为 Java ARchives (.JAR) 文件。

1. 将驱动程序从控制台上传到 S3 存储桶，或提供 .JAR 文件的 S3 路径。

1. 输入基本连接详细信息，例如类别、实例等。

1. 输入数据来源需要的任何其他配置信息，例如虚拟私有云（VPC）信息。

# 支持的 JDBC 驱动程序
<a name="jdbc-drivers"></a>


| 产品 | 支持的 版本 | 驱动程序说明和下载 | 支持的 SQL 查询 | 
| --- | --- | --- | --- | 
|   Microsoft SQL Server  |  v6.x 或更高版本  |  [适用于 SQL Server 的 Microsoft JDBC 驱动程序](https://docs.microsoft.com/sql/connect/jdbc/download-microsoft-jdbc-driver-for-sql-server)  | 不支持 | 
|   MySQL  |  v5.1 或更高版本  |  [MySQL 连接器](https://www.mysql.com/products/connector/)  | 不支持 | 
|   Oracle  |  v11.2 或更高版本  |  [Oracle JDBC 下载](https://www.oracle.com/database/technologies/appdev/jdbc-downloads.html)  | 不支持 | 
|   PostgreSQL  |  v4.2.x 或更高版本  |  [PostgreSQL JDBC 驱动程序](https://jdbc.postgresql.org/download.html)  | 不支持 | 
|   Amazon Redshift  |  v4.1 或更高版本  |  [使用 JDBC 连接到 Amazon Redshift](https://docs.aws.amazon.com/redshift/latest/mgmt/configuring-connections.html#connecting-drivers)  | 支持 | 
|   Snowflake  |  要查看您的 Snowflake 版本，请按照 Snowflake 文档中的说明使用 [CURRENT\$1VERSION](https://docs.snowflake.com/en/sql-reference/functions/current_version.html)。  |  要连接到 Snowflake，您需要同时具备以下两项： [\[See the AWS documentation website for more details\]](http://docs.aws.amazon.com/zh_cn/databrew/latest/dg/jdbc-drivers.html)  | 支持 | 

要连接到需要不同于 DataBrew 原生支持的驱动程序版本的数据库或数据仓库，您可以提供自己选择的 JDBC 驱动程序。该驱动程序必须与 JDK 8 或 Java 8 兼容。有关如何查找数据库的最新驱动程序版本的说明，请参阅[将驱动程序与 AWS Glue DataBrew](dbms-driver-connections.md)。