通过 JDBC 连接使用外部分析应用程序分析 Amazon DataZone 订阅的数据 - Amazon DataZone

通过 JDBC 连接使用外部分析应用程序分析 Amazon DataZone 订阅的数据

Amazon DataZone 使数据使用者能够在单个项目中轻松查找和订阅来自多个来源的数据,并使用 Amazon Athena、Amazon Redshift 查询编辑器和 Amazon SageMaker 分析这些数据。

Amazon DataZone 还支持通过 Athena JDBC 驱动程序进行身份验证,该驱动程序使用户能够使用热门外部 SQL 和分析工具(如 SQL Workbench、DBeaver、Tableau、Domino、Power BI 等)查询他们订阅的 Amazon DataZone 数据。用户可以通过 SSO 或 IAM 使用其公司凭证进行身份验证,并开始在其 Amazon DataZone 项目中分析订阅的数据。

Amazon DataZone 对 Athena JDBC 驱动程序的支持具有以下好处:

  • 更多的查询和可视化工具选择 – 数据使用者可以使用支持 JDBC 连接的各种分析工具中的首选工具连接到 Amazon DataZone。这使他们能够继续使用自己熟悉的软件,而无需学习新的数据使用工具。

  • 编程访问 – 通过服务器或自定义应用程序与访问受管控的数据建立 JDBC 连接,使数据使用者能够执行自动化且更复杂的数据操作。

您可以使用 JDBC URL 将外部分析工具连接到在 Amazon DataZone 中订阅的数据。要获取 JDBC URL,请执行以下过程:

重要

在当前版本中,Amazon DataZone 支持使用 Amazon Athena JDBC 驱动程序进行身份验证。要完成此过程,请确保已为所选分析应用程序下载并安装了最新的 Athena JDBC 驱动程序

  1. 导航到 Amazon DataZone 数据门户 URL,并使用单点登录(SSO)或您的 AWS 凭证进行登录。如果您是 Amazon DataZone 管理员,则可以导航到 Amazon DataZone 控制台(网址为 https://console.aws.amazon.com/datazone),并使用在其中创建域的 AWS 账户进行登录,然后选择打开数据门户

  2. 在 Amazon DataZone 数据门户中,选择浏览项目列表,然后找到并选择要分析的数据所在的项目。

  3. 在项目主页的右侧面板中,选择使用 JDBC 进行连接

  4. JDBC 参数弹出窗口中,选择您的身份验证方法(SSO 凭证或 IAM 凭证),然后复制 JDBC URL 的字符串或独立参数。然后,您可以使用它连接到您的外部分析应用程序。

当您使用 JBDC 查询或参数将外部分析应用程序连接到 Amazon DataZone 时,您会调用 RedeemAccessToken API。RedeemAccessToken API 会将 Identity Center 访问令牌交换为用于调用 GetEnvironmentCredentials API 的 AmazonDataZoneDomainExecutionRole 凭证。

要详细了解使用 IAM 凭证连接到 Athena 中受 Amazon DataZone 监管的数据的身份验证机制,请参阅 DataZone IAM 凭证提供商。要详细了解使用 IAM Identity Center 连接到 Athena 中受 Amazon DataZone 监管的数据的身份验证机制,请参阅 DataZone Idc 凭证提供商

RedeemAccessToken API 参考

请求语法

POST /sso/redeem-token HTTP/1.1 Content-type: application/json { "domainId": "string", "accessToken": "string" }

请求参数

请求使用了以下参数。

DomainId

Amazon DataZone 域的 ID。

模式:^dzd[-_][a-zA-Z0-9_-]{1,36}$

必需:是

accessToken

Identity Center 访问令牌。

类型:字符串。

必需:是

响应语法

HTTP/1.1 200 Content-type: application/json { "credentials": AwsCredentials }

响应元素

凭证

用于调用 GetEnvironmentCredentials API 的 AmazonDataZoneDomainExecutionRole 凭证。

类型:AwsCredentials 对象数组。此数据类型包含以下属性:

  • accessKeyId:AccessKeyId

  • secretAccessKey:SecretAccessKey

  • sessionToken:SessionToken

  • expiration:Timestamp

accessToken

Identity Center 访问令牌。

类型:字符串。

必需:是

错误

AccessDeniedException

您没有足够的访问权限,无法执行该操作。

HTTP 状态代码:403

ResourceNotFoundException

找不到指定的资源。

HTTP 状态代码:404

ValidationException

输入未能满足 AWS 服务指定的约束。

HTTP 状态代码:400

InternalServerException

由于未知错误、异常或故障,请求失败。

HTTP 状态代码:500