Análisis de los datos suscritos de Amazon DataZone con aplicaciones de análisis externas mediante conexión JDBC - Amazon DataZone

Análisis de los datos suscritos de Amazon DataZone con aplicaciones de análisis externas mediante conexión JDBC

Amazon DataZone permite que los consumidores de datos localicen datos de varios orígenes y se suscriban a ellos fácilmente dentro de un mismo proyecto, así como que analicen estos datos con Amazon Athena, Editor de consultas de Amazon Redshift y Amazon SageMaker.

Amazon DataZone también admite la autenticación mediante el controlador JDBC de Athena, que permite a los usuarios consultar los datos de Amazon DataZone suscritos mediante herramientas de análisis y SQL externas populares, como SQL Workbench, DBeaver, Tableau, Domino, Power BI y muchas otras. Los usuarios pueden autenticarse con sus credenciales corporativas a través de SSO o IAM y empezar a analizar los datos suscritos en sus proyectos de Amazon DataZone.

La compatibilidad de Amazon DataZone con el controlador JDBC de Athena ofrece las siguientes ventajas:

  • Mayor variedad de herramientas para consulta y visualización: los consumidores de datos pueden conectarse a Amazon DataZone utilizando las herramientas que prefieran de una amplia gama de soluciones de análisis que admiten conexiones a JDBC. Esto les permite seguir utilizando el software con el que ya están familiarizados sin necesidad de aprender a utilizar nuevas herramientas para el consumo de datos.

  • Acceso mediante programación: una conexión JDBC para acceder a datos gobernados mediante servidores o aplicaciones personalizadas permite a los consumidores de datos realizar operaciones automatizadas y más complejas.

Puede usar su URL de JDBC para conectar sus herramientas de análisis externas a los datos suscritos de Amazon DataZone. Para obtener su URL de JDBC, siga el procedimiento que se indica a continuación:

importante

En la versión actual, Amazon DataZone admite la autenticación con el controlador JDBC de Amazon Athena. Para completar este procedimiento, confirme haber descargado e instalado la versión más reciente del controlador JDBC de Athena para la aplicación de análisis que elija.

  1. Acceda a la URL del portal de datos de Amazon DataZone e inicie sesión con las credenciales de inicio de sesión único (SSO) o con las de AWS. Si es administrador de Amazon DataZone, puede ir a la consola de Amazon DataZone en https://console.aws.amazon.com/datazone e iniciar sesión con la Cuenta de AWS en la que se creó el dominio y, a continuación, elegir Abrir el portal de datos.

  2. En el portal de datos de Amazon DataZone, elija Examinar lista de proyectos y, a continuación, busque y elija el proyecto en el que tiene los datos que desea analizar.

  3. En el panel derecho de la página de inicio del proyecto, seleccione Conectar con JDBC.

  4. En la ventana emergente Parámetros de JDBC, elija su método de autenticación (credenciales de SSO o credenciales de IAM) y, a continuación, copie la cadena o los parámetros individuales de la URL de JDBC. Ya puede utilizarla para conectarse a la aplicación de análisis externa.

Cuando conecta le aplicación de análisis externa a Amazon DataZone mediante la consulta o los parámetros de JBDC, invocará la API RedeemAccessToken. La API RedeemAccessToken intercambia un token de acceso a Identity Center por las credenciales AmazonDataZoneDomainExecutionRole, que se utilizan para llamar a la API GetEnvironmentCredentials.

Para obtener más información sobre el mecanismo de autenticación que utiliza credenciales IAM para conectarse a datos gobernados por Amazon DataZone en Athena, consulte Proveedor de credenciales de IAM para DataZone. Para obtener más información sobre el mecanismo de autenticación que permite conectarse a datos gobernados por Amazon DataZone en Athena usando IAM Identity Center, consulte Proveedor de credenciales de Idc para DataZone.

Referencia de la API RedeemAccessToken

Sintaxis de la solicitud

POST /sso/redeem-token HTTP/1.1 Content-type: application/json { "domainId": "string", "accessToken": "string" }

Parámetros de solicitud

La solicitud utiliza los siguientes parámetros.

DomainId

El ID del dominio de Amazon DataZone.

Patrón: ^dzd[-_][a-zA-Z0-9_-]{1,36}$

Obligatorio: sí

accessToken

El token de acceso a Identity Center.

Tipo: cadena

Obligatorio: sí

Sintaxis de la respuesta

HTTP/1.1 200 Content-type: application/json { "credentials": AwsCredentials }

Elementos de respuesta

credentials

Las credenciales AmazonDataZoneDomainExecutionRole que se utilizan para llamar a la API GetEnvironmentCredentials.

Tipo: matriz de objetos AwsCredentials. Este tipo de datos incluye las propiedades siguientes:

  • accessKeyId: AccessKeyId

  • secretAccessKey: SecretAccessKey

  • sessionToken: SessionToken

  • expiration: Timestamp

accessToken

El token de acceso a Identity Center.

Tipo: cadena

Obligatorio: sí

Errores

AccessDeniedException

No tiene acceso suficiente para realizar esta acción.

Código de estado HTTP: 403

ResourceNotFoundException

No se ha encontrado el recurso especificado.

Código de estado HTTP: 404

ValidationException

La entrada no satisface las limitaciones que especifica el servicio de AWS.

Código de estado HTTP: 400

InternalServerException

La solicitud ha devuelto un error debido a un error o una excepción desconocidos.

Código de estado HTTP: 500