Creación y ejecución de un origen de datos de Amazon DataZone para Amazon Redshift
En Amazon DataZone, puede crear un origen de datos de Amazon Redshift para importar metadatos técnicos de tablas y vistas de bases de datos del almacenamiento de datos de Amazon Redshift. Para añadir un origen de datos de Amazon DataZone para Amazon Redshift, el almacenamiento de datos de origen debe existir ya en Amazon Redshift.
Cuando crea y ejecuta un origen de datos de Amazon Redshift, está agregando activos del almacenamiento de datos Amazon Redshift de origen al inventario del proyecto de Amazon DataZone. Puede ejecutar sus orígenes de datos de Amazon Redshift según un cronograma establecido o bajo demanda para crear o actualizar los metadatos técnicos de sus activos. Durante la ejecución del origen de datos, puede optar por publicar sus activos en el inventario de proyectos de Amazon DataZone y, de este modo, hacer que todos los usuarios del dominio puedan descubrirlos. También puede publicar los activos del inventario después de editar sus metadatos empresariales. Los usuarios del dominio pueden buscar y descubrir sus activos publicados y solicitar suscripciones a estos activos.
Agregación de un origen de datos de Amazon Redshift:
-
Acceda a la URL del portal de datos de Amazon DataZone e inicie sesión con las credenciales de inicio de sesión único (SSO) o con las de AWS. Si es administrador de Amazon DataZone, puede ir a la consola de Amazon DataZone en https://console.aws.amazon.com/datazone
e iniciar sesión con la Cuenta de AWS en la que se creó el dominio y, a continuación, elegir Abrir el portal de datos. -
Elija Seleccionar proyecto en el panel de navegación superior y seleccione el proyecto al que desea añadir el origen de datos.
-
Vaya a la pestaña Datos del proyecto.
-
En el panel de navegación izquierdo, elija Origen de datos y, a continuación, elija Crear origen de datos.
-
Configure los siguientes campos:
-
Nombre: el nombre del origen de datos.
-
Descripción: descripción del origen de datos.
-
-
En Tipo de origen de datos, elija Amazon Redshift.
-
En Seleccione un entorno, especifique un entorno en el que publicar las tablas de Amazon Redshift.
-
Según el entorno que seleccione, Amazon DataZone aplicará automáticamente las credenciales de Amazon Redshift y otros parámetros directamente del entorno o le dará la opción de elegir los suyos propios.
-
Si ha seleccionado un entorno que solo permite publicar desde el esquema de Amazon Redshift predeterminado del entorno, Amazon DataZone aplicará automáticamente las credenciales de Amazon Redshift y otros parámetros, como el nombre del clúster o el grupo de trabajo de Amazon Redshift, el secreto de AWS, el nombre de la base de datos o el nombre del esquema. No puede editar estos parámetros que se rellenan automáticamente.
-
Si selecciona un entorno que no permite publicar ningún dato, no podrá continuar con la creación del origen de datos.
-
Si selecciona un entorno que permita publicar datos desde cualquier esquema, verá la opción de usar las credenciales y otros parámetros de Amazon Redshift del entorno, o la de introducir sus propias credenciales/parámetros.
-
-
Si decide usar sus propias credenciales para crear el origen de datos, proporcione los siguientes detalles:
-
En Proporcionar credenciales de Amazon Redshift, elija si desea utilizar un clúster de Amazon Redshift aprovisionado o un espacio de trabajo Amazon Redshift sin servidor como el origen de datos.
-
Según lo que haya seleccionado en el paso anterior, elija su clúster o espacio de trabajo de Amazon Redshift en el menú desplegable y, a continuación, elija el secreto en AWS Secrets Manager que desee usar para la autenticación. Puede elegir un secreto que ya exista o crear uno nuevo.
-
Para que el secreto existente aparezca en el menú desplegable, asegúrese de que su secreto en AWS Secrets Manager incluya las siguientes etiquetas (clave/valor):
-
AmazonDataZoneProject: <projectID>
-
AmazonDataZoneDomain: <domainID>
Si decide crear un secreto nuevo, el secreto se etiqueta automáticamente con las etiquetas a las que se ha hecho referencia anteriormente y no es necesario realizar ningún paso adicional. Para obtener más información, consulte Almacenamiento de credenciales de base de datos en AWS Secrets Manager.
Los usuarios de Amazon Redshift que utilicen el secreto de AWS proporcionado para crear el origen de datos deben tener permisos de
SELECTen las tablas que se van a publicar. Si desea que Amazon DataZone también administre las suscripciones (acceso) en su nombre, los usuarios de la base de datos que figuran en el secreto de AWS también deben tener los siguientes permisos:-
CREATE DATASHARE -
ALTER DATASHARE -
DROP DATASHARE
-
-
-
En Selección de datos, proporcione una base de datos y un esquema de Amazon Redshift, e introduzca el criterio de selección de la tabla o vista. Por ejemplo, si selecciona Incluir e introduce
*corporate, el activo incluirá todas las tablas de origen que terminen con la palabracorporate.Puede añadir varias reglas de inclusión para las tablas dentro de una sola base de datos. También puede agregar varias bases de datos mediante el botón Agregar otra base de datos.
-
Elija Siguiente.
-
En la Configuración de publicación, elija si los activos se pueden detectar inmediatamente en el catálogo de datos. Si solo los agrega al inventario, puede elegir las condiciones de suscripción más adelante y publicarlos en el catálogo de datos empresariales.
-
Para la Generación automatizada de nombres comerciales, elija si desea generar automáticamente los metadatos de los activos a medida que se publican y actualizan desde el origen.
-
(Opcional) Para los Formularios de metadatos, añada formularios para definir los metadatos que se recopilan y guardan cuando los activos se importan en Amazon DataZone. Para obtener más información, consulte Creación de un formulario de metadatos en Amazon DataZone.
-
En Preferencia de ejecución, elija cuándo ejecutar el origen de datos.
-
Ejecutar según una programación: especifique las fechas y la hora para ejecutar el origen de datos.
-
Ejecutar bajo demanda: puede iniciar manualmente la ejecución del origen de datos.
-
-
Elija Siguiente.
-
Revise su configuración del origen de datos y seleccione Crear.
nota
Cuando se crea un origen de datos de Amazon Redshift, Amazon DataZone concede acceso de solo lectura al entorno utilizado para crear el origen de datos para acceder a todas las tablas de los esquemas de Amazon Redshift utilizados en el origen de datos. Puede supervisar el estado de estas concesiones en los orígenes de datos en la página de detalles de su entorno.
Si utiliza un clúster de Amazon Redshift o un grupo de trabajo sin servidor diferente al que se utilizó para crear el entorno, debe asegurarse de agregar la siguiente etiqueta AWS al clúster o grupo de trabajo. Esto es necesario para que los usuarios del entorno puedan ver la base de datos concedida en el editor de consultas V2 de Amazon Redshift: DataZoneDiscoverable_${domainId}: true
En el caso de los entornos creados antes de la versión actual de Amazon DataZone, los miembros del proyecto no podrán ver las tablas concedidas en Amazon Redshift.