Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Planos DataZone integrados de Amazon
Un plano con el que se crea un entorno define qué herramientas y servicios pueden utilizar los miembros del proyecto al que pertenece el entorno cuando trabajan con los activos del DataZone catálogo de Amazon. En la versión actual de Amazon DataZone, hay los siguientes planos integrados:
-
Esquema de lago de datos
-
Esquema de almacenamiento de datos
-
SageMaker Plano de Amazon
Puede seguir los pasos de los siguientes procedimientos para habilitar los blueprints predeterminados en Amazon DataZone:
Habilita los blueprints integrados en la AWS cuenta propietaria del dominio de Amazon DataZone
Un plano con el que se crea un entorno define qué herramientas y servicios pueden utilizar los miembros del proyecto al que pertenece el entorno cuando trabajan con los activos del DataZone catálogo de Amazon.
En la versión actual de Amazon DataZone, hay varios planos integrados: el plano del lago de datos, el plano del almacén de datos y el plano de Amazon. SageMaker
-
El plano del lago de datos contiene la definición para lanzar y configurar un conjunto de servicios (AWS Glue, AWS Lake Formation, Amazon Athena) para publicar y utilizar los activos del lago de datos en el catálogo de Amazon DataZone .
-
El plano de almacén de datos contiene la definición para lanzar y configurar un conjunto de servicios (Amazon Redshift) para publicar y utilizar los activos de Amazon Redshift en el catálogo de Amazon. DataZone
-
El SageMaker blueprint de Amazon contiene la definición para lanzar y configurar un conjunto de servicios (Amazon SageMaker Studio) para publicar y utilizar SageMaker los activos de Amazon en el DataZone catálogo de Amazon.
Para obtener más información, consulte DataZone Terminología y conceptos de Amazon.
Al crear un DataZone dominio de Amazon, tiene la opción de elegir la configuración rápida, que habilita automáticamente el lago de datos predeterminado y los planos integrados del almacén de datos predeterminado como parte del proceso de creación del dominio. La Configuración Rápida también crea perfiles de entorno predeterminados y entornos predeterminados para usted mediante estos esquemas integrados.
Si no eliges la configuración rápida como parte de la creación de tu DataZone dominio de Amazon, puedes usar el siguiente procedimiento para habilitar los blueprints integrados disponibles en la AWS cuenta que aloja este DataZone dominio de Amazon. Debe habilitar estos esquemas integrados antes de poder usarlos para crear perfiles de entorno y entornos en este dominio.
Para habilitar los blueprints integrados en un DataZone dominio de Amazon a través de la consola DataZone de administración de Amazon, debes asumir una función de IAM en la cuenta con permisos administrativos. Configure los permisos de IAM necesarios para usar la consola de DataZone administración de Amazonpara obtener los permisos mínimos.
Habilita los blueprints integrados en un dominio de Amazon DataZone
-
Ve a la DataZone consola de Amazon en https://console.aws.amazon.com/datazone
e inicia sesión con las credenciales de tu cuenta. -
Elija Ver dominios y elija el dominio en el que desee habilitar uno o más esquemas integrados.
-
En la página de detalles del dominio, vaya a la pestaña Esquemas.
-
En la lista de planos, selecciona el plano DefaultDataLakeo DefaultDataWarehouseel SageMaker plano de Amazon.
-
En la página de detalles del esquema elegido, seleccione Habilitar en esta cuenta.
-
En la página Permisos y recursos, especifique lo siguiente:
-
Si estás habilitando el DefaultDataLakeblueprint, para la función Glue Manage Access, especifica una función de servicio nueva o existente que DataZone autorice a Amazon a ingerir y gestionar el acceso a las tablas de AWS Glue and AWS Lake Formation.
-
Si está habilitando el DefaultDataWarehouseblueprint, para la función Administrar acceso de Redshift, especifique una función de servicio nueva o existente que autorice a DataZone Amazon a ingerir y administrar el acceso a datos compartidos, tablas y vistas en Amazon Redshift.
-
Si está habilitando el SageMaker blueprint de Amazon, en la función SageMaker Administrar acceso, especifique una función de servicio nueva o existente que conceda DataZone permisos a Amazon para publicar SageMaker datos de Amazon en el catálogo. También otorga DataZone permisos a Amazon para conceder o revocar el acceso a los activos SageMaker publicados por Amazon en el catálogo.
importante
Al activar el SageMaker blueprint de Amazon, Amazon DataZone comprueba si las siguientes funciones de IAM para Amazon DataZone existen en la cuenta corriente y la región. Si estos roles no existen, Amazon los crea DataZone automáticamente.
-
AmazonDataZoneGlueAccess- <region>- <domainId>
-
AmazonDataZoneRedshiftAccess- <region>- <domainId>
-
-
En la función de aprovisionamiento, especifique una función de servicio nueva o existente que DataZone autorice a Amazon a crear y configurar los recursos del entorno utilizando AWS CloudFormation la cuenta y la región del entorno.
-
Si está habilitando el SageMaker blueprint de Amazon, para el bucket de Amazon S3 para la fuente de datos SageMaker -Glue, especifique un bucket de Amazon S3 que vayan a utilizar todos los SageMaker entornos de la AWS cuenta. El prefijo del bucket que especifique debe ser uno de los siguientes:
-
amazon-datazone*
-
datazone-sagemaker*
-
sagemaker-datazone*
-
DataZone-Sagemaker*
-
Sagemaker- * DataZone
-
DataZone-SageMaker*
-
SageMaker-DataZone*
-
-
-
Elija Habilitar esquema.
Una vez que haya habilitado el/los esquema/s elegido/s, podrá controlar qué proyectos pueden utilizarlos en su cuenta para crear perfiles de entorno. Para ello, asigne la administración de proyectos a la configuración del esquema.
importante
De forma predeterminada, no se especifica ningún proyecto de gestión para los blueprints del entorno, lo que significa que cualquier DataZone usuario de Amazon puede crear perfiles para un blueprint del entorno. Por lo tanto, se recomienda encarecidamente que siempre especifique la administración de proyectos para los esquemas de su entorno a fin de garantizar una gobernanza más sólida.
Especificación de la administración de proyectos en los esquemas habilitados
-
Ve a la DataZone consola de Amazon en https://console.aws.amazon.com/datazone
e inicia sesión con las credenciales de tu cuenta. -
Elija Ver dominios y, a continuación, elija el dominio en el que desee añadir la administración de proyectos para los esquemas elegidos.
-
Elija la pestaña Esquemas y elija el esquema con el que desea trabajar.
-
De forma predeterminada, todos los proyectos del dominio pueden usar los DefaultDataLake SageMaker blueprints o o Amazon de la cuenta para crear perfiles de entorno. DefaultDataWareshouse Sin embargo, puede restringirlo asignando la administración de proyectos a los esquemas. Para agregar proyectos de gestión, elija Seleccionar proyecto de gestión y, a continuación, elija los proyectos que desee añadir como proyectos de gestión en el menú desplegable y, a continuación, seleccione Seleccionar proyecto(s) de gestión.
Una vez que habilite el DefaultDataWarehouse blueprint en su AWS cuenta, podrá añadir conjuntos de parámetros a la configuración del blueprint. Un conjunto de parámetros es un grupo de claves y valores necesarios para que Amazon DataZone establezca una conexión con el clúster de Amazon Redshift y que se utiliza para crear entornos de almacenamiento de datos. Estos parámetros incluyen el nombre del clúster de Amazon Redshift, la base de datos y el AWS secreto que contiene las credenciales del clúster.
Añadir conjuntos de parámetros al blueprint DefaultDataWarehouse
-
Ve a la DataZone consola de Amazon en https://console.aws.amazon.com/datazone
e inicia sesión con las credenciales de tu cuenta. -
Elija Ver dominios y, a continuación, elija el dominio al que desea agregar el conjunto de parámetros.
-
Selecciona la pestaña Blueprints y, a continuación, elige el DefaultDataWareshouse blueprint para abrir la página de detalles del blueprint.
-
En la pestaña Conjuntos de parámetros de la página de detalles del esquema, elija Crear conjunto de parámetros.
-
Proporcione un Nombre para el conjunto de parámetros.
-
Si lo desea, facilite una descripción para el conjunto de parámetros.
-
Seleccione una región
-
Seleccione un clúster de Amazon Redshift o Amazon Redshift sin servidor.
-
Seleccione el ARN AWS secreto que contiene las credenciales del clúster de Amazon Redshift seleccionado o del grupo de trabajo Amazon Redshift Serverless. El secreto de AWS debe estar etiquetado con la etiqueta
AmazonDataZoneDomain : [Domain_ID]
para que pueda usarse dentro de un conjunto de parámetros.-
Si no tiene un AWS secreto existente, también puede crear uno nuevo seleccionando Crear nuevo secreto. AWS Esto abre un cuadro de diálogo en el que podrá proporcionar el nombre del secreto, el nombre de usuario y la contraseña. Cuando eliges Create New AWS Secret, Amazon DataZone crea un nuevo secreto en el servicio AWS Secrets Manager y se asegura de que el secreto esté etiquetado con el dominio en el que intentas crear el conjunto de parámetros.
-
-
Si eligió un clúster de Amazon Redshift en el paso anterior, ahora elija un clúster del menú desplegable. Si eligió un grupo de trabajo de Amazon Redshift en el paso anterior, ahora elija un grupo de trabajo del menú desplegable.
-
Introduzca el nombre de la base de datos del clúster de Amazon Redshift o del grupo de trabajo de Amazon Redshift sin servidor seleccionado.
-
Elija Crear conjunto de parámetros.
-
nota
Solo puedes añadir un máximo de 10 conjuntos de parámetros al DefaultDataWarehouse plano.
Una vez que habilites el SageMaker blueprint de Amazon en tu AWS cuenta, podrás añadir conjuntos de parámetros a la configuración del blueprint. Un conjunto de parámetros es un grupo de claves y valores necesarios para DataZone que Amazon establezca una conexión con tu Amazon SageMaker y que se utiliza para crear entornos de SageMaker.
Añadir conjuntos de parámetros al SageMaker blueprint de Amazon
-
Ve a la DataZone consola de Amazon en https://console.aws.amazon.com/datazone
e inicia sesión con las credenciales de tu cuenta. -
Elija Ver dominios y, a continuación, elija el dominio que contiene el esquema habilitado en el que desea agregar el conjunto de parámetros.
-
Selecciona la pestaña Blueprints y, a continuación, elige el SageMaker blueprint de Amazon para abrir la página de detalles del blueprint.
-
En la pestaña Conjuntos de parámetros de la página de detalles del esquema, elija Crear conjunto de parámetros y, a continuación, especifique lo siguiente:
-
Proporcione un Nombre para el conjunto de parámetros.
-
Si lo desea, facilite una Descripción para el conjunto de parámetros.
-
Especifica el tipo de autenticación SageMaker del dominio de Amazon. Puede elegir IAM o IAM Identity Center (SSO).
-
Especifique una AWS región.
-
Especifique una clave AWS KMS para el cifrado de datos. Puede elegir una clave que ya exista o crear una nueva.
-
En Parámetros del entorno, especifique lo siguiente:
-
ID de VPC: el ID que utilizas para la VPC del entorno de Amazon. SageMaker Puede especificar una VPC que ya exista o crear una nueva.
-
Subredes: una o más IDs para un rango de direcciones IP para recursos específicos dentro de la VPC.
-
Acceso a la red: elija VPC solo o Internet público solo.
-
Grupo de seguridad: el grupo de seguridad que se debe usar al configurar la VPC y las subredes.
-
-
En Parámetros de origen de datos, elija una de las siguientes opciones:
-
AWS Glue únicamente
-
AWS Glue + Amazon Redshift Serverless. Si elige esta opción, debe especificar lo siguiente:
-
Especifique el AWS ARN secreto que contiene las credenciales del clúster de Amazon Redshift seleccionado. El secreto de AWS debe estar etiquetado con la etiqueta
AmazonDataZoneDomain : [Domain_ID]
para que pueda usarse dentro de un conjunto de parámetros.Si no tiene un AWS secreto existente, también puede crear uno nuevo seleccionando Crear nuevo AWS secreto. Esto abre un cuadro de diálogo en el que podrá proporcionar el nombre del secreto, el nombre de usuario y la contraseña. Cuando eliges Create New AWS Secret, Amazon DataZone crea un nuevo secreto en el servicio AWS Secrets Manager y se asegura de que el secreto esté etiquetado con el dominio en el que intentas crear el conjunto de parámetros.
-
Especifique el grupo de trabajo de Amazon Redshift que desee utilizar al crear entornos.
-
Especifique el nombre de la base de datos (dentro del grupo de trabajo que elija) que desee utilizar al crear entornos.
-
-
AWS Solo Glue + Amazon Redshift Cluster
-
Especifique el AWS ARN secreto que contiene las credenciales del clúster de Amazon Redshift seleccionado. El secreto de AWS debe estar etiquetado con la etiqueta
AmazonDataZoneDomain : [Domain_ID]
para que pueda usarse dentro de un conjunto de parámetros.Si no tiene un AWS secreto existente, también puede crear uno nuevo seleccionando Crear nuevo AWS secreto. Esto abre un cuadro de diálogo en el que podrá proporcionar el nombre del secreto, el nombre de usuario y la contraseña. Cuando eliges Create New AWS Secret, Amazon DataZone crea un nuevo secreto en el servicio AWS Secrets Manager y se asegura de que el secreto esté etiquetado con el dominio en el que intentas crear el conjunto de parámetros.
-
Especifique el clúster de Amazon Redshift que desea utilizar al crear entornos.
-
Especifique el nombre de la base de datos (dentro del clúster que elija) que desee utilizar al crear entornos.
-
-
-
-
Elija Crear conjunto de parámetros.
Añade Amazon SageMaker como servicio de confianza en la AWS cuenta propietaria del DataZone dominio de Amazon
Si has activado el SageMaker blueprint de Amazon, también debes añadirlo SageMaker como uno de los servicios de confianza de Amazon DataZone. Para ello, complete el siguiente procedimiento:
-
Ve a la DataZone consola de Amazon en https://console.aws.amazon.com/datazone
e inicia sesión con las credenciales de tu cuenta. -
Selecciona Ver dominios y, a continuación, elige el dominio que contiene el blueprint activado. SageMaker
-
Elige los servicios de confianza, Amazon y SageMaker, por último, Activar.