¿Qué novedades hay en Amazon DataZone?
En esta sección se describen las nuevas características y mejoras en Amazon DataZone por fecha de lanzamiento.
2024
Amazon DataZone lanza normas de aplicación de metadatos para solicitudes de suscripciones
Publicado el 20 de noviembre de 2024
Las normas nuevas de aplicación de metadatos para las solicitudes de suscripciones en Amazon DataZone refuerzan la gobernanza de datos al permitir que los propietarios de unidades de dominio establezcan requisitos claros de metadatos para los consumidores de datos, agilicen las solicitudes de acceso y mejoren la gobernanza de datos. Esta característica permite que las organizaciones se ajusten a los estándares de la organización respecto de los metadatos, implementen flujos de trabajo personalizados y proporcionen una experiencia de acceso a los datos coherente y gobernada. Para obtener más información, consulte Normas de aplicación de metadatos para solicitudes de suscripciones.
Los esquemas de servicios de AWS personalizados de Amazon DataZone ahora permiten a Amazon SageMaker ofrecer una nueva experiencia de configuración para los proyectos de Amazon DataZone.
Publicado el 15 de noviembre de 2024
Con los esquemas de servicios de AWS personalizados de Amazon DataZone, puede migrar su dominio de Amazon SageMaker existente a Amazon DataZone. Con esta capacidad, los administradores pueden configurar proyectos de Amazon DataZone importando sus usuarios autorizados, configuraciones de seguridad y políticas existentes desde los dominios de Amazon SageMaker. Para obtener más información, consulte Configuración de activos de SageMaker (guía del administrador).
Amazon DataZone lanza la compatibilidad con AWS CloudFormation para esquemas de servicio de AWS personalizados
Publicado el 12 de septiembre de 2024
Amazon DataZone ha incorporado la compatibilidad con AWS CloudFormation para los esquemas de servicio de AWS personalizados. Esta nueva capacidad le permite usar AWS CloudFormation para automatizar la creación de entornos en Amazon DataZone. Con esquemas personalizados, los administradores ahora pueden integrar Amazon DataZone sin problemas en sus canalizaciones de datos existentes mediante las roles de IAM existentes para publicar activos de datos en el catálogo de Amazon DataZone, lo que permite la posibilidad de compartir de manera controlada esos activos y mejorar la gobernanza en toda la infraestructura. Para obtener más información, consulte la Referencia del tipo de recurso de Amazon DataZone.
Amazon DataZone lanza unidades de dominio y políticas de autorización
Publicado el 12 de agosto de 2024
Amazon DataZone presenta un conjunto de nuevas capacidades de gobernanza de datos llamadas unidades de dominio y políticas de autorización que permiten a los clientes crear una organización a nivel de unidad empresarial o equipo y administrar las políticas según sus necesidades empresariales. Con la incorporación de unidades de dominio, los usuarios pueden organizar, crear, buscar y encontrar activos de datos y proyectos asociados con unidades o equipos de negocios. Con las políticas de autorización, los usuarios de esas unidades de dominio pueden establecer políticas de acceso para crear proyectos, glosarios y utilizar recursos informáticos en Amazon DataZone. Para obtener más información, consulte Unidades de dominio y políticas de autorización en Amazon DataZone.
Amazon DataZone lanza productos de datos
Publicado el 5 de agosto de 2024
Amazon DataZone presenta productos de datos, que permiten la agrupación de activos de datos en paquetes independientes y bien definidos, diseñados para casos de uso empresariales específicos. Por ejemplo, un producto de datos de análisis de marketing puede agrupar varios activos de datos, como datos de campañas de marketing, datos de canalización y datos de clientes. Con los productos de datos, los clientes pueden simplificar los procesos de detección y suscripción, alineándolos con los objetivos empresariales y reduciendo la redundancia en la gestión de activos individuales. Para obtener más información, consulte Productos de datos de Amazon DataZone .
Amazon DataZone lanza una funcionalidad de control de acceso detallada
Publicado el 2 de julio de 2024
Amazon DataZone ha presentado un control de acceso detallado que le proporciona un control pormenorizado de sus activos de datos en el catálogo de datos empresariales de Amazon DataZone, tanto en lagos de datos como en almacenamientos de datos. Con la nueva capacidad, los propietarios de los datos pueden restringir el acceso a registros de datos específicos a nivel de fila y de columna, en lugar de proporcionar acceso a todos los activos de datos. Por ejemplo, si sus datos contienen columnas con información confidencial, como información de identificación personal (PII), puede restringir el acceso solo a las columnas necesarias. De esta manera, se garantiza que la información confidencial esté protegida y, al mismo tiempo, se permite el acceso a los datos no confidenciales. Del mismo modo, puede controlar el acceso a nivel de fila, lo que permite a los usuarios ver solo los registros que sean relevantes para su función o tarea. Para obtener más información, consulte Control de acceso detallado a los datos en Amazon DataZone
Amazon DataZone lanza la funcionalidad de linaje de datos
Publicado el 27 de junio de 2024
Amazon DataZone presenta la versión preliminar del linaje de datos, lo que ayuda a los clientes a visualizar los eventos de linaje desde sistemas compatibles con OpenLineage o mediante la API. Asimismo, permite rastrear el movimiento de los datos desde el origen hasta el consumo. Con las API compatibles con OpenLineage de Amazon DataZone, los administradores de dominio y los productores de datos pueden capturar y almacenar eventos de linaje más allá de lo que está disponible en Amazon DataZone, incluidas las transformaciones en Amazon S3, AWS Glue y otros servicios. Además, Amazon DataZone realiza versiones del linaje con cada evento, lo que permite a los usuarios visualizar el linaje en cualquier momento o comparar las transformaciones en el historial de un activo o de un trabajo. Este historial de linajes proporciona una comprensión más profunda de la evolución de los datos, algo esencial para la resolución de problemas, la auditoría y la validación de la integridad de los activos de datos. Para obtener más información, consulte Linaje de datos en Amazon DataZone
Amazon DataZone lanza esquemas de servicio de AWS personalizados
Publicado el 17 de junio de 2024
Con los esquemas de servicio de AWS personalizados, si tiene recursos de AWS existentes entre los que se incluyen roles de IAM, lagos de datos, mallas de datos, buckets de Amazon S3 y clústeres de Amazon Redshift, ahora puede especificar permisos para estos recursos existentes mediante su propio rol de IAM personalizado, de modo que los usuarios de Amazon DataZone puedan aprovechar la publicación y la suscripción para compartir y gestionar estos recursos. Con los esquemas de servicio de AWS personalizados, los administradores de Amazon DataZone pueden configurar entornos de servicio de AWS mediante sus propios roles personalizados. Pueden configurar enlaces de acciones para estos entornos de servicio de AWS y, por lo tanto, proporcionar acceso federado a cualquier recurso de AWS existente. También pueden configurar los destinos de suscripción y los orígenes de datos en estos entornos de servicio de AWS personalizados. Los administradores pueden configurar entornos de servicio de AWS en su propia cuenta de dominio de Amazon DataZone o en cualquier cuenta asociada desde la que deseen publicar, suscribirse, descubrir o gestionar datos. Para obtener más información, consulte Esquemas de servicios de AWS personalizados de Amazon DataZone .
Mejoras en el flujo de creación de orígenes de datos
Publicado el 10 de junio de 2024
Amazon DataZone ha agregado mejoras al flujo de creación de los orígenes de datos para simplificar la administración del acceso a los productores de datos. Con estas actualizaciones, cuando un productor de datos crea un origen de datos para publicar sus activos de AWS Glue y Amazon Redshift, Amazon DataZone concede permisos de solo lectura a los miembros del proyecto. Al crear un origen de datos de AWS Glue, Amazon DataZone concede automáticamente permisos de solo lectura al rol de IAM del entorno utilizado para crear el origen de datos, lo que permite el acceso a todas las tablas en las bases de datos de AWS Glue asociadas. Del mismo modo, en el caso de los orígenes de datos de Amazon Redshift, Amazon DataZone concede acceso de solo lectura a todas las tablas de los esquemas de Amazon Redshift que se utilizan en el origen de datos. Para obtener más información, consulte Creación y ejecución de un origen de datos de Amazon DataZone para AWS Glue Data Catalog y Creación y ejecución de un origen de datos de Amazon DataZone para Amazon Redshift.
Amazon DataZone lanza la integración con Amazon SageMaker
Publicado el 6 de mayo de 2024
Amazon DataZone lanza la integración con Amazon SageMaker
Amazon DataZone lanza la integración con el modo de acceso híbrido de AWS Lake Formation
Publicado el 3 de abril de 2024
Amazon DataZone ha presentado una integración con el modo de acceso híbrido de AWS Lake Formation. Esta integración le permite publicar y compartir fácilmente sus tablas de AWS Glue a través de Amazon DataZone, sin necesidad de registrarlas primero en AWS Lake Formation. Para empezar, los administradores habilitan la configuración de registro de ubicación de datos en el esquema DefaultDataLake de la consola de Amazon DataZone. A continuación, cuando un consumidor de datos se suscribe a una tabla de AWS Glue administrada mediante permisos de IAM, Amazon DataZone primero registra las ubicaciones de Amazon S3 de esta tabla en modo híbrido y, a continuación, concede acceso al consumidor de datos gestionando los permisos de la tabla a través de AWS Lake Formation. Esto garantiza que los permisos de IAM en la tabla sigan existiendo con permisos de AWS Lake Formation recientemente otorgados, sin interrumpir ninguno de los flujos de trabajo existentes. Para obtener más información, consulte la Integración de Amazon DataZone con el modo híbrido de AWS Lake Formation .
Amazon DataZone lanza la integración con Calidad de datos de AWS Glue
Publicado el 3 de abril de 2024
Amazon DataZone lanza la integración con Calidad de datos de AWS Glue y ofrece varias API para integrar métricas de calidad de datos desde soluciones de calidad de datos de terceros. La nueva integración le permite publicar automáticamente puntuaciones de Calidad de datos de AWS Glue en el catálogo de datos empresariales de Amazon DataZone. Las API de Amazon DataZone se pueden usar para incorporar métricas de calidad de terceros. Una vez publicados, los consumidores de datos pueden buscar fácilmente activos de datos, ver métricas de calidad pormenorizadas e identificar las comprobaciones y normas fallidas, lo que aumenta la capacidad de toma de decisiones empresariales. Para obtener más información, consulte la Calidad de los datos en Amazon DataZone.
Publicación de disponibilidad general de las recomendaciones de IA para las descripciones en Amazon DataZone
Publicado el 27 de marzo de 2024
Amazon DataZone anunció la versión de disponibilidad general de la nueva capacidad basada en IA generativa para mejorar la detección, comprensión y uso de datos mediante el enriquecimiento del catálogo de datos empresariales. Con un solo clic, los productores de datos pueden generar descripciones y contextos completos para los datos empresariales, destacar las columnas más impactantes e incluir recomendaciones sobre casos de uso analíticos. El lanzamiento añade compatibilidad con las API que los productores de datos pueden utilizar para generar descripciones de los activos mediante programación. Para obtener más información, consulte Uso del machine learning y la IA generativa en Amazon DataZone.
Amazon DataZone presenta mejoras para la integración de Amazon Redshift
Publicado el 21 de marzo de 2024
Amazon DataZone ha introducido varias mejoras en su integración con Amazon Redshift, lo que simplifica el proceso de publicación y suscripción a las tablas y vistas de Amazon Redshift. Estas actualizaciones optimizan la experiencia tanto para los productores como para los consumidores de datos, ya que les permiten crear rápidamente entornos de almacenamiento de datos utilizando credenciales preconfiguradas y parámetros de conexión proporcionados por sus administradores de Amazon DataZone. Además, estas mejoras otorgan a los administradores un mayor control sobre quién puede usar los recursos de sus cuentas de AWS y clústeres de Amazon Redshift, y con qué propósito.
-
Configuración del esquema: una vez que active el esquema
DefaultDataWarehouseBlueprint, podrá controlar qué proyectos pueden utilizar el esquemaDefaultDataWarehouseBlueprintde su cuenta para crear perfiles de entorno asignando la administración de los proyectos al esquema habilitado. También puede crear conjuntos de parámetros sobreDefaultDataWarehouseBlueprint, proporcionando parámetros como el clúster, la base de datos y un secreto de AWS. También puede crear secretos de AWS desde la consola de Amazon DataZone. -
Perfil de entorno: al crear un perfil de entorno, puede elegir entre proporcionar sus propios parámetros de Amazon Redshift o utilizar uno de los conjuntos de parámetros de la configuración del esquema. Si decide utilizar el conjunto de parámetros creado en la configuración del esquema, el secreto de AWS solo requiere una etiqueta
AmazonDataZoneDomain(la etiquetaAmazonDataZoneProjectsolo es necesaria si decide proporcionar sus propios conjuntos de parámetros en el perfil del entorno). En el perfil del entorno, puede especificar una lista de proyectos autorizados. Solo los proyectos autorizados pueden usar este perfil de entorno para crear entornos de almacenamiento de datos. También puede especificar qué datos pueden publicar los proyectos autorizados. Actualmente, puede elegir una de las siguientes opciones: 1) Publicar desde cualquier esquema, 2) Publicar desde el esquema de entorno predeterminado, 3) No permitir la publicación. -
Entorno: los productores o consumidores de datos ahora pueden seleccionar un perfil de entorno para crear entornos, sin necesidad de proporcionar sus propios parámetros de Amazon Redshift, incluidos el secreto de AWS, el clúster, el grupo de trabajo y la base de datos. Estos parámetros se transfieren al entorno desde el perfil de entorno. Junto con la creación del entorno, Amazon DataZone ahora también crea un esquema predeterminado para el entorno. Los miembros del proyecto tienen acceso de lectura y escritura a este esquema y pueden publicar fácilmente cualquier tabla creada en este esquema en el catálogo al ejecutar el origen de datos predeterminado creado como parte de la creación del entorno. Los parámetros de Amazon Redshift que se utilizan para crear el entorno también se pueden utilizar para crear nuevos orígenes de datos (en lugar de que el productor de datos proporcione sus propios parámetros en la creación del origen de datos).
Compatibilidad de AWS Cloud Formation con Amazon DataZone
Publicado el 18 de enero de 2024
Los usuarios de Amazon DataZone ahora pueden aprovechar AWS CloudFormation para modelar y administrar de forma eficaz un conjunto de recursos de Amazon DataZone. Este enfoque facilita un aprovisionamiento coherente de recursos y, al mismo tiempo, permite la administración del ciclo de vida mediante la infraestructura como prácticas de código. Con las plantillas personalizadas, puede definir con precisión los recursos necesarios y sus interdependencias. Para obtener más información, consulte la Referencia del tipo de recurso de Amazon DataZone.
Agregue a las entidades principales de IAM directamente como miembros de los proyectos de Amazon DataZone
Publicado el 5 de enero de 2024
Ahora puede agregar entidades principales de IAM como miembros del proyecto, incluso si esas entidades principales de IAM aún no han iniciado sesión en Amazon DataZone (requisito previo). Después de que un administrador de dominio o un administrador de TI agregue iam:GetUser y iam:GetRole al rol de ejecución del dominio, los propietarios del proyecto pueden agregar a las entidades principales de IAM como miembros simplemente proporcionando el nombre de recurso de Amazon (ARN) del rol de IAM o usuario de IAM. La entidad principal de IAM aún debe tener los permisos de IAM necesarios para acceder a Amazon DataZone y estos se pueden configurar en la consola de IAM. Para obtener más información, consulte Agregación de miembros a un proyecto.
Compatibilidad con tipos de activos personalizados del portal de datos
Publicado el 5 de enero de 2024
La compatibilidad con activos personalizados permite a Amazon DataZone catalogar activos a través del portal de datos para datos no estructurados, incluidos paneles, consultas y modelos, lo que facilita la posibilidad de agregar activos personalizados directamente en el portal de datos junto con la compatibilidad con la API disponible anteriormente. La capacidad de crear, actualizar y publicar activos personalizados en Amazon DataZone le permite compartir, buscar y suscribirse a cualquier tipo de activo y crear un flujo de trabajo empresarial que proporcione control sobre esos activos. Para obtener más información, consulte Creación de tipos de activos personalizados en Amazon DataZone.
2023
Eliminación de un dominio
Publicado el 27 de diciembre de 2023
Esta es una característica que le permite eliminar los dominios más fácilmente. Ahora puede continuar con la eliminación del dominio incluso si no está vacío (ya que contiene proyectos, entornos, activos, orígenes de datos, etc.). Para obtener más información, consulte Eliminación de dominios en Amazon DataZone.
Modo híbrido
Publicado el 22 de diciembre de 2023
Amazon DataZone ha añadido la compatibilidad con el modo híbrido de AWS Lake Formation. Con esta compatibilidad, si publica una tabla de AWS Glue en Amazon DataZone con su ubicación de AWS S3 registrada en Lake Formation en modo híbrido, Amazon DataZone trata esta tabla como un activo administrado y puede administrar las concesiones de suscripción a esta tabla. Antes del lanzamiento de esta característica, Amazon DataZone trataba esta tabla como un activo no administrado, es decir, Amazon DataZone no podía conceder suscripciones a esta tabla. Para obtener más información, consulte Configuración de los permisos de Lake Formation para Amazon DataZone.
Conformidad con HIPAA
Publicado el 14 de diciembre de 2023
Amazon DataZone cumple ahora con la Ley de Portabilidad y Responsabilidad de Seguros Médicos de EE. UU., HIPAA (Health Insurance Portability and Accountability Act) de 1996. Para ver la lista de servicios de AWS que cumplen con la HIPAA, consulte https://aws.amazon.com/compliance/hipaa-eligible-services-reference/
Recomendaciones de IA para descripciones en Amazon DataZone (versión preliminar)
Publicado el 28 de noviembre de 2023
AWS anuncia la versión preliminar una nueva capacidad en Amazon DataZone basada en IA generativa para mejorar la detección, comprensión y uso de datos mediante el enriquecimiento del catálogo de datos empresariales. Con un solo clic, los productores de datos pueden generar descripciones y contextos completos para los datos empresariales, destacar las columnas más impactantes e incluir recomendaciones sobre casos de uso analíticos. Con las recomendaciones de IA para las descripciones en Amazon DataZone, los consumidores de datos pueden identificar las tablas y columnas de datos necesarias para el análisis, lo que mejora la capacidad de detección de datos y reduce las comunicaciones de ida y vuelta con los productores de datos. La versión preliminar está disponible en los dominios de Amazon DataZone aprovisionados en las siguientes regiones de AWS: Este de EE. UU. (Norte de Virginia), Oeste de EE. UU. (Oregón). Para obtener más información, consulte Uso del machine learning y la IA generativa en Amazon DataZone.
Mejora del esquema de DefaultDataLake
Publicado el 20 de noviembre de 2023
Amazon DataZone ha añadido una mejora al esquema DefaultDataLake que le permite controlar mejor los datos que se pueden publicar desde su cuenta de AWS y quién puede publicarlos. Se incorporaron dos cambios importantes con el lanzamiento de esta característica.
-
En la consola, una vez que habilite el esquema DefaultDataLake, podrá controlar qué proyectos pueden utilizar el esquema DefaultDataLake en su cuenta para crear perfiles de entorno asignando la administración de proyectos al esquema habilitado.
-
El segundo cambio se produce en el portal. Si crea un perfil de entorno mediante el esquema DefaultDataLake, también puede seleccionar los proyectos autorizados que pueden usar el perfil de entorno para crear entornos. De forma predeterminada, todos los proyectos pueden usar el perfil de entorno del lago de datos, pero puede restringir el perfil de entorno a proyectos específicos y también controlar qué datos se pueden publicar utilizando los entornos creados con el perfil.
Para obtener más información, consulte Creación de un perfil de entorno.