Quelles sont les nouveautés d'Amazon DataZone ? - Amazon DataZone

Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.

Quelles sont les nouveautés d'Amazon DataZone ?

Cette section décrit les nouvelles fonctionnalités et améliorations d'Amazon DataZone par date de sortie.

Rubriques

2024

Amazon DataZone lance des règles d'application des métadonnées pour les demandes d'abonnement

Publié le 20/11/2024

Les nouvelles règles d'application des métadonnées pour les demandes d'abonnement sur Amazon DataZone renforcent la gouvernance des données en permettant aux propriétaires d'unités de domaine d'établir des exigences claires en matière de métadonnées pour les consommateurs de données, en rationalisant les demandes d'accès et en améliorant la gouvernance des données. Cette fonctionnalité permet aux organisations de s'aligner sur les normes de métadonnées de l'organisation, de mettre en œuvre des flux de travail personnalisés et de fournir une expérience d'accès aux données cohérente et gouvernée. Pour de plus amples informations, veuillez consulter Règles d'application des métadonnées pour les demandes d'abonnement.

Les plans AWS de service DataZone personnalisés d'Amazon permettent désormais à Amazon de SageMaker bénéficier d'une nouvelle expérience de configuration pour les projets Amazon DataZone

Publié le 15/11/2024

Avec Amazon DataZone Custom AWS Service Prints, vous pouvez migrer votre SageMaker domaine Amazon existant vers Amazon DataZone. Grâce à cette fonctionnalité, les administrateurs peuvent désormais configurer DataZone des projets Amazon en important leurs utilisateurs autorisés existants, leurs configurations de sécurité et leurs politiques depuis les SageMaker domaines Amazon. Pour plus d'informations, voir Configuration SageMaker des actifs (guide de l'administrateur).

Amazon DataZone lance le AWS CloudFormation support pour les plans AWS de services personnalisés

Publié le 9/12/2024

Amazon DataZone a ajouté la AWS CloudFormation prise en charge des plans AWS de service personnalisés. Cette nouvelle fonctionnalité vous permet d' AWS CloudFormation automatiser la création d'environnements dans Amazon DataZone. Grâce à des plans personnalisés, les administrateurs peuvent désormais intégrer facilement Amazon à leurs pipelines de données existants DataZone en utilisant les rôles IAM existants pour publier les actifs de données dans le DataZone catalogue Amazon, en facilitant le partage régi de ces actifs et en améliorant la gouvernance dans l'ensemble de l'infrastructure. Pour plus d'informations, consultez la référence DataZone des types de ressources Amazon.

Amazon DataZone lance des unités de domaine et des politiques d'autorisation

Publié le 08/12/2024

Amazon DataZone introduit un ensemble de nouvelles fonctionnalités de gouvernance des données appelées unités de domaine et politiques d'autorisation qui permettent aux clients de créer une organisation au niveau de l'unité commerciale/de l'équipe et de gérer les politiques en fonction des besoins de leur entreprise. Avec l'ajout d'unités de domaine, les utilisateurs peuvent organiser, créer, rechercher et trouver des actifs de données et des projets associés à des unités commerciales ou à des équipes. Grâce aux politiques d'autorisation, ces utilisateurs d'unités de domaine peuvent définir des politiques d'accès pour créer des projets, des glossaires et utiliser des ressources informatiques au sein d'Amazon DataZone. Pour de plus amples informations, veuillez consulter Unités de domaine et politiques d'autorisation sur Amazon DataZone.

Amazon DataZone lance des produits de données

Publié le 08/05/2024

Amazon DataZone lance des produits de données, qui permettent de regrouper les actifs de données dans des packages autonomes bien définis, adaptés à des cas d'utilisation professionnels spécifiques. Par exemple, un produit de données d'analyse marketing peut regrouper divers actifs de données, tels que les données de campagnes marketing, les données de pipeline et les données clients. Grâce aux produits de données, les clients peuvent simplifier les processus de découverte et d'abonnement, en les alignant sur les objectifs commerciaux et en réduisant la redondance dans la gestion des actifs individuels. Pour plus d'informations, consultez Produits DataZone de données Amazon .

Amazon DataZone lance une fonctionnalité de contrôle d'accès précise

Publié le 07/02/2024

Amazon DataZone a introduit un contrôle d'accès précis, qui vous permet de contrôler de manière précise vos actifs de données dans le catalogue de données commerciales d'Amazon, à travers les lacs DataZone de données et les entrepôts de données. Grâce à cette nouvelle fonctionnalité, les propriétaires de données peuvent désormais restreindre l'accès à des enregistrements de données spécifiques au niveau des lignes et des colonnes, au lieu d'accorder l'accès à l'ensemble des actifs de données. Par exemple, si vos données contiennent des colonnes contenant des informations sensibles telles que des informations personnelles identifiables (PII), vous pouvez limiter l'accès aux seules colonnes nécessaires, afin de protéger les informations sensibles tout en autorisant l'accès aux données non sensibles. De même, vous pouvez contrôler l'accès au niveau des lignes, en permettant aux utilisateurs de ne voir que les enregistrements correspondant à leur rôle ou à leur tâche. Pour plus d’informations, consultez Contrôle d'accès précis aux données sur Amazon DataZone.

Amazon DataZone lance une fonctionnalité de traçabilité des données

Publié le 27/06/2024

Amazon DataZone lance le lignage des données en version préliminaire, aidant les clients à visualiser les événements de lignage à partir de systèmes OpenLineage compatibles ou via une API et à suivre le mouvement des données de la source à la consommation. Grâce à la OpenLineage compatibilité DataZone d'Amazon APIs, les administrateurs de domaines et les producteurs de données peuvent capturer et stocker des événements de lignage autres que ceux disponibles sur Amazon DataZone, y compris les transformations dans Amazon S3, AWS Glue et d'autres services. En outre, DataZone les versions d'Amazon font le suivi de chaque événement, ce qui permet aux utilisateurs de visualiser le lignage à tout moment ou de comparer les transformations liées à l'historique d'un actif ou d'une tâche. Cette généalogie historique permet de mieux comprendre l'évolution des données, ce qui est essentiel pour le dépannage, l'audit et la validation de l'intégrité des actifs de données. Pour plus d’informations, consultez Lignage des données sur Amazon DataZone.

Amazon DataZone lance des plans AWS de services personnalisés

Publié le 17/06/2024

Avec les plans de AWS service personnalisés, si vous disposez de AWS ressources existantes, notamment des rôles IAM, des lacs de données, des maillages de données, des compartiments Amazon S3 et des clusters Amazon Redshift, vous pouvez désormais spécifier des autorisations pour ces ressources existantes à l'aide de votre propre rôle IAM personnalisé, afin que vos DataZone utilisateurs Amazon puissent tirer parti de la publication et de l'abonnement pour partager et gérer ces ressources. Avec des plans AWS de service personnalisés, DataZone les administrateurs Amazon peuvent configurer des environnements AWS de service en utilisant leurs propres rôles personnalisés. Ils peuvent configurer des liens d'actions pour ces environnements de AWS service et fournir ainsi un accès fédéré à toutes leurs AWS ressources existantes. Ils peuvent également configurer des cibles d'abonnement et des sources de données dans ces environnements AWS de service personnalisés. Les administrateurs peuvent configurer des environnements de AWS service dans leur propre compte de DataZone domaine Amazon ou dans tout compte associé à partir duquel ils souhaitent publier, s'abonner, découvrir ou gérer des données. Pour de plus amples informations, veuillez consulter DataZone Schémas AWS de service personnalisés Amazon .

Améliorations apportées au flux de création de sources de données

Publié le 06/10/2024

Amazon DataZone a apporté des améliorations au flux de création des sources de données afin de simplifier la gestion des accès pour les producteurs de données. Avec ces mises à jour, lorsqu'un producteur de données crée une source de données pour publier ses actifs AWS Glue et Amazon Redshift, Amazon DataZone accorde des autorisations de lecture seule aux membres du projet. Lors de la création d'une source de données AWS Glue, Amazon accorde DataZone automatiquement des autorisations « en lecture seule » au rôle IAM de l'environnement utilisé pour créer la source de données, permettant ainsi l'accès à toutes les tables des bases de données Glue AWS associées. De même, pour les sources de données Amazon Redshift, Amazon DataZone accorde un accès « en lecture seule » à toutes les tables des schémas Amazon Redshift utilisés dans la source de données. Pour plus d’informations, consultez Créez et exécutez une source DataZone de données Amazon pour AWS Glue Data Catalog et Création et gestion d'une source de DataZone données Amazon pour Amazon Redshift.

Amazon DataZone lance l'intégration avec Amazon SageMaker

Publié le 05/06/2024

Amazon DataZone lance l'intégration avec Amazon SageMaker pour aider les producteurs de données et les consommateurs à passer facilement SageMaker à Amazon pour collaborer sur des projets d'apprentissage automatique (ML) tout en renforçant la gouvernance de l'accès aux données et aux actifs de machine learning. Grâce à la nouvelle intégration intégrée entre Amazon DataZone et Amazon SageMaker, les consommateurs et les producteurs de données peuvent rationaliser la gouvernance du machine learning lors de la configuration de l'infrastructure, collaborer sur des initiatives commerciales et gérer facilement les données et les actifs de machine learning. Pour plus d’informations, consultez Blueprints DataZone intégrés à Amazon et Comptes associés sur Amazon DataZone.

Amazon DataZone lance l'intégration avec AWS le mode d'accès hybride Lake Formation

Publié le 04/03/2024

Amazon DataZone a introduit une intégration avec AWS le mode d'accès hybride Lake Formation. Cette intégration vous permet de publier et de partager facilement vos tables AWS Glue via Amazon DataZone, sans avoir à les enregistrer au préalable dans AWS Lake Formation. Pour commencer, les administrateurs activent le paramètre d'enregistrement de la localisation des données dans le DefaultDataLake plan de la DataZone console Amazon. Ensuite, lorsqu'un consommateur de données s'abonne à une table AWS Glue gérée via des autorisations IAM, Amazon enregistre d' DataZone abord les emplacements Amazon S3 de cette table en mode hybride, puis accorde l'accès au consommateur de données en gérant les autorisations sur la table via AWS Lake Formation. Cela garantit que les autorisations IAM disponibles continuent d'exister avec les autorisations AWS Lake Formation récemment accordées, sans perturber les flux de travail existants. Pour plus d’informations, consultez le DataZone Intégration d'Amazon au mode hybride de AWS Lake Formation .

Amazon DataZone lance l'intégration avec AWS Glue Data Quality

Publié le 04/03/2024

Amazon DataZone lance l'intégration avec AWS Glue Data Quality et propose APIs d'intégrer des indicateurs de qualité des données issus de solutions de qualité des données tierces. La nouvelle intégration vous permet de publier automatiquement les scores de AWS Glue Data Quality dans le catalogue de données Amazon DataZone Business. Amazon DataZone APIs peut être utilisé pour ingérer des indicateurs de qualité provenant de sources tierces. Une fois publiées, les consommateurs de données peuvent facilement rechercher des actifs de données, consulter des indicateurs de qualité détaillés et identifier les contrôles et les règles défaillants, ce qui permet aux entreprises de prendre des décisions éclairées. Pour plus d’informations, consultez le Qualité des données sur Amazon DataZone.

Mise à disposition générale des recommandations relatives à l'IA pour les descriptions sur Amazon DataZone

Publié le 27/03/2024

Amazon DataZone a annoncé la mise à disposition générale de la nouvelle fonctionnalité générative basée sur l'IA afin d'améliorer la découverte des données, leur compréhension et leur utilisation en enrichissant le catalogue de données commerciales. En un seul clic, les producteurs de données peuvent générer des descriptions et un contexte complets des données commerciales, mettre en évidence les colonnes pertinentes et inclure des recommandations sur des cas d'utilisation analytiques. Le lancement ajoute un support APIs que les producteurs de données peuvent utiliser pour générer par programmation des descriptions pour les actifs. Pour de plus amples informations, veuillez consulter Utilisation de l'apprentissage automatique et de l'IA générative sur Amazon DataZone.

Amazon apporte DataZone des améliorations à l'intégration d'Amazon Redshift

Publié le 21/03/2024

Amazon DataZone a apporté plusieurs améliorations à son intégration avec Amazon Redshift, simplifiant le processus de publication et d'abonnement aux tables et aux vues Amazon Redshift. Ces mises à jour rationalisent l'expérience des producteurs de données et des consommateurs, en leur permettant de créer rapidement des environnements d'entrepôt de données à l'aide d'informations d'identification et de paramètres de connexion préconfigurés fournis par leurs DataZone administrateurs Amazon. En outre, ces améliorations permettent aux administrateurs de mieux contrôler qui peut utiliser les ressources de leurs AWS comptes et des clusters Amazon Redshift, et dans quel but.

  • Configuration du plan : une fois que vous avez activé le DefaultDataWarehouseBlueprint plan, vous pouvez contrôler quels projets peuvent utiliser le DefaultDataWarehouseBlueprint plan dans votre compte pour créer des profils d'environnement en attribuant la gestion des projets au plan activé. Vous pouvez également créer des ensembles de paramètres en DefaultDataWarehouseBlueprint fournissant des paramètres tels que le cluster, la base de données et un AWS secret. Vous pouvez également créer des AWS secrets depuis la DataZone console Amazon.

  • Profil d'environnement : lors de la création d'un profil d'environnement, vous pouvez choisir de fournir vos propres paramètres Amazon Redshift ou d'utiliser l'un des ensembles de paramètres de la configuration du plan. Si vous choisissez d'utiliser le jeu de paramètres créé dans la configuration du plan, le AWS secret ne nécessite qu'une AmazonDataZoneDomain balise (la AmazonDataZoneProject balise n'est requise que si vous choisissez de fournir vos propres ensembles de paramètres dans le profil d'environnement). Dans le profil d'environnement, vous pouvez spécifier une liste de projets autorisés. Seuls les projets autorisés peuvent utiliser ce profil d'environnement pour créer des environnements d'entrepôt de données. Vous pouvez également spécifier les données que les projets autorisés sont autorisés à publier. Actuellement, vous pouvez choisir l'une des options suivantes : 1) Publier à partir de n'importe quel schéma, 2) Publier à partir du schéma d'environnement par défaut, 3) Ne pas autoriser la publication.

  • Environnement : les producteurs ou les consommateurs de données peuvent désormais sélectionner un profil d'environnement pour créer des environnements, sans avoir à fournir leurs propres paramètres Amazon Redshift, notamment AWS Secret, cluster, groupe de travail et base de données. Ces paramètres sont transférés vers l'environnement à partir du profil d'environnement. Parallèlement à la création de l'environnement, Amazon crée DataZone désormais également un schéma par défaut pour l'environnement. Les membres du projet ont un accès en lecture et en écriture à ce schéma et peuvent facilement publier les tables créées dans ce schéma dans le catalogue en exécutant la source de données par défaut créée dans le cadre de la création de l'environnement. Les paramètres Amazon Redshift utilisés pour créer un environnement peuvent également être utilisés pour créer de nouvelles sources de données (au lieu que le producteur de données fournisse ses propres paramètres lors de la création de la source de données).

AWS Support à la formation dans le cloud pour Amazon DataZone

Publié le 18/01/2024

Les utilisateurs d'Amazon DataZone peuvent désormais en tirer parti AWS CloudFormation pour modéliser et gérer efficacement une suite de DataZone ressources Amazon. Cette approche facilite le provisionnement cohérent des ressources, tout en permettant la gestion du cycle de vie par le biais de pratiques liées à l'infrastructure en tant que code. Grâce aux modèles personnalisés, vous pouvez définir avec précision les ressources dont vous avez besoin et leurs interdépendances. Pour plus d'informations, consultez la référence DataZone des types de ressources Amazon.

Ajoutez des responsables IAM directement en tant que membres de projets Amazon DataZone

Publié le 01/05/2024

Vous pouvez désormais ajouter des responsables IAM en tant que membres du projet, même s'ils ne se sont pas encore connectés à Amazon DataZone (exigence précédente). Une fois qu'un administrateur de domaine ou un administrateur informatique a ajouté iam:GetUser et iam:GetRole au rôle d'exécution du domaine, les propriétaires de projet peuvent ajouter les principaux IAM en tant que membres en fournissant simplement le nom de ressource Amazon (ARN) du rôle IAM ou de l'utilisateur IAM. Le principal IAM doit toujours disposer des autorisations IAM requises pour accéder à Amazon DataZone et celles-ci peuvent être configurées dans la console IAM. Pour de plus amples informations, veuillez consulter Ajouter des membres à un projet.

Support pour les types d'actifs personnalisés depuis le portail de données

Publié le 01/05/2024

La prise en charge des actifs personnalisés permet DataZone à Amazon de cataloguer les actifs via le portail de données pour les données non structurées, notamment les tableaux de bord, les requêtes et les modèles, ce qui vous permet d'ajouter plus facilement des actifs personnalisés directement dans le portail de données, en plus du support d'API précédemment disponible. La possibilité de créer, de mettre à jour et de publier des ressources personnalisées sur Amazon DataZone vous permet de partager, de rechercher, de vous abonner à tout type d'actif et de créer un flux de travail qui assure la gouvernance de ces actifs. Pour de plus amples informations, veuillez consulter Créez des types d'actifs personnalisés sur Amazon DataZone.

2023

Supprimer le domaine

Publié le 27/12/2023

Il s'agit d'une fonctionnalité qui vous permet de supprimer plus facilement vos domaines. Vous pouvez désormais procéder à la suppression du domaine même s'il n'est pas vide (car il contient des projets, des environnements, des actifs, des sources de données, etc.). Pour de plus amples informations, veuillez consulter Supprimer des DataZone domaines Amazon.

Mode hybride

Publié le 22/12/2023

Amazon DataZone a ajouté la prise en charge du mode hybride AWS Lake Formation. Grâce à ce support, si vous publiez une table AWS Glue sur Amazon DataZone dont l'emplacement AWS S3 est enregistré dans Lake Formation en mode hybride, Amazon DataZone traite cette table comme un actif géré et peut gérer les subventions d'abonnement à cette table. Avant la sortie de cette fonctionnalité, Amazon DataZone traitait ce tableau comme un actif non géré, c'est-à-dire DataZone qu'Amazon ne serait pas en mesure d'accorder des abonnements à ce tableau. Pour de plus amples informations, veuillez consulter Configurer les autorisations de Lake Formation pour Amazon DataZone.

Éligibilité HIPAA

Publié le 14/12/2023

Amazon DataZone est désormais conforme à la loi américaine HIPAA (Health Insurance Portability and Accountability Act) de 1996. Pour consulter la liste des AWS services conformes à la loi HIPAA, voir https://aws.amazon.com/compliance/hipaa-eligible-services-reference/.

Recommandations de l'IA pour les descriptions dans Amazon DataZone (version préliminaire)

Publié le 28/11/2023

AWS annonce la prévisualisation d'une nouvelle fonctionnalité générative basée sur l'IA dans Amazon DataZone afin d'améliorer la découverte des données, leur compréhension et leur utilisation en enrichissant le catalogue de données commerciales. En un seul clic, les producteurs de données peuvent générer des descriptions et un contexte complets des données commerciales, mettre en évidence les colonnes pertinentes et inclure des recommandations sur des cas d'utilisation analytiques. Grâce aux recommandations de l'IA pour les descriptions sur Amazon DataZone, les consommateurs de données peuvent identifier les tables de données et les colonnes nécessaires à l'analyse, ce qui améliore la découvrabilité des données et réduit les back-and-forth communications avec les producteurs de données. La version préliminaire est disponible dans DataZone les domaines Amazon fournis dans les AWS régions suivantes : USA Est (Virginie du Nord), USA Ouest (Oregon). Pour de plus amples informations, veuillez consulter Utilisation de l'apprentissage automatique et de l'IA générative sur Amazon DataZone.

DefaultDataLake amélioration du plan

Publié le 20/11/2023

Amazon DataZone a ajouté une amélioration au DefaultDataLake plan qui vous permet de mieux contrôler qui peut publier quelles données depuis votre AWS compte. Deux modifications majeures ont été introduites avec le lancement de cette fonctionnalité.

  • Dans la console, une fois que vous avez activé le DefaultDataLake plan, vous pouvez contrôler quels projets peuvent utiliser le DefaultDataLake plan dans votre compte pour créer des profils d'environnement en attribuant la gestion des projets au plan activé.

  • Le deuxième changement concerne le portail. Si vous créez un profil d'environnement à l'aide du DefaultDataLake plan, vous pouvez également sélectionner les projets autorisés autorisés à utiliser le profil d'environnement pour créer des environnements. Par défaut, tous les projets sont autorisés à utiliser le profil d'environnement du lac de données, mais vous pouvez restreindre le profil d'environnement à des projets spécifiques et également contrôler les données qui peuvent être publiées à l'aide des environnements créés avec le profil.

Pour de plus amples informations, veuillez consulter Création d'un profil d'environnement.