Amazon DataZone の新機能 - Amazon DataZone

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

Amazon DataZone の新機能

このセクションでは、Amazon DataZone の新機能と改良点についてリリース日別に説明します。

トピック

2024

Amazon DataZone がサブスクリプションリクエストのメタデータ適用ルールを起動

11/20/2024 にリリース

Amazon DataZone のサブスクリプションリクエストの新しいメタデータ適用ルールは、ドメインユニットの所有者がデータコンシューマーの明確なメタデータ要件を確立し、アクセスリクエストを合理化し、データガバナンスを強化することで、データガバナンスを強化します。この機能により、組織は組織のメタデータ標準に合致し、カスタムワークフローを実装し、一貫性のある管理されたデータアクセスエクスペリエンスを提供できます。詳細については、「サブスクリプションリクエストのメタデータ適用ルール」を参照してください。

Amazon DataZone カスタム AWS サービスブループリントで、Amazon DataZone プロジェクトの新しいセットアップエクスペリエンスで Amazon SageMaker を有効にするようになりました DataZone

11/15/2024 にリリース

Amazon DataZone カスタム AWS サービスプリントを使用すると、既存の Amazon SageMaker ドメインを Amazon DataZone に移行できます。この機能を使用すると、管理者は Amazon SageMaker ドメインから既存の承認されたユーザー、セキュリティ設定、ポリシーをインポートして Amazon DataZone プロジェクトをセットアップできるようになりました。詳細については、「Set up SageMaker Assets」(管理者ガイド) を参照してください。

Amazon DataZone がカスタム AWS サービスブループリントの AWS CloudFormation サポートを開始

2024/9/12 リリース

Amazon DataZone で、カスタム AWS サービスブループリントの AWS CloudFormation サポートが追加されました。この新しい機能により、 AWS CloudFormation を使用して Amazon DataZone での環境の作成を自動化できます。カスタムブループリントを使用すると、管理者は既存の IAM ロールを使用して Amazon DataZone を既存のデータパイプラインにシームレスに統合し、データアセットを Amazon DataZone カタログに公開できるようになりました。これにより、これらのアセットの共有を容易に管理し、インフラストラクチャ全体のガバナンスを強化できます。詳細については、「Amazon DataZone resource type reference」を参照してください。

Amazon DataZone でドメインユニットと認可ポリシーを開始

2024/8/12 リリース

Amazon DataZone では、ユーザーがビジネスニーズに応じてビジネスユニット/チームレベルの組織を作成し、ポリシーを管理できるようにする、ドメインユニットと認可ポリシーと呼ばれる一連の新しいデータガバナンス機能が導入されています。ドメインユニットの追加により、ユーザーはビジネスユニットやチームに関連付けられたデータアセットとプロジェクトを整理、作成、検索、検出できます。認可ポリシーを使用すると、これらのドメインユニットのユーザーは、Amazon DataZone 内で作成するプロジェクト、用語集、使用するコンピューティングリソースのアクセスポリシーを設定できます。詳細については、「Amazon DataZone のドメインユニットと認可ポリシー」を参照してください。

Amazon DataZone でデータ製品を開始

2024/8/5 リリース

Amazon DataZone はデータ製品を導入し、データアセットを、特定のビジネスユースケースに合わせて明確に定義された自己完結型パッケージにグループ化します。例えば、マーケティング分析データ製品は、マーケティングキャンペーンデータ、パイプラインデータ、顧客データなど、さまざまなデータアセットをバンドルできます。データ製品を使用すると、検出プロセスとサブスクリプションプロセスを簡素化し、ビジネス目標に合わせて調整して、個々のアセットの処理における冗長性を軽減できます。詳細については、「Amazon DataZone データ製品 」を参照してください。

Amazon DataZone できめ細かなアクセスコントロール機能を提供開始

2024/7/2 リリース

Amazon DataZone ではきめ細かなアクセスコントロールを導入し、Amazon DataZone のビジネスデータカタログ内のデータアセットをデータレイクとデータウェアハウス全体できめ細かく制御できるようになりました。新機能により、データ所有者は、データアセット全体へのアクセス権を付与する代わりに、行および列レベルでデータの特定のレコードへのアクセスを制限できるようになりました。例えば、個人を特定できる情報 (PII) などの機密情報を含む列がデータに含まれている場合、必要な列のみにアクセスを制限することができます。これにより、機密情報を保護しながら、機密性の低いデータへのアクセスも許可できます。同様に、行レベルでアクセスを制御できるため、ユーザーは自分のロールまたはタスクに関連するレコードのみを表示できます。詳細については、「Amazon DataZone でのデータへのきめ細かなアクセスコントロール」を参照してください

Amazon DataZone でデータリネージュ機能を提供開始

2024/6/27 リリース

Amazon DataZone ではプレビューでデータリネージュを起動して、OpenLineage 対応システムまたは API を通じてリネージュイベントを視覚化し、ソースから消費までのデータ移動を追跡できるようにユーザーを支援しています。Amazon DataZone の OpenLineage 互換 APIs を使用すると、ドメイン管理者とデータプロデューサーは、Amazon S3、Glue、その他の サービスでの変換など、Amazon DataZone で利用できるもの以外の系統イベントをキャプチャして保存できます。 AWS さらに、Amazon DataZone バージョンは各イベントとリネージュを合わせるため、ユーザーは任意の時点でリネージュを視覚化したり、アセットまたはジョブの履歴全体の変換を比較したりできます。この履歴のリネージュにより、データがどのように進化してきたかについて理解を深めることができます。これはデータアセットの整合性のトラブルシューティング、監査、検証に不可欠です。詳細については、「Amazon DataZone のデータリネージュ」を参照してください

Amazon DataZone がカスタム AWS サービスブループリントを起動

2024/6/17 リリース

カスタム AWS サービスブループリントでは、IAM ロール、データレイク、データメッシュ、Amazon S3 バケット、Amazon Redshift クラスターなどの既存の AWS リソースがある場合、独自のカスタム IAM ロールを使用してこれらの既存のリソースへのアクセス許可を指定できるようになりました。これにより、Amazon DataZone ユーザーはパブリケーションとサブスクリプションを活用してこれらのリソースを共有および管理できます。カスタム AWS サービスブループリントを使用すると、Amazon DataZone 管理者は独自のカスタムロールを使用して AWS サービス環境を設定できます。これらの AWS サービス環境のアクションリンクを設定し、既存の AWS リソースへのフェデレーションアクセスを提供できます。これらのカスタム AWS サービス環境でサブスクリプションターゲットとデータソースを設定することもできます。管理者は、独自の Amazon DataZone ドメインアカウント、またはデータの公開、サブスクライブ、検出、管理を行う関連アカウントで AWS サービス環境を設定できます。詳細については、「Amazon DataZone カスタム AWS サービスのブループリント 」を参照してください。

データソース作成フローの機能強化

2024/6/10 リリース

Amazon DataZone では、データソース作成フローに拡張機能を追加し、データプロデューサーのアクセス管理を簡素化しました。これらの更新により、データプロデューサーが AWS Glue および Amazon Redshift アセットを発行するためのデータソースを作成すると、Amazon DataZone はプロジェクトメンバーに読み取り専用アクセス許可を付与します。 AWS Glue データソースを作成すると、Amazon DataZone はデータソースの作成に使用される環境の IAM ロールに「読み取り専用」アクセス許可を自動的に付与し、関連付けられた AWS Glue データベース内のすべてのテーブルへのアクセスを許可します。同様に、Amazon Redshift データソースの場合、Amazon DataZone はデータソースで使用される Amazon Redshift スキーマ内のすべてのテーブルへの「読み取り専用」アクセス許可を付与します。詳細については、の Amazon DataZone データソースを作成して実行する AWS Glue Data CatalogおよびAmazon Redshift の Amazon DataZone データソースを作成して実行するを参照してください。

Amazon DataZone で Amazon SageMaker との統合を開始

2024/5/6 リリース

Amazon DataZone では Amazon SageMaker との統合を開始し、データプロデューサーおよびコンシューマーが Amazon SageMaker にシームレスに切り替えて、データおよび機械学習 (ML) アセットへのアクセスガバナンスを適用しながら、機械学習プロジェクトでコラボレーションできるように支援しています。Amazon DataZone と Amazon SageMaker の新しい組み込み統合により、データコンシューマーおよびプロデューサーはインフラストラクチャのセットアップ全体の ML ガバナンスを合理化し、ビジネスイニシアチブでコラボレーションして、データと ML アセットを簡単に管理できます。詳細については、Amazon DataZone の組み込みブループリントおよびAmazon DataZone の関連付けられているアカウントを参照してください。

Amazon DataZone が AWS Lake Formation ハイブリッドアクセスモードとの統合を開始

2024/4/3 リリース

Amazon DataZone は Lake Formation AWS ハイブリッドアクセスモードとの統合を導入しました。この統合により、最初に AWS Lake Formation に登録しなくても、Amazon DataZone AWS を介して Glue テーブルを簡単に公開および共有できます。開始するには、管理者は Amazon DataZone コンソールの DefaultDataLake ブループリントでデータロケーション登録設定を有効にします。次に、データコンシューマーが IAM アクセス許可で管理されている AWS Glue テーブルにサブスクライブすると、Amazon DataZone はまずこのテーブルの Amazon S3 ロケーションをハイブリッドモードで登録し、 AWS Lake Formation を通じてテーブルに対するアクセス許可を管理することでデータコンシューマーにアクセスを許可します。これにより、既存のワークフローを中断することなく、新しく付与された AWS Lake Formation 許可でテーブルに対する IAM 許可が引き続き存在します。詳細については、「Amazon DataZone と AWS Lake Formation ハイブリッドモードの統合 」を参照してください。

Amazon DataZone が Glue Data Quality AWS との統合を開始

2024/4/3 リリース

Amazon DataZone は AWS Glue Data Quality との統合を開始し、サードパーティーのデータ品質ソリューションのデータ品質メトリクスを統合する APIs を提供します。新しい統合により、 Glue Data Quality AWS スコアを Amazon DataZone ビジネスデータカタログに自動発行できます。Amazon DataZone API を使用して、サードパーティーのソースから品質メトリクスを取り込むことができます。公開されると、データコンシューマーはデータアセットを簡単に検索でき、きめ細かな品質メトリクスを表示し、失敗したチェックとルールを特定できるため、ビジネス上の意思決定が向上します。詳細については、「Amazon DataZone のデータ品質」を参照してください。

Amazon DataZone の説明に関する AI の推奨事項の一般提供リリース

2024/3/27 リリース

Amazon DataZone は、ビジネスデータカタログを強化することで、データ検出、データ理解、データ使用量を改善するための新しい生成 AI ベースの機能の一般提供リリースを発表しました。データプロデューサーはワンクリックで、包括的なビジネスデータの説明とコンテキストを生成し、影響力のある列を強調表示し、分析ユースケースに関する推奨事項を含めることができます。この機能の開始により、データプロデューサーがアセットの説明をプログラムで生成するために使用できる API のサポートが追加されました。詳細については、「Amazon DataZone での機械学習と生成 AI の使用」を参照してください。

Amazon DataZone で Amazon Redshift 統合の機能強化を提供開始

2024/3/21 リリース

Amazon DataZone では、Amazon Redshift 統合にいくつかの機能強化を導入し、Amazon Redshift テーブルおよびビューの公開とサブスクライブのプロセスを簡素化しました。これらの更新により、データプロデューサーとコンシューマーの両方のエクスペリエンスが効率化され、Amazon DataZone 管理者が提供する事前設定された認証情報と接続パラメータを使用してデータウェアハウス環境をすばやく作成できます。さらに、これらの機能強化により、管理者は AWS アカウントと Amazon Redshift クラスター内のリソースを誰がどのような目的で使用できるかをより細かく制御できます。

  • ブループリント設定: DefaultDataWarehouseBlueprint ブループリントを有効にすると、有効化されたブループリントに管理プロジェクトを割り当てることで、アカウント内のどのプロジェクトが DefaultDataWarehouseBlueprint ブループリントを使用して環境プロファイルを作成できるかを制御できます。クラスター、データベース、 AWS シークレットなどのパラメータを指定DefaultDataWarehouseBlueprintすることで、 上にパラメータセットを作成することもできます。Amazon DataZone コンソール内から AWS シークレットを作成することもできます。

  • 環境プロファイル: 環境プロファイルを作成するときに、独自の Amazon Redshift パラメータを指定するか、ブループリント設定のパラメータセットの 1 つを使用するかを選択できます。ブループリント設定で作成されたパラメータセットを使用する場合、 AWS シークレットには AmazonDataZoneDomain タグのみが必要です (AmazonDataZoneProject タグは、環境プロファイルで独自のパラメータセットを指定する場合にのみ必要です)。環境プロファイルでは、許可されたプロジェクトのリストを指定できます。この環境プロファイルを使用してデータウェアハウス環境を作成できるのは、許可されたプロジェクトのみです。また、許可されたプロジェクトが公開できるデータを指定することもできます。現在、以下のオプションから 1 つを選択できます。1) 任意のスキーマから公開する、2) デフォルト環境のスキーマから公開する、3) 公開を許可しない。

  • 環境: データプロデューサーまたはコンシューマーは、 AWS シークレット、クラスター、ワークグループ、データベースなどの独自の Amazon Redshift パラメータを指定することなく、環境プロファイルを選択して環境を作成できるようになりました。これらのパラメータは、環境プロファイルから環境に移植されます。環境の作成に加えて、Amazon DataZone では環境のデフォルトスキーマが作成されるようになりました。プロジェクトのメンバーは、このスキーマへの読み取りアクセスと書き込みアクセスを持ち、環境作成の一環で作成されたデフォルトのデータソースを実行すると、このスキーマで作成されたテーブルをカタログに簡単に公開できます。また、環境を作成するために使用される Amazon Redshift パラメータを使用すれば、(データソース作成時にデータプロデューサーが独自のパラメータを提供しなくても) 新しいデータソースを作成できます。

AWS Amazon DataZone の Cloud Formation サポート

2024/1/18 リリース

Amazon DataZone のユーザーは、 AWS CloudFormation を活用して、Amazon DataZone リソースのスイートを効果的にモデル化および管理できるようになりました。このアプローチにより、リソースの一貫したプロビジョニングが容易になると同時に、コードプラクティスとしてのインフラストラクチャを介したライフサイクル管理も可能になります。カスタムテンプレートを使用すると、必要なリソースとその相互依存関係を正確に定義できます。詳細については、「Amazon DataZone resource type reference」を参照してください。

Amazon DataZone プロジェクトのメンバーとして IAM プリンシパルを直接追加する

2024/1/5 リリース

IAM プリンシパルがまだ Amazon DataZone にログインしていない場合でも (以前の要件)、IAM プリンシパルをプロジェクトメンバーとして追加できるようになりました。ドメイン管理者または IT 管理者がドメインのドメイン実行ロールに iam:GetUseriam:GetRole を追加した後、プロジェクト所有者は、IAM ロールまたは IAM ユーザーの Amazon Resouce Name (ARN) を指定するだけで、メンバーとして IAM プリンシパルを追加できます。IAM プリンシパルは Amazon DataZone へのアクセスに必要な IAM アクセス許可も必要で、これらは IAM コンソールで設定できます。詳細については、「プロジェクトにチームメンバーを追加する」を参照してください。

データポータルからのカスタムアセットタイプのサポート

2024/1/5 リリース

カスタムアセットのサポートにより、Amazon DataZone はデータポータルを介してダッシュボード、クエリ、モデルなどの非構造化データ用にアセットをカタログ化できるため、これまで利用できた API サポートと共に、カスタムアセットをデータポータルに直接追加しやすくなります。Amazon DataZone でカスタムアセットを作成、更新、公開する機能を使用すると、あらゆる種類のアセットを共有、検索、サブスクライブし、それらのアセットのガバナンスを提供するビジネスワークフローを構築できます。詳細については、「Amazon DataZone でカスタムアセットタイプを作成する」を参照してください。

2023

ドメインの削除

2023/12/27 リリース

これは、より簡単にドメインを削除できる機能です。これで、ドメインが空でない場合 (つまり、プロジェクト、環境、アセット、データソースなどが含まれている場合) でも、ドメインの削除を続行できるようになりました。詳細については、「Amazon DataZone ドメインを削除する」を参照してください。

ハイブリッドモード

2023/12/22 リリース

Amazon DataZone に AWS Lake Formation ハイブリッドモードのサポートが追加されました。このサポートにより、ハイブリッドモードで Lake Formation に登録された AWS S3 ロケーションで AWS Glue テーブルを Amazon DataZone に公開する場合、Amazon DataZone はこのテーブルをマネージドアセットとして扱い、このテーブルへのサブスクリプション許可を管理できます。この機能リリース以前では、Amazon DataZone はこのテーブルをアンマネージドアセットとして扱います。つまり、Amazon DataZone はこのテーブルにサブスクリプションを付与できません。詳細については、「Amazon DataZone に Lake Formation アクセス許可を設定する」を参照してください。

HIPAA 適格性

2023/12/14 リリース

Amazon DataZone は現在、U.S. Health Insurance Portability and Accountability Act of 1996 (1996 年の米国における医療保険の相互運用性と説明責任に関する法令、HIPAA) に準拠しています。HIPAA 準拠 AWS のサービスのリストを表示するには、https://aws.amazon.com/compliance/hipaa-eligible-services-reference/ を参照してください。

Amazon DataZone の説明に関する AI の推奨事項 (プレビュー)

2023/11/28 リリース

AWS は、Amazon DataZone の新しい生成 AI ベースの機能のプレビューを発表しました。これにより、ビジネスデータカタログを強化することで、データ検出、データ理解、データ使用量が向上します。データプロデューサーはワンクリックで、包括的なビジネスデータの説明とコンテキストを生成し、影響力のある列を強調表示し、分析ユースケースに関する推奨事項を含めることができます。Amazon DataZone の説明に関する AI の推奨事項により、データコンシューマーは分析に必要なデータテーブルと列を特定できるため、データ検出可能性が向上し、データプロデューサーとのやりとりが減少します。プレビューは、米国東部 (バージニア北部)、米国西部 (オレゴン) の各 AWS リージョンでプロビジョニングされた Amazon DataZone ドメインで利用できます。詳細については、「Amazon DataZone での機械学習と生成 AI の使用」を参照してください。

DefaultDataLake ブループリントの機能強化

2023/11/20 リリース

Amazon DataZone は、DefaultDataLake ブループリントに拡張を追加しました。これにより、 AWS アカウントからどのデータを発行できるかをより適切に制御できます。この機能のリリースで導入された主な変更点が 2 つあります。

  • コンソールで DefaultDataLake ブループリントを有効にすると、有効化されたブループリントに管理プロジェクトを割り当てることで、アカウントの DefaultDataLake ブループリントを使用して環境プロファイルを作成できるプロジェクトを制御できます。

  • 2 番目の変更は ポータルに関することです。DefaultDataLake ブループリントを使用して環境プロファイルを作成する場合、環境プロファイルを使用して環境を作成する権限のある許可されたプロジェクトを選択することもできます。デフォルトでは、すべてのプロジェクトでデータレイク環境プロファイルを使用できますが、環境プロファイルを特定のプロジェクトに制限したり、プロファイルで作成された環境を使用して公開できるデータを制御したりすることもできます。

詳細については、「環境ファイルを作成する」を参照してください。