DataZone Integrierte Pläne von Amazon - Amazon DataZone

Die vorliegende Übersetzung wurde maschinell erstellt. Im Falle eines Konflikts oder eines Widerspruchs zwischen dieser übersetzten Fassung und der englischen Fassung (einschließlich infolge von Verzögerungen bei der Übersetzung) ist die englische Fassung maßgeblich.

DataZone Integrierte Pläne von Amazon

Ein Blueprint, mit dem eine Umgebung erstellt wird, definiert, welche Tools und Dienste Mitglieder des Projekts, zu dem die Umgebung gehört, verwenden können, wenn sie mit Ressourcen im DataZone Amazon-Katalog arbeiten. In der aktuellen Version von Amazon DataZone gibt es die folgenden integrierten Blueprints:

  • Bauplan für einen Data Lake

  • Bauplan für ein Data Warehouse

  • SageMaker Amazon-Entwurf

Sie können die Schritte der folgenden Verfahren ausführen, um Standard-Blueprints in Amazon DataZone zu aktivieren:

Aktivieren Sie integrierte Blueprints in dem AWS Konto, dem die DataZone Amazon-Domain gehört

Ein Blueprint, mit dem eine Umgebung erstellt wird, definiert, welche Tools und Dienste Mitglieder des Projekts, zu dem die Umgebung gehört, verwenden können, wenn sie mit Ressourcen im DataZone Amazon-Katalog arbeiten.

In der aktuellen Version von Amazon DataZone gibt es mehrere integrierte Blueprints: Data Lake Blueprint, Data Warehouse Blueprint und Amazon Blueprint. SageMaker

  • Der Data Lake-Blueprint enthält die Definition für den Start und die Konfiguration einer Reihe von Diensten (AWS Glue, AWS Lake Formation, Amazon Athena) zur Veröffentlichung und Verwendung von Data Lake-Assets im DataZone Amazon-Katalog.

  • Der Data Warehouse-Blueprint enthält die Definition für den Start und die Konfiguration einer Reihe von Diensten (Amazon Redshift) zur Veröffentlichung und Verwendung von Amazon Redshift Redshift-Assets im Amazon-Katalog. DataZone

  • Amazon SageMaker Blueprint enthält die Definition für den Start und die Konfiguration einer Reihe von Diensten (Amazon SageMaker Studio) zur Veröffentlichung und Verwendung von SageMaker Amazon-Ressourcen im DataZone Amazon-Katalog.

Weitere Informationen finden Sie unter DataZone Amazon-Terminologie und Konzepte.

Bei der Erstellung einer DataZone Amazon-Domain haben Sie die Möglichkeit, das Schnell-Setup zu wählen, das automatisch den Standard-Data Lake und die integrierten Standard-Data Warehouse-Blueprints als Teil des Domain-Erstellungsprozesses aktiviert. Quick Setup erstellt mithilfe dieser integrierten Blueprints auch Standardumgebungsprofile und Standardumgebungen für Sie.

Wenn Sie bei der Erstellung Ihrer DataZone Amazon-Domain nicht die Option Schnelleinrichtung wählen, können Sie wie folgt vorgehen, um die verfügbaren integrierten Blueprints in dem AWS Konto zu aktivieren, das diese DataZone Amazon-Domain beherbergt. Sie müssen diese integrierten Blueprints aktivieren, bevor Sie sie verwenden können, um Umgebungsprofile und Umgebungen in dieser Domain zu erstellen.

Um integrierte Blueprints in einer DataZone Amazon-Domain über die DataZone Amazon-Managementkonsole zu aktivieren, müssen Sie eine IAM-Rolle in dem Konto mit Administratorberechtigungen annehmen. Konfigurieren Sie die IAM-Berechtigungen, die für die Nutzung der Amazon DataZone Management Console erforderlich sindum die Mindestberechtigungen zu erhalten.

Integrierte Blueprints in einer DataZone Amazon-Domain aktivieren
  1. Navigieren Sie zur DataZone Amazon-Konsole unter https://console.aws.amazon.com/datazone und melden Sie sich mit Ihren Kontoanmeldeinformationen an.

  2. Wählen Sie Domains anzeigen und wählen Sie die Domain aus, für die Sie einen oder mehrere integrierte Blueprints aktivieren möchten.

  3. Navigieren Sie auf der Seite mit den Domain-Details zur Registerkarte Blueprints.

  4. Wählen Sie aus der Blueprint-Liste entweder den DefaultDataLakeoder den oder den DefaultDataWarehouse SageMakerAmazon-Blueprint aus.

  5. Wählen Sie auf der Detailseite des ausgewählten Blueprints die Option In diesem Konto aktivieren aus.

  6. Geben Sie auf der Seite „Berechtigungen und Ressourcen“ Folgendes an:

    • Wenn Sie den DefaultDataLakeBlueprint aktivieren, geben Sie für die Rolle Glue Manage Access eine neue oder bestehende Servicerolle an, die Amazon die DataZone Autorisierung erteilt, den Zugriff auf Tabellen in AWS Glue und AWS Lake Formation aufzunehmen und zu verwalten.

    • Wenn Sie den DefaultDataWarehouseBlueprint aktivieren, geben Sie für die Rolle Redshift Manage Access eine neue oder bestehende Servicerolle an, die Amazon die DataZone Autorisierung erteilt, den Zugriff auf Datashares, Tabellen und Ansichten in Amazon Redshift aufzunehmen und zu verwalten.

    • Wenn Sie den SageMakerAmazon-Blueprint aktivieren, geben Sie für die Rolle „Zugriff SageMaker verwalten“ eine neue oder bestehende Servicerolle an, die Amazon DataZone Berechtigungen zur Veröffentlichung von SageMaker Amazon-Daten im Katalog erteilt. Es gibt Amazon auch die DataZone Erlaubnis, Zugriff auf von Amazon SageMaker veröffentlichte Assets im Katalog zu gewähren oder den Zugriff zu widerrufen.

      Wichtig

      Wenn Sie den SageMakerAmazon-Blueprint aktivieren, DataZone prüft Amazon, ob die folgenden IAM-Rollen für Amazon im aktuellen Konto und in der Region DataZone existieren. Wenn diese Rollen nicht existieren, erstellt Amazon sie DataZone automatisch.

      • AmazonDataZoneGlueAccess- <region>- <domainId>

      • AmazonDataZoneRedshiftAccess- <region>- <domainId>

    • Geben Sie für die Bereitstellungsrolle eine neue oder bestehende Servicerolle an, die Amazon die DataZone Autorisierung erteilt, Umgebungsressourcen mithilfe AWS CloudFormation des Umgebungskontos und der Region zu erstellen und zu konfigurieren.

    • Wenn Sie den SageMakerAmazon-Blueprint aktivieren, geben Sie für die Datenquelle Amazon S3-Bucket SageMaker für -Glue einen Amazon S3 S3-Bucket an, der von allen SageMaker Umgebungen im AWS Konto verwendet werden soll. Das von Ihnen angegebene Bucket-Präfix muss eines der folgenden sein:

      • Amazon-Datazone*

      • Datazone-Sagemaker*

      • Sagemaker-Datazone*

      • DataZone-Sagemaker*

      • Salbeimacher- * DataZone

      • DataZone-SageMaker*

      • SageMaker-DataZone*

  7. Wählen Sie Blueprint aktivieren.

Sobald Sie die ausgewählten Blueprints aktiviert haben, können Sie steuern, welche Projekte die Blueprints in Ihrem Konto verwenden können, um Umgebungsprofile zu erstellen. Sie können dies tun, indem Sie der Konfiguration des Blueprints die Verwaltung von Projekten zuweisen.

Wichtig

Standardmäßig sind für die Umgebungs-Blueprints keine Verwaltungsprojekte angegeben, was bedeutet, dass jeder DataZone Amazon-Benutzer Profile für einen Umgebungs-Blueprint erstellen kann. Es wird daher dringend empfohlen, dass Sie immer Verwaltungsprojekte für Ihre Umgebungs-Blueprints angeben, um eine bessere Verwaltung zu gewährleisten.

Geben Sie die Verwaltung von Projekten auf aktivierten Blueprints an
  1. Navigieren Sie zur DataZone Amazon-Konsole unter https://console.aws.amazon.com/datazone und melden Sie sich mit Ihren Kontoanmeldeinformationen an.

  2. Wählen Sie Domains anzeigen und wählen Sie dann die Domain aus, zu der Sie die Verwaltungsprojekte für die ausgewählten Blueprints hinzufügen möchten.

  3. Wählen Sie die Registerkarte Blueprints und dann den Blueprint aus, mit dem Sie arbeiten möchten.

  4. Standardmäßig können alle Projekte innerhalb der Domain die DefaultDataLake oder oder die SageMaker Amazon-Blueprints im Konto verwenden DefaultDataWareshouse, um Umgebungsprofile zu erstellen. Sie können dies jedoch einschränken, indem Sie den Blueprints die Verwaltung von Projekten zuweisen. Um Verwaltungsprojekte hinzuzufügen, wählen Sie Verwaltungsprojekt auswählen aus, wählen Sie dann im Dropdownmenü die Projekte aus, die Sie als Verwaltungsprojekte hinzufügen möchten, und wählen Sie dann Verwaltungsprojekte auswählen aus.

Sobald Sie den DefaultDataWarehouse Blueprint in Ihrem AWS Konto aktiviert haben, können Sie der Blueprint-Konfiguration Parametersätze hinzufügen. Ein Parametersatz ist eine Gruppe von Schlüsseln und Werten, die Amazon benötigt, um eine Verbindung DataZone zu Ihrem Amazon Redshift Redshift-Cluster herzustellen, und wird zur Erstellung von Data Warehouse-Umgebungen verwendet. Zu diesen Parametern gehören der Name Ihres Amazon Redshift Redshift-Clusters, die Datenbank und das AWS Geheimnis, das die Anmeldeinformationen für den Cluster enthält.

Hinzufügen von Parametersätzen zum Blueprint DefaultDataWarehouse
  1. Navigieren Sie zur DataZone Amazon-Konsole unter https://console.aws.amazon.com/datazone und melden Sie sich mit Ihren Kontoanmeldeinformationen an.

  2. Wählen Sie Domains anzeigen und wählen Sie dann die Domain aus, zu der Sie den Parametersatz hinzufügen möchten.

  3. Wählen Sie die Registerkarte Blueprints und dann den DefaultDataWareshouse Blueprint aus, um die Blueprint-Detailseite zu öffnen.

  4. Wählen Sie auf der Blueprint-Detailseite auf der Registerkarte Parametersätze die Option Parametersatz erstellen aus.

    • Geben Sie einen Namen für den Parametersatz ein.

    • Geben Sie optional eine Beschreibung für den Parametersatz ein.

    • Region auswählen

    • Wählen Sie entweder Amazon Redshift Cluster oder Amazon Redshift Serverless aus.

    • Wählen Sie den AWS geheimen ARN aus, der die Anmeldeinformationen für den ausgewählten Amazon Redshift-Cluster oder die Amazon Redshift Serverless-Arbeitsgruppe enthält. Das AWS Geheimnis muss mit dem AmazonDataZoneDomain : [Domain_ID] Tag gekennzeichnet sein, um innerhalb eines Parametersatzes verwendet werden zu können.

      • Wenn Sie noch kein AWS Geheimnis haben, können Sie auch ein neues Geheimnis erstellen, indem Sie Neues AWS Geheimnis erstellen wählen. Dadurch wird ein Dialogfeld geöffnet, in dem Sie den Namen des Geheimnisses, den Benutzernamen und das Passwort angeben können. Sobald Sie Create New AWS Secret wählen, DataZone erstellt Amazon ein neues Secret im AWS Secrets Manager-Service und stellt sicher, dass das Secret mit der Domain gekennzeichnet ist, in der Sie versuchen, den Parametersatz zu erstellen.

    • Wenn Sie im obigen Schritt Amazon Redshift Redshift-Cluster ausgewählt haben, wählen Sie jetzt einen Cluster aus der Drop-down-Liste aus. Wenn Sie im obigen Schritt Amazon Redshift Redshift-Arbeitsgruppe ausgewählt haben, wählen Sie jetzt eine Arbeitsgruppe aus dem Drop-down-Menü aus.

    • Geben Sie den Namen der Datenbank innerhalb des ausgewählten Amazon Redshift-Clusters oder der Amazon Redshift Serverless-Arbeitsgruppe ein.

    • Wählen Sie Parametersatz erstellen.

Anmerkung

Sie können dem DefaultDataWarehouse Blueprint nur bis zu 10 Parametersätze hinzufügen.

Sobald Sie den SageMaker Amazon-Blueprint in Ihrem AWS Konto aktiviert haben, können Sie der Blueprint-Konfiguration Parametersätze hinzufügen. Ein Parametersatz ist eine Gruppe von Schlüsseln und Werten, die Amazon benötigt, um eine Verbindung DataZone zu Ihrem Amazon herzustellen, SageMaker und wird verwendet, um Sagemaker-Umgebungen zu erstellen.

Hinzufügen von Parametersätzen zum SageMaker Amazon-Blueprint
  1. Navigieren Sie zur DataZone Amazon-Konsole unter https://console.aws.amazon.com/datazone und melden Sie sich mit Ihren Kontoanmeldeinformationen an.

  2. Wählen Sie Domains anzeigen und wählen Sie dann die Domain aus, die den aktivierten Blueprint enthält, zu dem Sie den Parametersatz hinzufügen möchten.

  3. Wählen Sie die Registerkarte Blueprints und dann den SageMaker Amazon-Blueprint aus, um die Detailseite des Blueprints zu öffnen.

  4. Wählen Sie auf der Blueprint-Detailseite auf der Registerkarte Parametersätze die Option Parametersatz erstellen aus und geben Sie dann Folgendes an:

    • Geben Sie einen Namen für den Parametersatz ein.

    • Geben Sie optional eine Beschreibung für den Parametersatz ein.

    • Geben Sie den SageMaker Amazon-Domain-Authentifizierungstyp an. Sie können entweder IAM oder IAM Identity Center (SSO) wählen.

    • Geben Sie eine Region an AWS .

    • Geben Sie einen AWS KMS-Schlüssel für die Datenverschlüsselung an. Sie können einen vorhandenen Schlüssel auswählen oder einen neuen Schlüssel erstellen.

    • Geben Sie unter Umgebungsparameter Folgendes an:

      • VPC-ID — die ID, die Sie für die VPC der SageMaker Amazon-Umgebung verwenden. Sie können eine bestehende VPC angeben oder eine neue erstellen.

      • Subnetze — eines oder mehrere IDs für einen Bereich von IP-Adressen für bestimmte Ressourcen innerhalb Ihrer VPC.

      • Netzwerkzugriff — wählen Sie entweder Nur VPC oder Nur öffentliches Internet.

      • Sicherheitsgruppe — Die Sicherheitsgruppe, die bei der Konfiguration von VPC und Subnetzen verwendet werden soll.

    • Wählen Sie unter Datenquellenparameter eine der folgenden Optionen aus:

      • AWS Nur Glue

      • AWS Glue + Amazon Redshift Serverless. Wenn Sie diese Option wählen, geben Sie Folgendes an:

        • Geben Sie den AWS geheimen ARN an, der die Anmeldeinformationen für den ausgewählten Amazon Redshift Redshift-Cluster enthält. Der AWS geheime Schlüssel muss mit dem AmazonDataZoneDomain : [Domain_ID] Tag gekennzeichnet sein, um innerhalb eines Parametersatzes verwendet werden zu können.

          Wenn Sie noch kein AWS Geheimnis haben, können Sie auch ein neues Geheimnis erstellen, indem Sie Neues AWS Geheimnis erstellen wählen. Dadurch wird ein Dialogfeld geöffnet, in dem Sie den Namen des Geheimnisses, den Benutzernamen und das Passwort angeben können. Sobald Sie Create New AWS Secret wählen, DataZone erstellt Amazon ein neues Secret im AWS Secrets Manager-Service und stellt sicher, dass das Secret mit der Domain gekennzeichnet ist, in der Sie versuchen, den Parametersatz zu erstellen.

        • Geben Sie die Amazon Redshift Redshift-Arbeitsgruppe an, die Sie beim Erstellen von Umgebungen verwenden möchten.

        • Geben Sie den Namen der Datenbank (innerhalb der von Ihnen ausgewählten Arbeitsgruppe) an, die Sie beim Erstellen von Umgebungen verwenden möchten.

      • AWS Nur Glue + Amazon Redshift Cluster

        • Geben Sie den AWS geheimen ARN an, der die Anmeldeinformationen für den ausgewählten Amazon Redshift Redshift-Cluster enthält. Der AWS geheime Schlüssel muss mit dem AmazonDataZoneDomain : [Domain_ID] Tag gekennzeichnet sein, um innerhalb eines Parametersatzes verwendet werden zu können.

          Wenn Sie noch kein AWS Geheimnis haben, können Sie auch ein neues Geheimnis erstellen, indem Sie Neues AWS Geheimnis erstellen wählen. Dadurch wird ein Dialogfeld geöffnet, in dem Sie den Namen des Geheimnisses, den Benutzernamen und das Passwort angeben können. Sobald Sie Create New AWS Secret wählen, DataZone erstellt Amazon ein neues Secret im AWS Secrets Manager-Service und stellt sicher, dass das Secret mit der Domain gekennzeichnet ist, in der Sie versuchen, den Parametersatz zu erstellen.

        • Geben Sie den Amazon Redshift Redshift-Cluster an, den Sie beim Erstellen von Umgebungen verwenden möchten.

        • Geben Sie den Namen der Datenbank (innerhalb des von Ihnen ausgewählten Clusters) an, die Sie beim Erstellen von Umgebungen verwenden möchten.

  5. Wählen Sie Parametersatz erstellen aus.

Fügen Sie Amazon SageMaker als vertrauenswürdigen Service zu dem AWS Konto hinzu, dem die DataZone Amazon-Domain gehört

Wenn Sie den SageMaker Amazon-Blueprint aktiviert haben, müssen Sie ihn auch SageMaker als einen der vertrauenswürdigen Dienste innerhalb von Amazon DataZone hinzufügen. Gehen Sie dazu wie folgt vor:

  1. Navigieren Sie zur DataZone Amazon-Konsole unter https://console.aws.amazon.com/datazone und melden Sie sich mit Ihren Kontoanmeldeinformationen an.

  2. Wählen Sie Domains anzeigen und wählen Sie dann die Domain aus, die den aktivierten Blueprint enthält. SageMaker

  3. Wählen Sie die Trusted Services, dann Amazon SageMaker und dann Enable aus.