Datenfreigabe in Amazon Redshift - Amazon Redshift

Amazon Redshift unterstützt ab dem 1. November 2025 nicht mehr die Erstellung neuer Python-UDFs. Wenn Sie Python-UDFs verwenden möchten, erstellen Sie die UDFs vor diesem Datum. Bestehende Python-UDFs funktionieren weiterhin wie gewohnt. Weitere Informationen finden Sie im Blog-Posting.

Datenfreigabe in Amazon Redshift

Mit Amazon Redshift können Sie Daten sicher über Amazon-Redshift-Cluster oder mit anderen AWS-Services teilen. Über die Datenfreigabe können Sie Live-Daten teilen, ohne sie kopieren oder verschieben zu müssen. Datenbankadministratoren und Dateningenieure können die Datenfreigabe verwenden, um einen sicheren, schreibgeschützten Zugriff auf Daten zu Analytikzwecken zu ermöglichen und gleichzeitig die Kontrolle über die Daten zu behalten. Datenanalysten, Business-Intelligence-Experten und Datenwissenschaftler können freigegebene Daten nutzen, um Erkenntnisse zu gewinnen, ohne Daten duplizieren oder verschieben zu müssen. Häufige Anwendungsfälle sind die Freigabe von Daten für Partner, die Ermöglichung funktionsübergreifender Analysen und die Unterstützung der Datendemokratisierung innerhalb einer Organisation. In den folgenden Abschnitten werden die Details der Konfiguration und Verwaltung der Datenfreigabe in Amazon Redshift behandelt.

Mit der Datenfreigabe von Amazon Redshift können Sie den Lesezugriff für Live-Daten in Amazon-Redshift-Clustern, Arbeitsgruppen, AWS-Konten und AWS-Regionen auf sichere Weise freigeben, ohne Daten manuell verschieben oder kopieren zu müssen. Da die Daten live sind, können alle Benutzer die aktuellen und konsistentesten Informationen in Amazon Redshift sehen, sobald sie aktualisiert wird.

Sie können Daten für mehrere bereitgestellte Cluster, Serverless-Arbeitsgruppen, Availability Zones, AWS-Konten und AWS-Regionen freigeben. Die Daten können zwischen Cluster-Typen sowie zwischen bereitgestellten Clustern und Serverless geteilt werden.

Sie können Datenbankobjekte sowohl für Lese- als auch für Schreibvorgänge in verschiedenen Amazon-Redshift-Clustern oder Amazon-Redshift-Serverless-Arbeitsgruppen innerhalb desselben AWS-Konto oder von einem AWS-Konto zu einem anderen freigeben. Sie können Daten auch regionsübergreifend lesen und schreiben. Sie können Berechtigungen wie SELECT, INSERT und UPDATE für verschiedene Tabellen und USAGE und CREATE für verschiedene Schemata gewähren. Die Daten sind live und für alle Warehouses verfügbar, sobald eine Schreibtransaktion festgeschrieben wurde.

Anwendungsfälle für Datenfreigabe mit Amazon Redshift

Die Amazon-Redshift-Datenfreigabe ist besonders für folgende Anwendungsfälle nützlich:

  • Unterstützung verschiedener Arten geschäftskritischer Workloads – Verwenden Sie einen zentralen Extract, Transform, Load (ETL)-Cluster, der Daten mit mehreren Business Intelligence (BI) oder Analyse-Clustern gemeinsam verwendet. Dieser Ansatz bietet Lese-Workload-Isolation und Rückbelastung für einzelne Workloads. Sie können Ihre individuelle Workload-Rechenleistung entsprechend den Workload-spezifischen Preis- und Leistungsanforderungen anpassen und skalieren.

  • Gruppenübergreifende Zusammenarbeit – Ermöglicht nahtlose Zusammenarbeit zwischen Teams und Unternehmensgruppen für umfassendere Analysen, Datenwissenschaft und produktübergreifende Wirkungsanalysen.

  • Bereitstellung von Daten als Service – Teilen Sie Daten als Service in Ihrer gesamten Organisation.

  • Freigabe von Daten zwischen Umgebungen – Teilen Sie Daten in Entwicklungs-, Test- und Produktionsumgebungen. Sie können die Teamagilität verbessern, indem Sie Daten auf verschiedenen Granularitätsstufen teilen.

  • Lizenzierung des Zugriffs auf Daten in Amazon Redshift  – Listet Amazon-Redshift-Datensätze im AWS Data Exchange-Katalog auf, den Kunden in wenigen Minuten auffinden, abonnieren und abfragen können.

Anwendungsfälle für die Datenfreigabe mit Schreibzugriff

Für die Datenfreigabe bei Schreiboperationen gibt es mehrere wichtige Anwendungsfälle:

  • Aktualisieren geschäftlicher Quelldaten im Produzenten: Sie können Daten organisationsweit als Service freigeben. In diesem Fall können Konsumenten auch Aktionen für die Quelldaten ausführen. Sie können beispielsweise aktuelle Werte zurückmelden oder den Empfang von Daten bestätigen. Dies sind nur einige mögliche geschäftliche Anwendungsfälle.

  • Einfügen zusätzlicher Datensätze auf dem Produzenten: Konsumenten können den ursprünglichen Quelldaten Datensätze hinzufügen. Sie können als vom Konsumenten stammend markiert werden, wenn notwendig.

Informationen speziell dazu, wie Schreiboperationen in einem Datashare ausgeführt werden, finden Sie unter Freigabe des Schreibzugriffs auf Daten.

Dateifreigabe auf verschiedenen Ebenen in Amazon Redshift

Mit Amazon Redshift können Sie Daten auf verschiedenen Ebenen teilen. Diese Ebenen umfassen Datenbanken, Schemas, Tabellen, Ansichten (einschließlich regulärer, späterbindender und materialisierter Ansichten) sowie benutzerdefinierte SQL-Funktionen (UDFs). Sie können mehrere Datashares für eine bestimmte Datenbank erstellen. Ein Datashare kann Objekte aus mehreren Schemas in der Datenbank enthalten, für die eine Freigabe erfolgt.

Durch diese Flexibilität beim Teilen von Daten erhalten Sie eine differenzierte Zugriffskontrolle. Sie können dieses Steuerelement für verschiedene Benutzer und Unternehmen anpassen, die Zugriff auf Amazon-Redshift-Daten benötigen.

Konsistenzmanagement für die Datenfreigabe in Amazon Redshift

Amazon Redshift bietet Transaktionskonsistenz in allen Produzenten- und Konsumenten-Clustern und teilt aktuelle und konsistente Ansichten der Daten mit allen Verbrauchern.

Sie können Daten im Produzenten-Cluster kontinuierlich aktualisieren. Alle Abfragen in einem Konsumenten-Cluster innerhalb einer Transaktion lesen den gleichen Status der freigegebenen Daten. Amazon Redshift berücksichtigt nicht die Daten, die durch eine andere Transaktion im Produzenten-Cluster geändert wurden, die nach dem Beginn der Transaktion im Konsumenten-Cluster festgeschrieben wurden. Nachdem die Datenänderung im Produzenten-Cluster festgeschrieben wurde, können neue Transaktionen im Konsumenten-Cluster die aktualisierten Daten sofort abfragen.

Durch die starke Konsistenz werden die Risiken von Geschäftsberichten mit niedrigerer Detailtreue entfernt, die während der Freigabe von Daten möglicherweise ungültige Ergebnisse enthalten. Dieser Faktor ist besonders wichtig für Finanzanalysen oder wo die Ergebnisse verwendet werden könnten, um Datensätze vorzubereiten, die zum Trainieren von Modellen für Machine Learning verwendet werden.