Freigeben lizenzierter Amazon-Redshift-Daten in AWS Data Exchange - Amazon Redshift

Amazon Redshift unterstützt ab dem 1. November 2025 nicht mehr die Erstellung neuer Python-UDFs. Wenn Sie Python-UDFs verwenden möchten, erstellen Sie die UDFs vor diesem Datum. Bestehende Python-UDFs funktionieren weiterhin wie gewohnt. Weitere Informationen finden Sie im Blog-Posting.

Freigeben lizenzierter Amazon-Redshift-Daten in AWS Data Exchange

Beim Erstellen von AWS Data Exchange-Datashares und Hinzufügen zu einem AWS Data Exchange-Produkt können Anbieter Daten in Amazon Redshift lizenzieren, die Produzenten in Amazon Redshift erkennen, abonnieren und dafür Aktualisierungen abfragen können, wenn sie aktive AWS Data Exchange-Abonnements haben.

Mit AWS Data Exchange-Datashares, die zu einem AWS Data Exchange-Produkt hinzugefügt wurden, haben Verbraucher automatisch Zugriff auf die Datashares des Produkts, wenn ihr Abonnement beginnt, und behalten den Zugriff bei, solange das Abonnement aktiv ist.

Arbeiten mit AWS Data Exchange-Datashares als Konsument

Mit Amazon Redshift können Sie auf Datensätze in AWS Data Exchange zugreifen und sie analysieren, ohne Kopien der Daten speichern oder verwalten zu müssen.

Wenn Sie ein Konsument sind, führen Sie diese Schritte aus, um Datenprodukte zu ermitteln, die AWS Data Exchange-Datashares enthalten und Amazon-Redshift-Daten abfragen:

  1. Erkennen und abonnieren Sie über die AWS Data Exchange-Konsole Datenprodukte, die AWS Data Exchange-Datashares enthalten.

    Sobald Ihr Abonnement beginnt, können Sie auf lizenzierte Amazon-Redshift-Daten zugreifen, die als Komponenten in Datensätze importiert werden, die AWS Data Exchange-Datashares enthalten.

    Weitere Informationen über erste Schritte bei der Verwendung von Datenprodukten, die AWS Data Exchange-Datashares enthalten, finden Sie unter Abonnieren von Datenprodukten auf AWS Data Exchange.

  2. Erstellen Sie auf der Amazon-Redshift-Konsole bei Bedarf einen Amazon-Redshift-Cluster.

    Weitere Informationen zum Erstellen eines Clusters finden Sie unter Erstellen eines Clusters.

  3. Listen Sie die Datashares auf, die Ihnen zur Verfügung gestellt werden, und zeigen Sie deren Inhalt an. Weitere Informationen erhalten Sie unter DESC DATASHARE und SHOW DATASHARES.

    Im folgenden Beispiel werden die Informationen zu eingehenden Datashares eines angegebenen Produzenten-Namespaces angezeigt. Wenn Sie DESC DATASHARE als Konsumenten-Administrator ausführen, müssen Sie die Option ACCOUNT und NAMESPACE angeben, um eingehende Datashares anzuzeigen.

    DESC DATASHARE salesshare of ACCOUNT '123456789012' NAMESPACE '13b8833d-17c6-4f16-8fe4-1a018f5ed00d'; producer_account | producer_namespace | share_type | share_name | object_type | object_name | include_new -------------------+--------------------------------------+------------+------------+-------------+---------------------------------+------------------ 123456789012 | 13b8833d-17c6-4f16-8fe4-1a018f5ed00d | INBOUND | salesshare | table | public.tickit_users_redshift | 123456789012 | 13b8833d-17c6-4f16-8fe4-1a018f5ed00d | INBOUND | salesshare | table | public.tickit_venue_redshift | 123456789012 | 13b8833d-17c6-4f16-8fe4-1a018f5ed00d | INBOUND | salesshare | table | public.tickit_category_redshift | 123456789012 | 13b8833d-17c6-4f16-8fe4-1a018f5ed00d | INBOUND | salesshare | table | public.tickit_date_redshift | 123456789012 | 13b8833d-17c6-4f16-8fe4-1a018f5ed00d | INBOUND | salesshare | table | public.tickit_event_redshift | 123456789012 | 13b8833d-17c6-4f16-8fe4-1a018f5ed00d | INBOUND | salesshare | table | public.tickit_listing_redshift | 123456789012 | 13b8833d-17c6-4f16-8fe4-1a018f5ed00d | INBOUND | salesshare | table | public.tickit_sales_redshift | 123456789012 | 13b8833d-17c6-4f16-8fe4-1a018f5ed00d | INBOUND | salesshare | schema | public | 123456789012 | 13b8833d-17c6-4f16-8fe4-1a018f5ed00d | INBOUND | salesshare | view | public.sales_data_summary_view |

    Nur Cluster-Superuser können dies tun. Sie können SVV_DATASHARES auch verwenden, um die Datashares anzuzeigen, und SVV_DATASHARE_OBJECTS, um die Objekte innerhalb des Datashares anzuzeigen.

    Im folgenden Beispiel werden die eingehenden Datashares in einem Konsumenten-Cluster angezeigt.

    SHOW DATASHARES LIKE 'sales%'; share_name | share_owner | source_database | consumer_database | share_type | createdate | is_publicaccessible | share_acl | producer_account | producer_namespace ------------+-------------+-----------------+-------------------+------------+------------+---------------------+-----------+------------------+-------------------------------------- salesshare | | | | INBOUND | | t | | 123456789012 | 13b8833d-17c6-4f16-8fe4-1a018f5ed00d
  4. Erstellen Sie lokale Datenbanken, die auf die Datashares verweisen. Sie müssen die Option ACCOUNT und NAMESPACE angeben, um lokale Datenbanken für AWS Data Exchange-Datashares zu erstellen. Weitere Informationen finden Sie unter CREATE DATABASE.

    CREATE DATABASE sales_db FROM DATASHARE salesshare OF ACCOUNT '123456789012' NAMESPACE '13b8833d-17c6-4f16-8fe4-1a018f5ed00d';

    Wenn Sie eine genauere Kontrolle über den Zugriff auf die Objekte in der lokalen Datenbank wünschen, verwenden Sie beim Erstellen der Datenbank die WITH PERMISSIONS-Klausel. Auf diese Weise können Sie in Schritt 6 Berechtigungen auf Objektebene für Objekte in der Datenbank gewähren.

    CREATE DATABASE sales_db WITH PERMISSIONS FROM DATASHARE salesshare OF ACCOUNT '123456789012' NAMESPACE '13b8833d-17c6-4f16-8fe4-1a018f5ed00d';

    Sie können Datenbanken sehen, die Sie durch Abfrage der SVV_REDSHIFT_DATABASES-Ansicht aus dem Datashare erstellt haben. Sie können eine direkte Verbindung zu diesen Datenbanken herstellen oder eine Verbindung zu einer lokalen Datenbank in Ihrem Konsumenten-Cluster herstellen und eine datenbankübergreifende Abfrage ausführen, um die Daten aus den Datashare-Datenbanken abzufragen. Sie können kein Datashare auf Datenbankobjekten erstellen, die aus einem vorhandenen Datashare erstellt wurden. Sie können die Daten jedoch in eine separate Tabelle im Konsumenten-Cluster kopieren, alle erforderlichen Verarbeitungsvorgänge durchführen und dann die neu erstellten Objekte freigeben.

    Sie können auch die Amazon-Redshift-Konsole verwenden, um Datenbanken aus Datashares zu erstellen. Weitere Informationen finden Sie unter Erstellen von Datenbanken aus Datashares.

  5. (Optional) Erstellen Sie externe Schemas, um auf bestimmte Schemas in der Konsumenten-Datenbank zu verweisen, die im Konsumenten-Cluster importiert wurden, und weisen Sie granulare Berechtigungen zu. Weitere Informationen finden Sie unter CREATE EXTERNAL SCHEMA.

    CREATE EXTERNAL SCHEMA sales_schema FROM REDSHIFT DATABASE 'sales_db' SCHEMA 'public';
  6. Gewähren Sie Benutzern oder Rollen im Konsumenten-Cluster nach Bedarf Berechtigungen für Datenbanken und Schemareferenzen, die aus den Datashares erstellt wurden. Weitere Informationen finden Sie unter GRANT oder REVOKE.

    GRANT USAGE ON DATABASE sales_db TO Bob;
    GRANT USAGE ON SCHEMA sales_schema TO ROLE Analyst_role;

    Wenn Sie Ihre Datenbank ohne WITH PERMISSIONS erstellt haben, können Sie Ihren Benutzern und Rollen nur Berechtigungen für die gesamte aus dem Datashare erstellte Datenbank gewähren. In einigen Fällen benötigen Sie feinkörnige Steuerelemente für eine Teilmenge von Datenbankobjekten, die aus dem Datashare erstellt wurden. Wenn dies der Fall ist, können Sie eine externe Schemareferenz erstellen, die auf bestimmte Schemas im Datashare verweist (wie im vorherigen Schritt beschrieben) und detaillierte Berechtigungen auf Schemaebene bereitstellen.

    Sie können auch spätbindende Ansichten über freigegebene Objekte erstellen und diese verwenden, um detaillierte Berechtigungen zuzuweisen. Sie können auch erwägen, dass Produzenten-Cluster zusätzliche Datashares mit der erforderlichen Granularität erstellen. Sie können so viele Schemareferenzen aus dem Datashare für die Datenbank erstellen wie Sie möchten.

    Wenn Sie Ihre Datenbank in Schritt 4 mit WITH PERMISSIONS erstellt haben, müssen Sie Objekten in der gemeinsam genutzten Datenbank Berechtigungen auf Objektebene zuweisen. Ein Benutzer, der nur über die USAGE-Berechtigung verfügt, kann auf Objekte in einer Datenbank, die mit WITH PERMISSIONS erstellt wurde, erst zugreifen, wenn ihm zusätzliche Berechtigungen auf Objektebene erteilt wurden.

    GRANT SELECT ON sales_db.public.tickit_sales_redshift to Bob;
  7. Abfragen von Daten in den freigegebenen Objekten in Datashares.

    Benutzer und Rollen mit Berechtigungen für Konsumenten-Datenbanken und Schemata in Konsumenten-Clustern können die Metadaten beliebiger freigegebener Objekte durchsuchen und navigieren. Sie können auch lokale Objekte in einem Konsumenten-Cluster untersuchen und navigieren. Hierzu verwenden sie JDBC- oder ODBC-Treiber, SHOW-Befehle oder SVV_ALL- und SVV_REDSHIFT-Ansichten.

    Produzenten-Cluster können viele Schemas in der Datenbank, den Tabellen und Ansichten innerhalb jedes Schemas enthalten. Die Benutzer auf der Konsumenten-Seite können nur die Teilmenge der Objekte sehen, die über das Datashare zur Verfügung gestellt werden. Diese Benutzer können nicht die gesamten Metadaten aus dem Produzenten-Cluster sehen. Dieser Ansatz ermöglicht eine detaillierte Metadaten-Sicherheitskontrolle bei der Datenfreigabe.

    Sie verbinden sich weiterhin mit lokalen Cluster-Datenbanken. Nun können Sie aber auch aus den Datenbanken und Schemas lesen, die aus dem Datashare mit der dreiteiligen database.schema.table-Notation erstellt werden. Sie können Abfragen durchführen, die sich über alle Datenbanken erstrecken, die für Sie sichtbar sind. Dies können lokale Datenbanken auf dem Cluster oder Datenbanken sein, die aus den Datashares erstellt wurden. Sie können auch eine direkte Verbindung zu diesen Konsumenten-Datenbanken herstellen und Abfragen für die freigegebenen Objekte mit teilweiser Notation ausführen.

    Sie können auf die Daten mit vollständiger Qualifikation zugreifen. Weitere Informationen finden Sie unter Beispiele für datenbankübergreifende Abfragen.

    SELECT * FROM sales_db.public.tickit_sales_redshift ORDER BY 1,2 LIMIT 5; salesid | listid | sellerid | buyerid | eventid | dateid | qtysold | pricepaid | commission | saletime ---------+--------+----------+---------+---------+--------+---------+-----------+------------+--------------------- 1 | 1 | 36861 | 21191 | 7872 | 1875 | 4 | 728.00 | 109.20 | 2008-02-18 02:36:48 2 | 4 | 8117 | 11498 | 4337 | 1983 | 2 | 76.00 | 11.40 | 2008-06-06 05:00:16 3 | 5 | 1616 | 17433 | 8647 | 1983 | 2 | 350.00 | 52.50 | 2008-06-06 08:26:17 4 | 5 | 1616 | 19715 | 8647 | 1986 | 1 | 175.00 | 26.25 | 2008-06-09 08:38:52 5 | 6 | 47402 | 14115 | 8240 | 2069 | 2 | 154.00 | 23.10 | 2008-08-31 09:17:02

    Sie können nur SELECT-Anweisungen für gemeinsam genutzte Objekte verwenden. Sie können jedoch Tabellen im Konsumenten-Cluster erstellen, indem Sie die Daten von den freigegebenen Objekten in einer anderen lokalen Datenbank abfragen.

    Zusätzlich zu Abfragen können Konsumenten Ansichten zu freigegebenen Objekten erstellen. Nur spätbindende Ansichten oder materialisierte Ansichten werden unterstützt. Amazon Redshift unterstützt keine regelmäßigen Ansichten zu freigegebenen Daten. Ansichten, die Konsumenten erstellen, können sich über mehrere lokale Datenbanken oder Datenbanken erstrecken, die aus Datashares erstellt wurden. Weitere Informationen finden Sie unter CREATE VIEW.

    // Connect to a local cluster database // Create a view on shared objects and access it. CREATE VIEW sales_data AS SELECT * FROM sales_db.public.tickit_sales_redshift WITH NO SCHEMA BINDING; SELECT * FROM sales_data;