Esecuzione di query sui cataloghi registrati nel AWS Glue Data Catalog - Amazon Redshift

Amazon Redshift non supporterà più la creazione di nuove UDF Python a partire dal 1º novembre 2025. Se desideri utilizzare le UDF Python, creale prima di tale data. Le UDF Python esistenti continueranno a funzionare normalmente. Per ulteriori informazioni, consulta il post del blog.

Esecuzione di query sui cataloghi registrati nel AWS Glue Data Catalog

Dopo avere registrato un data warehouse Amazon Redshift nel AWS Glue Data Catalog e avere impostato le autorizzazioni per il catalogo risultante in AWS Lake Formation, il catalogo viene montato automaticamente in tutte le istanze di Amazon Redshift con accesso al data warehouse di origine nello stesso account e nella stessa Regione AWS. Puoi quindi eseguire query su tale catalogo come faresti con un cluster o un gruppo di lavoro locale. Puoi anche eseguire query sui cataloghi registrati nel AWS Glue Data Catalog utilizzando qualsiasi motore SQL che supporti la REST Open API Apache Iceberg. Per ulteriori informazioni sull’esecuzione di query sui cataloghi nel AWS Glue Data Catalog con la REST API Apache Iceberg, consulta Accesso al Catalogo dati nella Guida per gli sviluppatori del AWS Glue. Per informazioni sulla REST API Apache Iceberg, consulta la specifica della REST Open API Apache Iceberg.

Per eseguire query su un catalogo, devi dapprima impostare le autorizzazioni per il catalogo usando AWS Lake Formation. Per ulteriori informazioni sull’impostazione delle autorizzazioni per i cataloghi in AWS Lake Formation, consulta Configurazione delle autorizzazioni per le unità di condivisione dati Amazon Redshift nella Guida per gli sviluppatori di AWS Lake Formation. Devi inoltre disporre del ruolo IAM con la policy gestita AmazonRedshiftServiceLinkedRolePolicy collegata. Per informazioni sui ruoli collegati ai servizi, consulta Utilizzo di ruoli collegati ai servizi per Amazon Redshift nella Guida alla gestione di Amazon Redshift.

Tieni presente che le query relative ai cataloghi devono seguire la seguente sintassi in tre parti per accedere alle tabelle:

database@namespace.schema.table

Per informazioni generali sull’esecuzione di query sui data warehouse di Amazon Redshift, consulta Eseguire query su un database nella Guida alla gestione di Amazon Redshift.

Querying using the query editor v2

Dopo avere impostato le autorizzazioni per un account per accedere a un gruppo di lavoro gestito, tale gruppo di lavoro gestito viene visualizzato nel pannello con visualizzazione ad albero nella sezione dei database esterni del database serverless. Puoi eseguire query sul gruppo di lavoro gestito nello stesso modo in cui lo faresti con un cluster con provisioning o un gruppo di lavoro serverless di Amazon Redshift, utilizzando il formato di sintassi in tre parti database@namespace/cluster.schema.table. Vedi la seguente istruzione di esempio.

SELECT price FROM sales_db@mynamespace.sales_schema.inventory_table
Querying using the Data API

Puoi eseguire query sui gruppi di lavoro gestiti utilizzando l’API dati Amazon Redshift nello stesso modo in cui lo faresti con un cluster con provisioning o un gruppo di lavoro serverless interno Amazon Redshift, trasmettendo il nome della risorsa Amazon (ARN) del catalogo nell’attributo database pertinente. Considera il seguente esempio che crea una tabella in un catalogo.

aws redshift-data execute-statement —sql 'CREATE TABLE IF NOT EXISTS "dev@test-rms-catalog".public.t1 (c1 INT, c2 VARCHAR(10));' —database arn:aws:glue:us-east-1:550022730026:catalog/test-rms-catalog