Amazon Redshift non supporterà più la creazione di nuove UDF Python a partire dal 1º novembre 2025. Se desideri utilizzare le UDF Python, creale prima di tale data. Le UDF Python esistenti continueranno a funzionare normalmente. Per ulteriori informazioni, consulta il post del blog
Panoramica di Amazon Redshift Spectrum
In questo argomento viene descritto nei dettagli come utilizzare Redshift Spectrum per leggere in modo efficiente da Amazon S3.
Amazon Redshift Spectrum si trova su dei server Amazon Redshift dedicati indipendenti dal cluster. Amazon Redshift trasmette al livello Redshift Spectrum molte attività che richiedono un'importante capacità di calcolo, come l'aggregazione e il filtraggio di predicati. Le query di Redshift Spectrum utilizzano quindi una capacità di elaborazione del cluster molto inferiore rispetto alle altre query. Redshift Spectrum consente inoltre un dimensionamento intelligente. In base alle richieste delle query, Redshift può potenzialmente utilizzare migliaia di istanze per beneficiare dell'elaborazione MPP (Massive Parallel Processing).
Per creare le tabelle di Redshift Spectrum, è necessario definire la struttura dei file e registrare quest'ultimi come tabelle in un catalogo dati esterno. Il catalogo dati esterno può essere AWS Glue, il catalogo dati fornito con Amazon Athena o il proprio metastore Apache Hive. È possibile creare e gestire le tabelle esterne da Amazon Redshift utilizzando comandi DDL (data definition language) o qualsiasi altro strumento che si connette al catalogo di dati esterno. Le modifiche al catalogo di dati esterno sono immediatamente disponibili per tutti i cluster Amazon Redshift.
Inoltre, se lo desideri, puoi partizionare le tabelle esterne in una o più colonne. Questa operazione può consentire di migliorare le prestazioni, Il miglioramento si verifica in quanto l'ottimizzatore di query di Amazon Redshift elimina le partizioni che non contengono dati per la query.
Le viste materializzate delle tabelle Spectrum possono migliorare notevolmente i costi e le prestazioni. Per ulteriori informazioni, consulta Viste materializzate per le tabelle di data lake esterne in Amazon Redshift Spectrum.
Dopo la definizione delle tabelle di Redshift Spectrum, è possibile sottoporle a query e join esattamente come con qualunque altra tabella Amazon Redshift. Redshift Spectrum non supporta le operazioni di aggiornamento sulle tabelle esterne. È possibile aggiungere le tabelle di Redshift Spectrum a più cluster Amazon Redshift e sottoporre a query gli stessi dati in Amazon S3 da qualsiasi cluster nella stessa regione AWS. Quando si aggiornano i file di dati Amazon S3, i dati diventano immediatamente disponibili per query da qualsiasi cluster Amazon Redshift.
Il catalogo dati AWS Glue a cui accedi potrebbe essere crittografato per aumentare la sicurezza. Se il catalogo AWS Glue è crittografato, è necessaria la chiave AWS Key Management Service (AWS KMS) affinché AWS Glue possa accedere al catalogo AWS Glue. La crittografia del catalogo AWS Glue non è disponibile in tutte le regioni AWS. Per un elenco delle regioni AWS supportate, consultare Crittografia e accesso sicuro per AWS Glue nella Guida per gli sviluppatori di AWS Glue. .Per ulteriori informazioni sulla crittografia del catalogo dati AWS Glue, consultare Crittografia del catalogo dati AWS Glue nella Guida per gli sviluppatori di AWS Glue.
Nota
Non è possibile visualizzare i dettagli per le tabelle Redshift Spectrum che utilizzano le stesse risorse utilizzate per le tabelle Amazon Redshift standard come PG_TABLE_DEF, STV_TBL_PERM, PG_CLASS o information_schema. Se il tuo strumento di business intelligence o di analisi non riconosce le tabelle esterne Redshift Spectrum, configura l'applicazione per eseguire la query su SVV_EXTERNAL_TABLES e SVV_EXTERNAL_COLUMNS.
Regioni di Amazon Redshift Spectrum
Redshift Spectrum è disponibile nelle Regioni AWS dove Amazon Redshift è disponibile, salvo diversamente indicato nella documentazione specifica della regione. Per la disponibilità della Regione AWS nelle regioni commerciali, consulta l'argomento relativo agli endpoint del servizio per l'API Redshift in Riferimenti generali di Amazon Web Services.