Amazon Redshift non supporterà più la creazione di nuovi Python a UDFs partire dal 1° novembre 2025. Se vuoi usare Python UDFs, crea la UDFs data precedente a quella data. Python esistente UDFs continuerà a funzionare normalmente. Per ulteriori informazioni, consulta il post del blog
Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Nozioni di base sui data warehouse con provisioning Amazon Redshift
Se utilizzi Amazon Redshift per la prima volta, consigliamo di leggere le seguenti sezioni per iniziare a usare i cluster con provisioning. Il flusso di base di Amazon Redshift consiste nel creare risorse con provisioning, connettersi ad Amazon Redshift, caricare i dati di esempio e quindi eseguire query sui dati. In questa guida puoi scegliere di caricare i dati di esempio da Amazon Redshift o da un bucket Amazon S3. I dati di esempio vengono utilizzati in tutta la documentazione di Amazon Redshift per illustrare le funzionalità.
Questo tutorial dimostra come utilizzare i cluster provisioned di Amazon Redshift, che AWS sono oggetti di data warehouse per i quali gestisci le risorse di sistema. Puoi anche utilizzare Amazon Redshift con gruppi di lavoro serverless, che sono oggetti di data warehouse che si ridimensionano automaticamente in base all’uso. Per iniziare a utilizzare Redshift serverless, consulta Nozioni di base sui data warehouse Amazon Redshift serverless.
Dopo avere creato la console con provisioning Amazon Redshift e avervi effettuato l’accesso, puoi creare e gestire tutti gli oggetti Amazon Redshift, tra cui cluster, database e nodi. Puoi anche eseguire query e visualizzarle, nonché effettuare altre operazioni DDL e DML SQL con un client SQL.
Importante
Il cluster che hai sottoposto a provisioning per questo esercizio viene eseguito in un ambiente reale. Finché è in esecuzione, addebita addebiti a tuo carico. Account AWS Per informazioni sui prezzi, consultare la pagina dei prezzi di Amazon Redshift
Per evitare costi superflui, è necessario eliminare il cluster al termine dell'esercizio. La sezione finale di questo capitolo illustra come procedere.
Accedi a Console di gestione AWS e apri la console Amazon Redshift all'indirizzo. https://console.aws.amazon.com/redshiftv2/
Per iniziare a utilizzare la console Amazon Redshift, consigliamo di procedere innanzitutto con l’accesso al Pannello di controllo dei cluster con provisioning.
A seconda della configurazione, nel riquadro di navigazione della console con provisioning Amazon Redshift sono visualizzati i seguenti elementi:
Redshift serverless: accedi ai dati e analizzali senza configurare, ottimizzare e gestire i cluster con provisioning Amazon Redshift.
Dashboard dei cluster forniti: visualizza l'elenco dei cluster presentiRegione AWS, consulta Cluster Metrics e Query overview per informazioni dettagliate sui parametri, sui dati (come l'utilizzo della CPU) e sulle informazioni sulle query. L'utilizzo di questi dati può aiutarti a determinare se i dati sulle prestazioni sono anormali in un intervallo di tempo specificato.
Cluster: visualizza l'elenco dei cluster che contieneRegione AWS, scegli un cluster per avviare le query o esegui azioni relative al cluster. È inoltre possibile creare un nuovo cluster da questa pagina.
Editor di query: esegui query sui database ospitati nel cluster Amazon Redshift. Consigliamo invece di utilizzare Query Editor V2.
Query Editor V2: Amazon Redshift Query Editor V2 è un’applicazione client SQL separata basata sul web che consente di creare ed eseguire query sul data warehouse Amazon Redshift. Puoi visualizzare i risultati nei grafici e collaborare condividendo le tue domande con altri membri del tuo team.
Queries and loads (Query e carichi): ottiene informazioni per riferimento o risoluzione dei problemi, ad esempio un elenco di query recenti e il testo SQL di ogni query.
Unità di condivisione dati - come amministratore di un account producer puoi autorizzare gli account consumer ad accedere alle unità di condivisione dati o scegliere di non autorizzare alcun accesso. Per utilizzare un datashare autorizzato, un amministratore di account consumer può associare il datashare a un intero o a specifici namespace del cluster in un account. Account AWS Un amministratore può anche rifiutare una unità di condivisione dati.
Integrazioni Zero-ETL: gestisci le integrazioni che rendono disponibili i dati transazionali in Amazon Redshift dopo che sono stati scritti in origini supportate.
Connessioni del Centro identità IAM: configura la connessione tra Amazon Redshift e Centro identità IAM.
Configurations (Configurazioni): si connette ai cluster di Amazon Redshift dagli strumenti del client SQL tramite le connessioni Java Database Connectivity (JDBC) e Open Database Connectivity (ODBC). Puoi anche configurare un endpoint VPC (Virtual Private Cloud) di Amazon RedShift. In questo modo viene fornita una connessione privata tra un VPC basato sul servizio Amazon VPC che contiene un cluster e un altro VPC che esegue uno strumento client.
AWSIntegrazione con i partner: crea l'integrazione con un partner supportato. AWS
Advisor - Ricevi consigli specifici sulle modifiche che puoi apportare al cluster Amazon Redshift per dare priorità alle tue ottimizzazioni.
AWSMarketplace: ottieni informazioni su altri strumenti o AWS servizi compatibili con Amazon Redshift.
Allarmi — Crea allarmi sulle metriche del cluster per visualizzare i dati sulle prestazioni e tenere traccia delle metriche in un periodo di tempo specificato.
Eventi — Tieni traccia degli eventi e ottieni report su informazioni come la data in cui si è verificato l'evento, una descrizione o l'origine dell'evento.
Novità: questa pagina Web elenca le nuove funzionalità di Amazon Redshift e gli aggiornamenti dei prodotti.
In questo tutorial userai la procedura descritta di seguito:
Argomenti
Iscrizione a AWS
Se non ne hai già unoAccount AWS, iscriviti a uno. Se disponi già di un account, puoi ignorare questo prerequisito e utilizzare il tuo account esistente.
Apri la https://portal.aws.amazon.com/billing/registrazione.
Segui le istruzioni online.
Nel corso della procedura di registrazione riceverai una telefonata o un messaggio di testo e ti verrà chiesto di inserire un codice di verifica attraverso la tastiera del telefono.
Quando ti iscrivi a unAccount AWS, Utente root dell'account AWSviene creato un. L’utente root dispone dell’accesso a tutte le risorse e tutti i Servizi AWS nell’account. Come best practice di sicurezza, assegna l’accesso amministrativo a un utente e utilizza solo l’utente root per eseguire attività che richiedono l’accesso di un utente root.
Definizione delle regole del firewall
Nota
Questo tutorial presuppone che il cluster utilizzi la porta predefinita 5439 e che Amazon Redshift Query Editor V2 possa essere usato per eseguire comandi SQL. Non fornisce dettagli sulle configurazioni di rete o sulla configurazione di un client SQL che potrebbe essere necessario nell’ambiente.
In alcuni ambienti specifichi una porta all’avvio del cluster Amazon Redshift. Questa porta viene utilizzata insieme all’URL dell’endpoint del cluster per accedere al cluster. È importante inoltre creare una regola in entrata in un gruppo di sicurezza per consentire l'accesso al cluster attraverso la porta.
Se il computer client è protetto da un firewall, è necessario conoscere una porta aperta che è possibile utilizzare. Questa porta aperta consente di stabilire una connessione con il cluster da uno strumento client SQL ed eseguire query. Se non si dispone di questa informazione, chiedere la collaborazione di qualcuno che sia a conoscenza delle regole del firewall di rete al fine di determinare una porta aperta del firewall.
Sebbene Amazon Redshift usi la porta 5439 per impostazione predefinita, se questa porta del firewall non è aperta la connessione non funziona. Non è possibile modificare il numero di porta per il cluster Amazon Redshift dopo la creazione. Pertanto, assicurarsi di specificare una porta aperta che funziona nell'ambiente durante il processo di avvio.
Fase 1: Creazione di un cluster Amazon Redshift di esempio
In questo tutorial viene illustrato come creare un cluster Amazon Redshift con un database. Quindi devi caricare un set di dati da Amazon S3 nelle tabelle del database. Puoi usare questo cluster di esempio per valutare il servizio Amazon Redshift.
Prima di iniziare a configurare un cluster Amazon Redshift, assicurati di completare eventuali operazioni preliminari necessarie come Iscrizione a AWS e Definizione delle regole del firewall.
Per qualsiasi operazione che accede ai dati da un'altra AWS risorsa, il cluster necessita dell'autorizzazione per accedere alla risorsa e ai dati sulla risorsa per tuo conto. Un esempio consiste nell’uso di un comando SQL COPY per caricare i dati da Amazon Simple Storage Service (Amazon S3). Fornisci tali autorizzazioni utilizzando AWS Identity and Access Management (IAM). A questo scopo utilizza un ruolo IAM che hai creato e collegato al cluster. Per ulteriori informazioni sulle credenziali e sulle autorizzazioni di accesso, consulta Credenziali e autorizzazioni di accesso nella Guida per sviluppatori di database di Amazon Redshift.
Come creare un cluster Amazon Redshift
-
Accedi a Console di gestione AWS e apri la console Amazon Redshift all'indirizzo. https://console.aws.amazon.com/redshiftv2/
Importante
Se si utilizzano le credenziali utente IAM, verificare di disporre delle autorizzazioni necessarie per eseguire le operazioni relative al cluster. Per ulteriori informazioni, consulta Sicurezza di Amazon Redshift nella Guida alla gestione di Amazon Redshift.
-
Sulla AWS console, scegli Regione AWS dove vuoi creare il cluster.
-
Dal menu di navigazione, scegliere Clusters (Cluster), quindi Create cluster (Crea cluster). Appare la pagina Create cluster (Crea cluster).
-
Nella sezione Configurazione del cluster, specificare i valori per Identificatore del cluster, Tipo di nodo e Nodi:
-
Identificatore del cluster: inserire
exampleclusterper questo tutorial. Questo identificatore deve essere univoco. L'identificatore deve contenere un numero di caratteri compreso tra 1 e 63, dove i caratteri validi sono a-z (solo minuscole) e - (trattino). -
Selezionare uno dei seguenti metodi per dimensionare il cluster:
Nota
Il passaggio seguente presuppone un sistema Regione AWS che supporti i tipi di RA3 nodi. Per un elenco dei tipi Regioni AWS di RA3 nodi di supporto, consulta Panoramica dei tipi di RA3 nodi nella Amazon Redshift Management Guide. Per ulteriori informazioni sulle specifiche del nodo per ogni tipo e dimensione di nodo, consulta Dettagli sul tipo di nodo.
-
Se non si conosce la dimensione del cluster, scegliereAiutami a scegliere. In questo modo viene avviato un calcolatore di dimensionamento in cui vengono poste domande sulle dimensioni e sulle caratteristiche delle query dei dati che prevedi di memorizzare nel data warehouse.
Se si conosce la dimensione richiesta del cluster, ovvero il tipo di nodo e il numero di nodi, scegliere Sceglierò. Quindi scegliere il tipo di nodo e il numero di nodi per dimensionare il cluster.
Per questo tutorial scegli ra3.4xlarge per Tipo di nodo e 2 per Numero di nodi.
Se è disponibile un’opzione per Configurazione AZ, scegli Single-AZ.
Per utilizzare il set di dati di esempio fornito da Amazon Redshift, in Dati di esempio, scegliere Carica dati di esempio. Amazon Redshift carica di default il set di dati di esempio Tickit nel database
deve nello schemapublic.
-
-
-
Nella sezione Configurazione del database specifica i valori per Nome dell'utente amministratore. In Password dell'amministratore seleziona una delle opzioni seguenti:
-
Genera una password: utilizza una password generata da Amazon Redshift.
-
Aggiungi manualmente una password dell'amministratore: utilizza una tua password.
-
Gestisci le credenziali di amministratore in Gestione dei segreti AWS: Amazon Redshift le Gestione dei segreti AWS utilizza per generare e gestire la password di amministratore. L'utilizzo Gestione dei segreti AWS per generare e gestire la password segreta comporta un costo. Per informazioni sui prezzi di Gestione dei segreti AWS, consulta Prezzi di Gestione dei segreti AWS
.
Per questo tutorial utilizzare i seguenti valori:
Nome utente amministratore: inserisci
awsuser.Password dell’utente amministratore: inserisci
Changeit1per la password.
-
-
Per questo tutorial, create un ruolo IAM e impostatelo come predefinito per il cluster, come descritto di seguito. È possibile che sia disponibile un solo set di ruoli IAM predefinito per un cluster.
In Autorizzazioni cluster, per Gestisci i ruoli IAM, scegli Creazione di ruolo IAM.
Specificare un bucket Amazon S3 per l'accesso al ruolo IAM con uno dei seguenti metodi:
Scegliere Nessun bucket Amazon S3 aggiuntivo per consentire al ruolo IAM creato di accedere solo ai bucket Amazon S3 denominati
redshift.Scegliere Qualsiasi bucket Amazon S3 per consentire al ruolo IAM creato di accedere a tutti bucket Amazon S3.
Scegliere Bucket Amazon S3 specifico per specificare uno o più bucket Amazon S3 a cui il ruolo IAM creato può accedere. Scegli quindi uno o più bucket Amazon S3 dalla tabella.
Scegliere Creazione di ruolo IAM come predefinito. Amazon Redshift crea e imposta automaticamente il ruolo IAM come predefinito per il cluster.
Poiché hai creato il tuo ruolo IAM dalla console, questo ha allegata la policy
AmazonRedshiftAllCommandsFullAccess. Ciò consente ad Amazon Redshift di copiare, caricare, analizzare i dati ed eseguire query su di essi dalle risorse Amazon nel tuo account IAM.
Per ulteriori informazioni su come gestire il ruolo IAM predefinito per un cluster, consulta Creazione di un ruolo IAM come predefinito per Amazon Redshift nella Guida alla gestione di Amazon Redshift.
-
(Facoltativo) Nella sezione Configurazioni aggiuntive disattiva Usa impostazioni predefinite per modificare le impostazioni Rete e sicurezza, Configurazione del database, Manutenzione, Monitoraggio e Backup.
In alcuni casi, è possibile creare il cluster con l'opzione Caricare i dati campione e attivare il routing avanzato Amazon VPC. In tal caso, il cluster nel tuo virtual private cloud (VPC) richiede l'accesso all'endpoint Amazon S3 per caricare i dati.
Per rendere il cluster accessibile al pubblico, è possibile eseguire due operazioni. Puoi configurare un indirizzo NAT (Network Address Translation) nel VPC affinché il cluster acceda a Internet. Oppure puoi configurare un endpoint Amazon S3 VPC nel tuo VPC. Per ulteriori informazioni sul routing avanzato di Amazon VPC, consulta Routing Amazon VPC avanzato nella Guida alla gestione di Amazon Redshift.
-
Scegli Crea cluster. Attendi che il cluster venga creato con lo stato
Availablenella pagina Cluster.
Fase 2: Configurazione delle regole in ingresso per i client SQL
Nota
Consigliamo di saltare questa fase e accedere al cluster utilizzando Amazon Redshift Query Editor V2.
Più avanti in questo tutorial, si accederà al cluster da un Virtual Private Cloud (VPC) basato sul servizio Amazon VPC. Tuttavia, se per accedere al cluster si utilizza un client SQL esterno al firewall, è necessario concedere l'accesso in entrata.
Per controllare il firewall e concedere l'accesso in ingresso al cluster
S necessario accedere al cluster dall'esterno di un firewall, controlla le regole con cui è configurato. Ad esempio, il tuo cliente potrebbe essere un'istanza Amazon Elastic Compute Cloud (Amazon EC2) o un computer esterno.
Per ulteriori informazioni sulle regole del firewall, consulta le regole dei gruppi di sicurezza nella Amazon EC2 User Guide.
Per accedere da un client EC2 esterno Amazon, aggiungi una regola di ingresso al gruppo di sicurezza collegato al cluster che consente il traffico in entrata. Aggiungi le regole EC2 dei gruppi di sicurezza Amazon nella EC2 console Amazon. Ad esempio, uno CIDR/IP di 192.0.2.0/24 consente ai client in quell'intervallo di indirizzi IP di connettersi al cluster. Scoprite quello più adatto al vostro ambiente. CIDR/IP
Fase 3: concedere l’accesso a un client SQL ed eseguire query
Per eseguire query sui database ospitati dal cluster Amazon Redshift, sono disponibili diverse opzioni per i client SQL. Ciò include:
Connettiti al cluster ed esegui query utilizzando Amazon Redshift Query Editor V2.
Se utilizzi Query Editor V2, non devi scaricare e configurare un’applicazione client SQL. Avvia Amazon Redshift Query Editor V2 dalla console Amazon Redshift.
Connettiti al cluster tramite RSQL. Per ulteriori informazioni, consulta Connessione con Amazon Redshift RSQL nella Guida alla gestione di Amazon Redshift.
-
Connettiti al cluster con uno strumento del client SQL, ad esempio SQL Workbench/J. Per ulteriori informazioni, consulta Connessione al cluster tramite SQL Workbench/J nella Guida alla gestione di Amazon Redshift.
In questo tutorial viene utilizzato Amazon Redshift Query Editor V2 come soluzione semplice per eseguire query sui database ospitati dal cluster Amazon Redshift. Dopo avere creato il cluster, puoi eseguire immediatamente query. Per informazioni dettagliate sulle considerazioni durante l’utilizzo di Amazon Redshift Query Editor V2, consulta Considerazioni sull’utilizzo di Query Editor V2 nella Guida alla gestione di Amazon Redshift.
Concessione dell'accesso all'editor di query v2
La prima volta che un amministratore configura l'editor di query v2 per l'utenteAccount AWS, sceglie AWS KMS key quello utilizzato per crittografare le risorse dell'editor di query v2. Le risorse di Amazon Redshift Query Editor V2 includono le query salvate, i notebook e i grafici. Per impostazione predefinita, una chiave di proprietà AWS viene utilizzata per crittografare le risorse. In alternativa un amministratore può utilizzare una chiave gestita dal cliente scegliendo il nome della risorsa Amazon (ARN) per la chiave nella pagina di configurazione. Dopo aver configurato un account, le impostazioni di AWS KMS crittografia non possono essere modificate. Per ulteriori informazioni, consulta Configurazione dell’Account AWS nella Guida alla gestione di Amazon Redshift.
Per accedere all'editor della query v2, sono necessarie le opportune autorizzazioni. Un amministratore può collegare una delle policy gestite da AWS per Amazon Redshift Query Editor V2 al ruolo IAM o all’utente per concedere le autorizzazioni. Queste politiche AWS gestite sono scritte con diverse opzioni che controllano il modo in cui l'etichettatura delle risorse consente la condivisione delle query. Puoi utilizzare la console IAM (https://console.aws.amazon.com/iam/
Puoi anche creare una policy in base alle autorizzazioni consentite e negate nelle policy gestite fornite. Se si utilizza l'editor policy della console IAM per creare le proprie policy, scegliereSQL Workbench come servizio per il quale si crea la policy nell'editor visivo. L'editor di query v2 utilizza il nome di servizio AWS SQL Workbench nell'editor visivo e in IAM Policy Simulator.
Per informazioni, consulta Utilizzo dell'editor di query v2 nella Guida alla gestione di Amazon Redshift.
Passaggio 4: caricare i dati da Amazon S3 ad Amazon Redshift
Dopo avere creato il cluster, puoi caricare i dati da Amazon S3 nelle tabelle del database. Esistono diversi modi per caricare i dati da Amazon S3.
Puoi utilizzare un client SQL per eseguire il comando SQL CREATE TABLE per creare una tabella nel database e quindi utilizzare il comando SQL COPY per caricare i dati da Amazon S3. Amazon Redshift Query Editor V2 è un client SQL.
Puoi utilizzare la procedura guidata di caricamento di Amazon Redshift Query Editor V2.
In questo tutorial viene illustrato come utilizzare Amazon Redshift Query Editor V2 per eseguire i comandi SQL per CREARE le tabelle e COPIARE i dati. Avvia Query Editor V2 dal riquadro di navigazione della console Amazon Redshift. All’interno di Query Editor V2 crea una connessione al cluster examplecluster e al database denominato dev con l’utente amministratore awsuser. Per questo tutorial scegli Credenziali temporanee che utilizzano un nome utente del database quando crei la connessione. Per informazioni sull’utilizzo di Amazon Redshift Query Editor V2, consulta Connessione a un database Amazon Redshift nella Guida alla gestione di Amazon Redshift.
Caricamento di dati da Amazon S3 con i comandi SQL
Nel riquadro di Query Editor V2 verifica di essere connesso al cluster examplecluster e al database dev. Successivamente crea delle tabelle nel database e caricavi i dati. In questo tutorial, i dati che carichi sono disponibili in un bucket Amazon S3 accessibile da molti. Regioni AWS
Nella procedura seguente vengono create delle tabelle e vengono caricati i dati da un bucket Amazon S3 pubblico.
Se utilizzi Amazon Redshift Query Editor V2 per copiare ed eseguire la seguente istruzione CREATE TABLE per creare una tabella nello schema public del database dev. Per ulteriori informazioni sulla sintassi, consultare CREATE TABLE nella Guida per gli sviluppatori di database di Amazon Redshift.
Come creare e caricare i dati utilizzando un client SQL come Query Editor V2
-
Esegui il seguente comando SQL per CREARE la tabella
sales.drop table if exists sales;create table sales( salesid integer not null, listid integer not null distkey, sellerid integer not null, buyerid integer not null, eventid integer not null, dateid smallint not null sortkey, qtysold smallint not null, pricepaid decimal(8,2), commission decimal(8,2), saletime timestamp); -
Esegui il seguente comando SQL per CREARE la tabella
date.drop table if exists date;create table date( dateid smallint not null distkey sortkey, caldate date not null, day character(3) not null, week smallint not null, month character(5) not null, qtr character(5) not null, year smallint not null, holiday boolean default('N')); -
Carica la tabella
salesda Amazon S3 utilizzando il comando COPY.Nota
Consigliamo di usare il comando COPY per caricare set di dati di grandi dimensioni in Amazon Redshift da Amazon S3. Per ulteriori informazioni sulla sintassi di COPY, consultare COPY nella Guida per gli sviluppatori di database di Amazon Redshift.
Per caricare i dati di esempio, è necessario fornire al cluster l'autenticazione per accedere ad Amazon S3 per tuo conto. Esegui l’autenticazione facendo riferimento al ruolo IAM creato e impostato come
defaultper il cluster quando hai scelto Crea ruolo IAM come default al momento della creazione del cluster.Carica la tabella
salesutilizzando il seguente comando SQL. Facoltativamente puoi scaricare e visualizzare da Amazon S3 i dati di origine per la tabellasales. . COPY sales FROM 's3://redshift-downloads/tickit/sales_tab.txt' DELIMITER '\t' TIMEFORMAT 'MM/DD/YYYY HH:MI:SS' REGION 'us-east-1' IAM_ROLE default; -
Carica la tabella
dateutilizzando il seguente comando SQL. Facoltativamente puoi scaricare e visualizzare da Amazon S3 i dati di origine per la tabelladate. . COPY date FROM 's3://redshift-downloads/tickit/date2008_pipe.txt' DELIMITER '|' REGION 'us-east-1' IAM_ROLE default;
Caricamento di dati da Amazon S3 con Query Editor V2
In questa sezione viene illustrato il caricamento di dati in un cluster Amazon Redshift. L’uso di Query Editor V2 semplifica il caricamento di dati quando utilizzi la procedura guidata Carica dati. Il comando COPY generato e usato in Query Editor V2 della procedura guidata Carica dati supporta molti dei parametri disponibili per la sintassi del comando COPY per caricare i dati da Amazon S3. Per informazioni sul comando COPY e sulle opzioni utilizzate per copiare il caricamento da Amazon S3, consultare COPIA da Amazon Simple Storage Service nella Guida per sviluppatori di database Amazon Redshift.
Per caricare i tuoi dati da Amazon S3 ad Amazon Redshift, Amazon Redshift richiede un ruolo IAM con i privilegi necessari per caricare i dati dal bucket Amazon S3 specificato.
Per caricare i dati personali da Amazon S3 in Amazon Redshift, puoi utilizzare la procedura guidata Carica dati di Query Editor V2. Per ulteriori informazioni su come usare la procedura guidata Carica dati, consulta Caricamento di dati da Amazon S3 nella Guida alla gestione di Amazon Redshift.
Creazione di dati TICKIT nel cluster
TICKIT è un database di esempio che puoi caricare facoltativamente nel cluster Amazon Redshift per imparare a eseguire query sui dati in Amazon Redshift. Puoi creare il set completo di tabelle TICKIT e caricare i dati nel cluster nei seguenti modi:
Quando crei un cluster nella console Amazon Redshift, hai la possibilità di caricare contemporaneamente i dati di esempio TICKIT. Sulla console Amazon Redshift scegli Cluster, Crea cluster. Nella sezione Dati campione seleziona Caricamento dati campione. Amazon Redshift carica il set di dati di esempio nel database
devdel cluster Amazon Redshift durante la creazione dei cluster.Per connetterti a un cluster esistente, esegui le operazioni seguenti:
Nella barra di navigazione della console Amazon Redshift scegli Cluster.
Scegli il cluster dal riquadro Cluster.
Scegli Esegui query sui dati, Esegui query in Query Editor V2.
Espandi examplecluster nell’elenco delle risorse. Se è la prima volta che ti connetti al cluster, viene visualizzato Connettiti a examplecluster. Scegli Nome utente e password del database. Lascia invariato il database
dev. Specificaawsuserper il nome utente eChangeit1per la password.Scegli Crea connessione.
Con Amazon Redshift Query Editor V2 puoi caricare i dati TICKIT in un database di esempio denominato sample_data_dev. Scegli il database sample_data_dev nell’elenco delle risorse. Accanto al nodo tickit scegli l’icona Apri notebook di esempio. Conferma di voler creare il database di esempio.
Amazon Redshift Query Editor v2 crea il database di esempio insieme a un notebook di esempio denominato. tickit-sample-notebook Puoi scegliere Esegui tutto per eseguire questo notebook per effettuare query sui dati nel database di esempio.
Per visualizzare i dettagli dei dati TICKIT, consulta Database di esempio nella Guida per sviluppatori di database di Amazon Redshift.
Fase 5: provare query di esempio utilizzando l'editor di query
Per configurare e utilizzare Amazon Redshift Query Editor V2 per eseguire query su un database, consulta Utilizzo di Query Editor V2 nella Guida alla gestione di Amazon Redshift.
Ora, provare alcune query di esempio, come illustrato di seguito. Per creare nuove query in Query Editor V2, scegli l’icona + nell’angolo in alto a destra del riquadro delle query e scegli SQL. Viene visualizzata una nuova pagina di query in cui puoi copiare e incollare le seguenti query SQL.
Nota
Assicurati di eseguire dapprima la prima query nel notebook, che imposta il valore di configurazione del server search_path sullo schema tickit utilizzando il seguente comando SQL:
set search_path to tickit;
Per ulteriori informazioni sull’utilizzo del comando SELECT, consulta SELECT nella Guida per sviluppatori di database di Amazon Redshift.
-- Get definition for the sales table. SELECT * FROM pg_table_def WHERE tablename = 'sales';
-- Find total sales on a given calendar date. SELECT sum(qtysold) FROM sales, date WHERE sales.dateid = date.dateid AND caldate = '2008-01-05';
-- Find top 10 buyers by quantity. SELECT firstname, lastname, total_quantity FROM (SELECT buyerid, sum(qtysold) total_quantity FROM sales GROUP BY buyerid ORDER BY total_quantity desc limit 10) Q, users WHERE Q.buyerid = userid ORDER BY Q.total_quantity desc;
-- Find events in the 99.9 percentile in terms of all time gross sales. SELECT eventname, total_price FROM (SELECT eventid, total_price, ntile(1000) over(order by total_price desc) as percentile FROM (SELECT eventid, sum(pricepaid) total_price FROM sales GROUP BY eventid)) Q, event E WHERE Q.eventid = E.eventid AND percentile = 1 ORDER BY total_price desc;
Fase 6: reimpostazione dell'ambiente
Nei passaggi precedenti hai creato un cluster Amazon Redshift, caricato i dati nelle tabelle ed eseguito query sui dati utilizzando un client SQL come Amazon Redshift Query Editor V2.
Una volta completato il presente tutorial, consigliamo di reimpostare l'ambiente allo stato precedente eliminando il cluster di esempio. I costi del servizio Amazon Redshift continueranno ad essere addebitati fino all'eliminazione del cluster.
Tuttavia, se desideri provare a eseguire le attività descritte in altre guide di Amazon Redshift o le attività descritte in Eseguire comandi per definire e utilizzare un database nel data warehouse, consigliamo di tenere il cluster di esempio in esecuzione.
Come eliminare un cluster
-
Accedi a Console di gestione AWS e apri la console Amazon Redshift all'indirizzo. https://console.aws.amazon.com/redshiftv2/
-
Dal menu di navigazione, scegliere Clusters (Cluster) per visualizzare l'elenco dei cluster.
-
Scegli il cluster
examplecluster. In Actions (Azioni), scegliere Delete (Elimina). Viene visualizzata la pagina Delete examplecluster?. -
Conferma il cluster da eliminare, deseleziona l’impostazione Crea snapshot finale, quindi inserisci
deleteper confermare l’eliminazione. Scegli Delete cluster (Elimina cluster).
Nella pagina dell'elenco dei cluster, lo stato del cluster viene aggiornato nel corso dell'eliminazione.
Una volta completato il tutorial, sarà possibile trovare ulteriori informazioni su Amazon Redshift e sulle fasi successive in Risorse aggiuntive per saperne di più su Amazon Redshift..