Registrati per un Account AWS Definizione delle regole del firewall Fase 1: creazione di un cluster di esempio Fase 2: Configurazione delle regole in ingresso per i client SQL Fase 3: concedere l’accesso a un client SQL ed eseguire query Passaggio 4: caricare i dati da Amazon S3 ad Amazon Redshift Fase 5: provare query di esempio utilizzando l'editor di query Fase 6: reimpostazione dell'ambiente

Nozioni di base sui data warehouse con provisioning Amazon Redshift

Se utilizzi Amazon Redshift per la prima volta, consigliamo di leggere le seguenti sezioni per iniziare a usare i cluster con provisioning. Il flusso di base di Amazon Redshift consiste nel creare risorse con provisioning, connettersi ad Amazon Redshift, caricare i dati di esempio e quindi eseguire query sui dati. In questa guida puoi scegliere di caricare i dati di esempio da Amazon Redshift o da un bucket Amazon S3. I dati di esempio vengono utilizzati in tutta la documentazione di Amazon Redshift per illustrare le funzionalità.

Questo tutorial dimostra come utilizzare i cluster provisioned di Amazon Redshift, che AWS sono oggetti di data warehouse per i quali gestisci le risorse di sistema. Puoi anche utilizzare Amazon Redshift con gruppi di lavoro serverless, che sono oggetti di data warehouse che si ridimensionano automaticamente in base all’uso. Per iniziare a utilizzare Redshift serverless, consulta Nozioni di base sui data warehouse Amazon Redshift serverless.

Dopo avere creato la console con provisioning Amazon Redshift e avervi effettuato l’accesso, puoi creare e gestire tutti gli oggetti Amazon Redshift, tra cui cluster, database e nodi. Puoi anche eseguire query e visualizzarle, nonché effettuare altre operazioni DDL e DML SQL con un client SQL.

Importante

Il cluster che hai sottoposto a provisioning per questo esercizio viene eseguito in un ambiente reale. Finché è in esecuzione, addebita addebiti a tuo carico. Account AWS Per informazioni sui prezzi, consultare la pagina dei prezzi di Amazon Redshift.

Per evitare costi superflui, è necessario eliminare il cluster al termine dell'esercizio. La sezione finale di questo capitolo illustra come procedere.

Accedi Console di gestione AWS e apri la console Amazon Redshift all'indirizzo. https://console.aws.amazon.com/redshiftv2/

Per iniziare a utilizzare la console Amazon Redshift, consigliamo di procedere innanzitutto con l’accesso al Pannello di controllo dei cluster con provisioning.

A seconda della configurazione, nel riquadro di navigazione della console con provisioning Amazon Redshift sono visualizzati i seguenti elementi:

Redshift serverless: accedi ai dati e analizzali senza configurare, ottimizzare e gestire i cluster con provisioning Amazon Redshift.
Dashboard dei cluster forniti: visualizza l'elenco dei cluster presenti Regione AWS, consulta Cluster Metrics e Query overview per informazioni dettagliate sui parametri, sui dati (come l'utilizzo della CPU) e sulle query. L’utilizzo di questi dati può aiutarti a determinare se i dati sulle prestazioni sono anormali in un intervallo di tempo specificato.
Cluster: visualizza l'elenco dei cluster che contiene Regione AWS, scegli un cluster per avviare le query o esegui azioni relative al cluster. È inoltre possibile creare un nuovo cluster da questa pagina.
Editor di query: esegui query sui database ospitati nel cluster Amazon Redshift. Consigliamo invece di utilizzare Query Editor V2.
Query Editor V2: Amazon Redshift Query Editor V2 è un’applicazione client SQL separata basata sul web che consente di creare ed eseguire query sul data warehouse Amazon Redshift. Puoi visualizzare i risultati nei grafici e collaborare condividendo le tue domande con altri membri del tuo team.
Queries and loads (Query e carichi): ottiene informazioni per riferimento o risoluzione dei problemi, ad esempio un elenco di query recenti e il testo SQL di ogni query.
Unità di condivisione dati - come amministratore di un account producer puoi autorizzare gli account consumer ad accedere alle unità di condivisione dati o scegliere di non autorizzare alcun accesso. Per utilizzare un datashare autorizzato, un amministratore di account consumer può associare il datashare a un intero o a specifici namespace del cluster in un account. Account AWS Un amministratore può anche rifiutare una unità di condivisione dati.
Zero-ETL integrazioni: gestisci le integrazioni che rendono disponibili i dati transazionali in Amazon Redshift dopo essere stati scritti in fonti supportate.
Connessioni del Centro identità IAM: configura la connessione tra Amazon Redshift e Centro identità IAM.
Configurations (Configurazioni): si connette ai cluster di Amazon Redshift dagli strumenti del client SQL tramite le connessioni Java Database Connectivity (JDBC) e Open Database Connectivity (ODBC). Puoi anche configurare un endpoint VPC (Virtual Private Cloud) di Amazon RedShift. In questo modo viene fornita una connessione privata tra un VPC basato sul servizio Amazon VPC che contiene un cluster e un altro VPC che esegue uno strumento client.
AWS Integrazione con i partner: crea l'integrazione con un partner supportato. AWS
Advisor - Ricevi consigli specifici sulle modifiche che puoi apportare al cluster Amazon Redshift per dare priorità alle tue ottimizzazioni.
AWS Marketplace: ottieni informazioni su altri strumenti o AWS servizi compatibili con Amazon Redshift.
Allarmi — Crea allarmi sulle metriche del cluster per visualizzare i dati sulle prestazioni e tenere traccia delle metriche in un periodo di tempo specificato.
Eventi — Tieni traccia degli eventi e ottieni report su informazioni come la data in cui si è verificato l'evento, una descrizione o l'origine dell'evento.
Novità: questa pagina Web elenca le nuove funzionalità di Amazon Redshift e gli aggiornamenti dei prodotti.

In questo tutorial userai la procedura descritta di seguito:

I passaggi di questo tutorial sono descritti di seguito

Argomenti

Registrati per un Account AWS
Definizione delle regole del firewall
Fase 1: Creazione di un cluster Amazon Redshift di esempio
Fase 2: Configurazione delle regole in ingresso per i client SQL
Fase 3: concedere l’accesso a un client SQL ed eseguire query
Passaggio 4: caricare i dati da Amazon S3 ad Amazon Redshift
Fase 5: provare query di esempio utilizzando l'editor di query
Fase 6: reimpostazione dell'ambiente

Per iniziare AWS, hai bisogno di un Account AWS. Per informazioni sulla creazione di un Account AWS, vedi Guida introduttiva a un Account AWS nella Guida Gestione dell'account AWS di riferimento.

Definizione delle regole del firewall

Nota

Questo tutorial presuppone che il cluster utilizzi la porta predefinita 5439 e che Amazon Redshift Query Editor V2 possa essere usato per eseguire comandi SQL. Non fornisce dettagli sulle configurazioni di rete o sulla configurazione di un client SQL che potrebbe essere necessario nell’ambiente.

In alcuni ambienti specifichi una porta all’avvio del cluster Amazon Redshift. Questa porta viene utilizzata insieme all’URL dell’endpoint del cluster per accedere al cluster. È importante inoltre creare una regola in entrata in un gruppo di sicurezza per consentire l'accesso al cluster attraverso la porta.

Se il computer client è protetto da un firewall, è necessario conoscere una porta aperta che è possibile utilizzare. Questa porta aperta consente di stabilire una connessione con il cluster da uno strumento client SQL ed eseguire query. Se non si dispone di questa informazione, chiedere la collaborazione di qualcuno che sia a conoscenza delle regole del firewall di rete al fine di determinare una porta aperta del firewall.

Sebbene Amazon Redshift usi la porta 5439 per impostazione predefinita, se questa porta del firewall non è aperta la connessione non funziona. Non è possibile modificare il numero di porta per il cluster Amazon Redshift dopo la creazione. Pertanto, assicurarsi di specificare una porta aperta che funziona nell'ambiente durante il processo di avvio.

Fase 1: Creazione di un cluster Amazon Redshift di esempio

In questo tutorial viene illustrato come creare un cluster Amazon Redshift con un database. Quindi devi caricare un set di dati da Amazon S3 nelle tabelle del database. Puoi usare questo cluster di esempio per valutare il servizio Amazon Redshift.

Prima di iniziare a configurare un cluster Amazon Redshift, assicurati di completare tutti i prerequisiti necessari, ad esempio. Definizione delle regole del firewall

Per qualsiasi operazione che accede ai dati da un'altra AWS risorsa, il cluster necessita dell'autorizzazione per accedere alla risorsa e ai dati sulla risorsa per tuo conto. Un esempio consiste nell’uso di un comando SQL COPY per caricare i dati da Amazon Simple Storage Service (Amazon S3). Fornisci tali autorizzazioni utilizzando AWS Identity and Access Management (IAM). A questo scopo utilizza un ruolo IAM che hai creato e collegato al cluster. Per ulteriori informazioni sulle credenziali e sulle autorizzazioni di accesso, consulta Credenziali e autorizzazioni di accesso nella Guida per sviluppatori di database di Amazon Redshift.

Come creare un cluster Amazon Redshift

Accedi Console di gestione AWS e apri la console Amazon Redshift all'indirizzo. https://console.aws.amazon.com/redshiftv2/

Importante
Se si utilizzano le credenziali utente IAM, verificare di disporre delle autorizzazioni necessarie per eseguire le operazioni relative al cluster. Per ulteriori informazioni, consulta Sicurezza di Amazon Redshift nella Guida alla gestione di Amazon Redshift.
Sulla AWS console, scegli Regione AWS dove vuoi creare il cluster.
Dal menu di navigazione, scegliere Clusters (Cluster), quindi Create cluster (Crea cluster). Appare la pagina Create cluster (Crea cluster).
Nella sezione Configurazione del cluster, specificare i valori per Identificatore del cluster, Tipo di nodo e Nodi:
- Identificatore del cluster: inserire examplecluster per questo tutorial. Questo identificatore deve essere univoco. L'identificatore deve contenere un numero di caratteri compreso tra 1 e 63, dove i caratteri validi sono a-z (solo minuscole) e - (trattino).
- Selezionare uno dei seguenti metodi per dimensionare il cluster:
  
  Nota
  Il passaggio seguente presuppone un Regione AWS che supporti i tipi di nodi RG. Per un elenco dei tipi di nodi RG o RA3 Regioni AWS che supportano, consulta Panoramica dei tipi di nodi RG nella Amazon Redshift Management Guide. Per ulteriori informazioni sulle specifiche del nodo per ogni tipo e dimensione di nodo, consulta Dettagli sul tipo di nodo.
  - Se non si conosce la dimensione del cluster, scegliereAiutami a scegliere. In questo modo viene avviato un calcolatore di dimensionamento in cui vengono poste domande sulle dimensioni e sulle caratteristiche delle query dei dati che prevedi di memorizzare nel data warehouse.
    
    Se si conosce la dimensione richiesta del cluster, ovvero il tipo di nodo e il numero di nodi, scegliere Sceglierò. Quindi scegliere il tipo di nodo e il numero di nodi per dimensionare il cluster.
    
    Per questo tutorial, scegli rg.4xlarge per il tipo di nodo e 2 per il numero di nodi.
    
    Se è disponibile una scelta per la configurazione AZ, scegli. Single-AZ
  - Per utilizzare il set di dati di esempio fornito da Amazon Redshift, in Dati di esempio, scegliere Carica dati di esempio. Amazon Redshift carica di default il set di dati di esempio Tickit nel database dev e nello schema public.
Nella sezione Configurazione del database specifica i valori per Nome dell'utente amministratore. In Password dell'amministratore seleziona una delle opzioni seguenti:
- Genera una password: utilizza una password generata da Amazon Redshift.
- Aggiungi manualmente una password dell'amministratore: utilizza una tua password.
- Gestisci le credenziali di amministratore in AWS Secrets Manager: Amazon Redshift le AWS Secrets Manager utilizza per generare e gestire la password di amministratore. L'utilizzo AWS Secrets Manager per generare e gestire la password segreta comporta un costo. Per informazioni sui prezzi di AWS Secrets Manager , consulta Prezzi di AWS Secrets Manager.
Per questo tutorial utilizzare i seguenti valori:
- Nome utente amministratore: inserisci awsuser.
- Password dell’utente amministratore: inserisci Changeit1 per la password.
Per questo tutorial, create un ruolo IAM e impostatelo come predefinito per il cluster, come descritto di seguito. È possibile che sia disponibile un solo set di ruoli IAM predefinito per un cluster.
1. In Autorizzazioni cluster, per Gestisci i ruoli IAM, scegli Creazione di ruolo IAM.
2. Specificare un bucket Amazon S3 per l'accesso al ruolo IAM con uno dei seguenti metodi:
  - Scegliere Nessun bucket Amazon S3 aggiuntivo per consentire al ruolo IAM creato di accedere solo ai bucket Amazon S3 denominati redshift.
  - Scegliere Qualsiasi bucket Amazon S3 per consentire al ruolo IAM creato di accedere a tutti bucket Amazon S3.
  - Scegliere Bucket Amazon S3 specifico per specificare uno o più bucket Amazon S3 a cui il ruolo IAM creato può accedere. Scegli quindi uno o più bucket Amazon S3 dalla tabella.
3. Scegliere Creazione di ruolo IAM come predefinito. Amazon Redshift crea e imposta automaticamente il ruolo IAM come predefinito per il cluster.
  
  Poiché hai creato il tuo ruolo IAM dalla console, questo ha allegata la policy AmazonRedshiftAllCommandsFullAccess. Ciò consente ad Amazon Redshift di copiare, caricare, analizzare i dati ed eseguire query su di essi dalle risorse Amazon nel tuo account IAM.
Per ulteriori informazioni su come gestire il ruolo IAM predefinito per un cluster, consulta Creazione di un ruolo IAM come predefinito per Amazon Redshift nella Guida alla gestione di Amazon Redshift.
(Facoltativo) Nella sezione Configurazioni aggiuntive disattiva Usa impostazioni predefinite per modificare le impostazioni Rete e sicurezza, Configurazione del database, Manutenzione, Monitoraggio e Backup.

In alcuni casi, è possibile creare il cluster con l'opzione Caricare i dati campione e attivare il routing avanzato Amazon VPC. In tal caso, il cluster nel tuo virtual private cloud (VPC) richiede l'accesso all'endpoint Amazon S3 per caricare i dati.

Per rendere il cluster accessibile al pubblico, è possibile eseguire due operazioni. Puoi configurare un indirizzo NAT (Network Address Translation) nel VPC affinché il cluster acceda a Internet. Oppure puoi configurare un endpoint Amazon S3 VPC nel tuo VPC. Per ulteriori informazioni sul routing avanzato di Amazon VPC, consulta Routing Amazon VPC avanzato nella Guida alla gestione di Amazon Redshift.
Scegli Crea cluster. Attendi che il cluster venga creato con lo stato Available nella pagina Cluster.

Fase 2: Configurazione delle regole in ingresso per i client SQL

Nota

Consigliamo di saltare questa fase e accedere al cluster utilizzando Amazon Redshift Query Editor V2.

Più avanti in questo tutorial, si accederà al cluster da un Virtual Private Cloud (VPC) basato sul servizio Amazon VPC. Tuttavia, se per accedere al cluster si utilizza un client SQL esterno al firewall, è necessario concedere l'accesso in entrata.

Per controllare il firewall e concedere l'accesso in ingresso al cluster

S necessario accedere al cluster dall'esterno di un firewall, controlla le regole con cui è configurato. Ad esempio, il client potrebbe essere un'istanza Amazon Elastic Compute Cloud (Amazon EC2) o un computer esterno.

Per ulteriori informazioni sulle regole del firewall, consulta Regole del gruppo di sicurezza nella Guida per l’utente di Amazon EC2.
Per accedere da un client esterno Amazon EC2, aggiungere una regola di ingresso al gruppo di sicurezza collegato al cluster che consenta il traffico in entrata. Le regole del gruppo di sicurezza Amazon EC2 vengono aggiunte nella console Amazon EC2. Ad esempio, a CIDR/IP di 192.0.2. 0/24 consente ai client in quell'intervallo di indirizzi IP di connettersi al cluster. Scopri quello più CIDR/IP adatto al tuo ambiente.

Fase 3: concedere l’accesso a un client SQL ed eseguire query

Per eseguire query sui database ospitati dal cluster Amazon Redshift, sono disponibili diverse opzioni per i client SQL. Ciò include:

Connettiti al cluster ed esegui query utilizzando Amazon Redshift Query Editor V2.

Se utilizzi Query Editor V2, non devi scaricare e configurare un’applicazione client SQL. Avvia Amazon Redshift Query Editor V2 dalla console Amazon Redshift.
Connettiti al cluster tramite RSQL. Per ulteriori informazioni, consulta Connessione con Amazon Redshift RSQL nella Guida alla gestione di Amazon Redshift.
Connect al cluster tramite uno strumento client SQL, ad esempio SQL Workbench/J. Per ulteriori informazioni, consulta Connect to your cluster using SQL Workbench/J nella Amazon Redshift Management Guide.

In questo tutorial viene utilizzato Amazon Redshift Query Editor V2 come soluzione semplice per eseguire query sui database ospitati dal cluster Amazon Redshift. Dopo avere creato il cluster, puoi eseguire immediatamente query. Per informazioni dettagliate sulle considerazioni durante l’utilizzo di Amazon Redshift Query Editor V2, consulta Considerazioni sull’utilizzo di Query Editor V2 nella Guida alla gestione di Amazon Redshift.

Concessione dell'accesso all'editor di query v2

La prima volta che un amministratore configura l'editor di query v2 per te Account AWS, sceglie AWS KMS key quello da utilizzare per crittografare le risorse dell'editor di query v2. Le risorse di Amazon Redshift Query Editor V2 includono le query salvate, i notebook e i grafici. Per impostazione predefinita, una chiave di proprietà AWS viene utilizzata per crittografare le risorse. In alternativa un amministratore può utilizzare una chiave gestita dal cliente scegliendo il nome della risorsa Amazon (ARN) per la chiave nella pagina di configurazione. Dopo aver configurato un account, le impostazioni di AWS KMS crittografia non possono essere modificate. Per ulteriori informazioni, consulta Configurazione dell’ Account AWS nella Guida alla gestione di Amazon Redshift.

Per accedere all'editor della query v2, sono necessarie le opportune autorizzazioni. Un amministratore può collegare una delle policy gestite da AWS per Amazon Redshift Query Editor V2 al ruolo IAM o all’utente per concedere le autorizzazioni. Queste politiche AWS gestite sono scritte con diverse opzioni che controllano il modo in cui l'etichettatura delle risorse consente la condivisione delle query. Puoi utilizzare la console IAM (https://console.aws.amazon.com/iam/) per allegare le policy IAM. Per ulteriori informazioni su queste policy, consulta Accesso a Query Editor V2 nella Guida alla gestione di Amazon Redshift.

Puoi anche creare una policy in base alle autorizzazioni consentite e negate nelle policy gestite fornite. Se si utilizza l'editor policy della console IAM per creare le proprie policy, scegliereSQL Workbench come servizio per il quale si crea la policy nell'editor visivo. L'editor di query v2 utilizza il nome di servizio AWS SQL Workbench nell'editor visivo e in IAM Policy Simulator.

Per informazioni, consulta Utilizzo dell'editor di query v2 nella Guida alla gestione di Amazon Redshift.

Passaggio 4: caricare i dati da Amazon S3 ad Amazon Redshift

Dopo avere creato il cluster, puoi caricare i dati da Amazon S3 nelle tabelle del database. Esistono diversi modi per caricare i dati da Amazon S3.

Puoi utilizzare un client SQL per eseguire il comando SQL CREATE TABLE per creare una tabella nel database e quindi utilizzare il comando SQL COPY per caricare i dati da Amazon S3. Amazon Redshift Query Editor V2 è un client SQL.
Puoi utilizzare la procedura guidata di caricamento di Amazon Redshift Query Editor V2.

In questo tutorial viene illustrato come utilizzare Amazon Redshift Query Editor V2 per eseguire i comandi SQL per CREARE le tabelle e COPIARE i dati. Avvia Query Editor V2 dal riquadro di navigazione della console Amazon Redshift. All’interno di Query Editor V2 crea una connessione al cluster examplecluster e al database denominato dev con l’utente amministratore awsuser. Per questo tutorial scegli Credenziali temporanee che utilizzano un nome utente del database quando crei la connessione. Per informazioni sull’utilizzo di Amazon Redshift Query Editor V2, consulta Connessione a un database Amazon Redshift nella Guida alla gestione di Amazon Redshift.

Caricamento di dati da Amazon S3 con i comandi SQL

Nel riquadro di Query Editor V2 verifica di essere connesso al cluster examplecluster e al database dev. Successivamente crea delle tabelle nel database e caricavi i dati. In questo tutorial, i dati che carichi sono disponibili in un bucket Amazon S3 accessibile da molti. Regioni AWS

Nella procedura seguente vengono create delle tabelle e vengono caricati i dati da un bucket Amazon S3 pubblico.

Se utilizzi Amazon Redshift Query Editor V2 per copiare ed eseguire la seguente istruzione CREATE TABLE per creare una tabella nello schema public del database dev. Per ulteriori informazioni sulla sintassi, consultare CREATE TABLE nella Guida per gli sviluppatori di database di Amazon Redshift.

Come creare e caricare i dati utilizzando un client SQL come Query Editor V2

Esegui il seguente comando SQL per CREARE la tabella sales.



   drop table if exists sales;
   create table sales(
	salesid integer not null,
	listid integer not null distkey,
	sellerid integer not null,
	buyerid integer not null,
	eventid integer not null,
	dateid smallint not null sortkey,
	qtysold smallint not null,
	pricepaid decimal(8,2),
	commission decimal(8,2),
	saletime timestamp);

Esegui il seguente comando SQL per CREARE la tabella date.



drop table if exists date;              
create table date(
	dateid smallint not null distkey sortkey,
	caldate date not null,
	day character(3) not null,
	week smallint not null,
	month character(5) not null,
	qtr character(5) not null,
	year smallint not null,
	holiday boolean default('N'));

Carica la tabella sales da Amazon S3 utilizzando il comando COPY.

Nota
Consigliamo di usare il comando COPY per caricare set di dati di grandi dimensioni in Amazon Redshift da Amazon S3. Per ulteriori informazioni sulla sintassi di COPY, consultare COPY nella Guida per gli sviluppatori di database di Amazon Redshift.

Per caricare i dati di esempio, è necessario fornire al cluster l'autenticazione per accedere ad Amazon S3 per tuo conto. Esegui l’autenticazione facendo riferimento al ruolo IAM creato e impostato come default per il cluster quando hai scelto Crea ruolo IAM come default al momento della creazione del cluster.

Carica la tabella sales utilizzando il seguente comando SQL. Facoltativamente puoi scaricare e visualizzare da Amazon S3 i dati di origine per la tabella sales. .
```
COPY sales
    FROM 's3://redshift-downloads/tickit/sales_tab.txt' 
    DELIMITER '\t' 
    TIMEFORMAT 'MM/DD/YYYY HH:MI:SS' 
    REGION 'us-east-1'
    IAM_ROLE default;
```
Carica la tabella date utilizzando il seguente comando SQL. Facoltativamente puoi scaricare e visualizzare da Amazon S3 i dati di origine per la tabella date. .
```
COPY date
    FROM 's3://redshift-downloads/tickit/date2008_pipe.txt' 
    DELIMITER '|' 
    REGION 'us-east-1'
    IAM_ROLE default;
```

Caricamento di dati da Amazon S3 con Query Editor V2

In questa sezione viene illustrato il caricamento di dati in un cluster Amazon Redshift. L’uso di Query Editor V2 semplifica il caricamento di dati quando utilizzi la procedura guidata Carica dati. Il comando COPY generato e usato in Query Editor V2 della procedura guidata Carica dati supporta molti dei parametri disponibili per la sintassi del comando COPY per caricare i dati da Amazon S3. Per informazioni sul comando COPY e sulle opzioni utilizzate per copiare il caricamento da Amazon S3, consultare COPIA da Amazon Simple Storage Service nella Guida per sviluppatori di database Amazon Redshift.

Per caricare i tuoi dati da Amazon S3 ad Amazon Redshift, Amazon Redshift richiede un ruolo IAM con i privilegi necessari per caricare i dati dal bucket Amazon S3 specificato.

Per caricare i dati personali da Amazon S3 in Amazon Redshift, puoi utilizzare la procedura guidata Carica dati di Query Editor V2. Per ulteriori informazioni su come usare la procedura guidata Carica dati, consulta Caricamento di dati da Amazon S3 nella Guida alla gestione di Amazon Redshift.

Creazione di dati TICKIT nel cluster

TICKIT è un database di esempio che puoi caricare facoltativamente nel cluster Amazon Redshift per imparare a eseguire query sui dati in Amazon Redshift. Puoi creare il set completo di tabelle TICKIT e caricare i dati nel cluster nei seguenti modi:

Quando crei un cluster nella console Amazon Redshift, hai la possibilità di caricare contemporaneamente i dati di esempio TICKIT. Sulla console Amazon Redshift scegli Cluster, Crea cluster. Nella sezione Dati campione seleziona Caricamento dati campione. Amazon Redshift carica il set di dati di esempio nel database dev del cluster Amazon Redshift durante la creazione dei cluster.
Per connetterti a un cluster esistente, esegui le operazioni seguenti:
- Nella barra di navigazione della console Amazon Redshift scegli Cluster.
- Scegli il cluster dal riquadro Cluster.
- Scegli Esegui query sui dati, Esegui query in Query Editor V2.
- Espandi examplecluster nell’elenco delle risorse. Se è la prima volta che ti connetti al cluster, viene visualizzato Connettiti a examplecluster. Scegli Nome utente e password del database. Lascia invariato il database dev. Specifica awsuser per il nome utente e Changeit1 per la password.
- Scegli Crea connessione.
Con Amazon Redshift Query Editor V2 puoi caricare i dati TICKIT in un database di esempio denominato sample_data_dev. Scegli il database sample_data_dev nell’elenco delle risorse. Accanto al nodo tickit scegli l’icona Apri notebook di esempio. Conferma di voler creare il database di esempio.
Amazon Redshift Query Editor v2 crea il database di esempio insieme a un notebook di esempio denominato tickit-sample-notebook. Puoi scegliere Esegui tutto per eseguire questo notebook per effettuare query sui dati nel database di esempio.

Per visualizzare i dettagli dei dati TICKIT, consulta Database di esempio nella Guida per sviluppatori di database di Amazon Redshift.

Fase 5: provare query di esempio utilizzando l'editor di query

Per configurare e utilizzare Amazon Redshift Query Editor V2 per eseguire query su un database, consulta Utilizzo di Query Editor V2 nella Guida alla gestione di Amazon Redshift.

Ora, provare alcune query di esempio, come illustrato di seguito. Per creare nuove query in Query Editor V2, scegli l’icona + nell’angolo in alto a destra del riquadro delle query e scegli SQL. Viene visualizzata una nuova pagina di query in cui puoi copiare e incollare le seguenti query SQL.

Nota

Assicurati di eseguire dapprima la prima query nel notebook, che imposta il valore di configurazione del server search_path sullo schema tickit utilizzando il seguente comando SQL:


set search_path to tickit;

Per ulteriori informazioni sull’utilizzo del comando SELECT, consulta SELECT nella Guida per sviluppatori di database di Amazon Redshift.


-- Get definition for the sales table.
SELECT *    
FROM pg_table_def    
WHERE tablename = 'sales';


-- Find total sales on a given calendar date.
SELECT sum(qtysold) 
FROM   sales, date 
WHERE  sales.dateid = date.dateid 
AND    caldate = '2008-01-05';


-- Find top 10 buyers by quantity.
SELECT firstname, lastname, total_quantity 
FROM   (SELECT buyerid, sum(qtysold) total_quantity
        FROM  sales
        GROUP BY buyerid
        ORDER BY total_quantity desc limit 10) Q, users
WHERE Q.buyerid = userid
ORDER BY Q.total_quantity desc;


-- Find events in the 99.9 percentile in terms of all time gross sales.
SELECT eventname, total_price 
FROM  (SELECT eventid, total_price, ntile(1000) over(order by total_price desc) as percentile 
       FROM (SELECT eventid, sum(pricepaid) total_price
             FROM   sales
             GROUP BY eventid)) Q, event E
       WHERE Q.eventid = E.eventid
       AND percentile = 1
ORDER BY total_price desc;

Fase 6: reimpostazione dell'ambiente

Nei passaggi precedenti hai creato un cluster Amazon Redshift, caricato i dati nelle tabelle ed eseguito query sui dati utilizzando un client SQL come Amazon Redshift Query Editor V2.

Una volta completato il presente tutorial, consigliamo di reimpostare l'ambiente allo stato precedente eliminando il cluster di esempio. I costi del servizio Amazon Redshift continueranno ad essere addebitati fino all'eliminazione del cluster.

Tuttavia, se desideri provare a eseguire le attività descritte in altre guide di Amazon Redshift o le attività descritte in Eseguire comandi per definire e utilizzare un database nel data warehouse, consigliamo di tenere il cluster di esempio in esecuzione.

Come eliminare un cluster

Accedi Console di gestione AWS e apri la console Amazon Redshift all'indirizzo. https://console.aws.amazon.com/redshiftv2/
Dal menu di navigazione, scegliere Clusters (Cluster) per visualizzare l'elenco dei cluster.
Scegli il cluster examplecluster. In Actions (Azioni), scegliere Delete (Elimina). Viene visualizzata la pagina Delete examplecluster?.
Conferma il cluster da eliminare, deseleziona l’impostazione Crea snapshot finale, quindi inserisci delete per confermare l’eliminazione. Scegli Delete cluster (Elimina cluster).

Nella pagina dell'elenco dei cluster, lo stato del cluster viene aggiornato nel corso dell'eliminazione.

Una volta completato il tutorial, sarà possibile trovare ulteriori informazioni su Amazon Redshift e sulle fasi successive in Risorse aggiuntive per saperne di più su Amazon Redshift..

Avvertimento JavaScript è disabilitato o non è disponibile nel tuo browser.

Per usare la documentazione AWS, JavaScript deve essere abilitato. Consulta le pagine della guida del browser per le istruzioni.

Convenzioni dei documenti

Nozioni di base sui data warehouse serverless

Definire e utilizzare un database nel data warehouse