Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Utilizzo di Databricks in Quick Sight
Usa questa sezione per scoprire come connetterti da Quick Sight a Databricks.
Connessione a Databricks
-
Inizia creando un nuovo set di dati. Scegli Dati dal riquadro di navigazione a sinistra.
-
Scegli Crea, quindi Nuovo set di dati.
-
Scegli la scheda dell'origine dati Databricks.
-
Per Nome origine dati, immetti un nome descrittivo per la connessione all'origine dati Databricks, ad esempio
Databricks CS. Poiché puoi creare molti set di dati da una connessione a Databricks, è preferibile assegnare un nome semplice. -
Per Tipo di connessione, seleziona il tipo di rete che stai utilizzando.
-
Rete pubblica se i dati sono condivisi pubblicamente.
-
VPC se i tuoi dati si trovano all'interno di un VPC.
Nota
Se utilizzi VPC e non lo vedi nell'elenco, contatta il tuo amministratore.
-
-
Per Server database, inserisci il nome host dello spazio di lavoro specificato nei dettagli della connessione Databricks.
-
Per Percorso HTTP, inserisci l'URL parziale per l'istanza Spark specificata nei dettagli della connessione Databricks.
-
Per Porta, inserisci la porta specificata nei dettagli della connessione Databricks.
-
Per Nome utente e Password, inserisci le tue credenziali di connessione.
-
Per verificare che la connessione funzioni, scegli Convalida connessione.
-
Per completare e creare l'origine dati, scegli Crea origine dati.
Aggiungere un nuovo set di dati Quick Sight per Databricks
Dopo aver creato una connessione all'origine dati esistente per i dati Databricks, puoi creare set di dati Databricks da utilizzare per l'analisi.
Creazione di un set di dati utilizzando Databricks
-
Scegli Dati a sinistra, quindi scorri verso il basso per trovare la scheda sorgente dati per la tua connessione Databricks. Se disponi di numerose origini dati, puoi utilizzare la barra di ricerca nella parte superiore della pagina per trovare l'origine dati con una corrispondenza parziale sul nome.
-
Scegli la scheda dell'origine dati Databricks, quindi scegli Crea set di dati.
-
Per specificare la tabella a cui desideri connetterti, seleziona prima il catalogo e lo schema che desideri utilizzare. Quindi, per Tabelle, seleziona la tabella che desideri utilizzare. Se preferisci usare la tua istruzione SQL, seleziona Usa SQL personalizzato.
-
Scegli Modifica/Anteprima.
-
(Facoltativo) Per aggiungere altri dati, completa la seguente procedura:
-
Scegli Aggiungi dati in alto a destra.
-
Per connetterti a dati diversi, scegli Cambia origine dati e scegli un set di dati diverso.
-
Segui le istruzioni dell'interfaccia utente per completare l'aggiunta dei dati.
-
Dopo aver aggiunto nuovi dati allo stesso set di dati, scegli Configura questo join (i due punti rossi). Imposta un join per ogni tabella aggiuntiva.
-
Se desideri aggiungere campi calcolati, scegli Aggiungi campo calcolato.
-
Per aggiungere un modello basato sull' SageMaker intelligenza artificiale, scegli Augment with. SageMaker Questa opzione è disponibile solo nell'edizione Quick Suite Enterprise.
-
Deseleziona la casella di controllo per tutti i campi che desideri omettere.
-
Aggiorna tutti i tipi di dati che desideri modificare.
-
-
Al termine, scegli Salva per salvare e chiudere il set di dati.
Guida per l'amministratore di Quick Sight alla connessione di Databricks
Puoi usare Amazon Quick Sight per connetterti a Databricks su. AWS Puoi connetterti a Databricks AWS indipendentemente dal fatto che ti sia registrato tramite AWS Marketplace o tramite il sito Web di Databricks.
Prima di poterti connettere a Databricks, devi creare o identificare le risorse esistenti richieste dalla connessione. Usa questa sezione per raccogliere le risorse necessarie per connetterti da Quick Sight a Databricks.
-
Per informazioni su come ottenere i dettagli della connessione Databricks, consulta Connessioni ODBC e JDBC di Databricks
. -
Per informazioni su come ottenere le credenziali Databricks (token di accesso personale o nome utente e password) per l'autenticazione, consulta Requisiti di autenticazione
nella documentazione di Databricks . Per connetterti a un cluster Databricks, sono necessarie le autorizzazioni
Can Attach ToeCan Restart. Queste autorizzazioni sono gestite in Databricks. Per ulteriori informazioni, consulta Requisiti di autorizzazionenella documentazione di Databricks . -
Se stai configurando una connessione privata per Databricks, puoi saperne di più su come configurare un VPC da utilizzare con Quick Sight, vedi Connessione a un VPC con Amazon Quick Sight nella documentazione di Quick Sight. Se la connessione non è visibile, verifica con un amministratore di sistema che la rete abbia endpoint in ingresso aperti per Amazon Route 53. Il nome host di un'area di lavoro Databricks utilizza un IP pubblico, sono necessarie regole DNS TCP e DNS UDP in entrata e uscita per consentire il traffico sulla porta DNS 53, per il gruppo di sicurezza di Route 53. Un amministratore deve creare un gruppo di sicurezza con 2 regole in entrata: una per DNS (TCP) sulla porta 53 verso il CIDR del VPC e una per DNS (UDP) per la porta 53 verso il CIDR del VPC.
Per i dettagli relativi a Databricks se utilizzi PrivateLink invece di una connessione pubblica, consulta Enable nella documentazione di Databricks. AWS PrivateLink