Le traduzioni sono generate tramite traduzione automatica. In caso di conflitto tra il contenuto di una traduzione e la versione originale in Inglese, quest'ultima prevarrà.
Utilizzo del driver JDBC Hive
Puoi utilizzare i più diffusi strumenti di business intelligence come Microsoft Excel e Tableau con Amazon EMR per esplorare e visualizzare i tuoi dati. MicroStrategy QlikView Molti di questi strumenti richiedono un driver Java Database Connectivity (JDBC) o un driver Open Database Connectivity (ODBC). Amazon EMR supporta la connettività JDBC e ODBC a un cluster Spark, Hive o Presto.
L'esempio seguente dimostra l'utilizzo di SQL Workbench/J come client SQL per connettersi a un cluster Hive in Amazon EMR. Per ulteriori driver, consulta Utilizzo degli strumenti di Business Intelligence con Amazon EMR.
Prima di installare e lavorare con SQL Workbench/J, scaricare il pacchetto e installare il driver. I driver inclusi nel pacchetto supportano le versioni Hive disponibili in Amazon EMR versioni di rilascio 4.0 e successive. Per informazioni dettagliate sulle note di rilascio e sulla documentazione, consulta la documentazione PDF inclusa nel pacchetto.
-
I pacchetti driver JDBC e ODBC più recenti
http://awssupportdatasvcs.com/bootstrap-actions/Simba/latest/
Per installare e configurare SQL Workbench
-
Scarica il Workbench/J client SQL per il tuo sistema operativo da. http://www.sql-workbench.net/downloads.html
-
Installare SQL Workbench/J. Per ulteriori informazioni, vedere Installazione e avvio di SQL Workbench/J
nel Manuale dell'utente di SQL Manual. Workbench/J -
Utenti Linux, Unix, Mac OS X: in una sessione terminale, creare un tunnel SSH per il nodo master del cluster usando il seguente comando. Sostituiscilo
master-public-dns-namecon il nome DNS pubblico del nodo master epath-to-key-filecon la posizione e il nome del file della chiave EC2 privata Amazon (.pem).ssh -o ServerAliveInterval=10 -ipath-to-key-file-N -L 10000:localhost:10000 hadoop@master-public-dns-nameUtenti di Windows: in una sessione PuTTY è necessario creare un tunnel SSH per il nodo master del cluster (tramite inoltro porta locale) con
10000per Source port (Porta di origine) eper Destination (Destinazione). Sostituiremaster-public-dns-name:10000con il nome DNS pubblico del nodo master.master-public-dns-name -
Aggiungere il driver JDBC a SQL Workbench.
-
Nella finestra di dialogo Select Connection Profile (Seleziona profilo di connessione), fare clic su Manage Drivers (Gestisci driver).
-
Fare clic sull'icona Create a new entry (Crea nuova voce) (pagina bianca).
-
Nel campo Nome digitare
Hive JDBC. -
Per Library (Libreria), fare clic sull'icona Select the JAR file(s) (Seleziona file JAR).
-
Accedere alla posizione contenente i driver estratti. Selezionare i driver inclusi nella versione del pacchetto di driver JDBC scaricata e fare clic su Open (Apri).
Ad esempio, il pacchetto di driver JDBC può includere quanto segue. JARs
hive_metastore.jar hive_service.jar HiveJDBC41.jar libfb303-0.9.0.jar libthrift-0.9.0.jar log4j-1.2.14.jar ql.jar slf4j-api-1.5.11.jar slf4j-log4j12-1.5.11.jar TCLIServiceClient.jar zookeeper-3.4.6.jar -
Nella finestra di dialogo Please select one driver (Selezionare un driver), selezionare
com.amazon.hive.jdbc41.HS2Driver, OK.
-
-
Quando si torna alla finestra di dialogo Manage Drivers (Gestisci driver), verificare che il campo Classname sia popolato e selezionare OK.
Quando si ritorna alla finestra di dialogo Select Connection Profile (Seleziona profilo di connessione), verificare che il campo Driver sia impostato su Hive JDBC (JDBC Hive) e fornire la seguente stringa di connessione nel campo URL:
jdbc:hive2://localhost:10000/default.Selezionare OK per connettersi. Una volta completata la connessione, i dettagli della connessione vengono visualizzati nella parte superiore della finestra SQL Workbench/J .
Per ulteriori informazioni sull'uso di Hive e dell'interfaccia JDBC, consulta HiveClient