Terjemahan disediakan oleh mesin penerjemah. Jika konten terjemahan yang diberikan bertentangan dengan versi bahasa Inggris aslinya, utamakan versi bahasa Inggris.
Menggunakan Databricks dalam Quick Sight
Gunakan bagian ini untuk mempelajari cara menghubungkan dari Quick Sight ke Databricks.
Untuk terhubung ke Databricks
-
Mulailah dengan membuat dataset baru. Pilih Data dari panel navigasi di sebelah kiri.
-
Pilih Buat lalu Dataset Baru.
-
Pilih kartu sumber data Databricks.
-
Untuk nama sumber Data, masukkan nama deskriptif untuk koneksi sumber data Databricks Anda, misalnya.
Databricks CSKarena Anda dapat membuat banyak kumpulan data dari koneksi ke Databricks, yang terbaik adalah menjaga namanya tetap sederhana. -
Untuk jenis Koneksi, pilih jenis jaringan yang Anda gunakan.
-
Jaringan publik — jika data Anda dibagikan secara publik.
-
VPC — jika data Anda berada di dalam VPC.
catatan
Jika Anda menggunakan VPC, dan Anda tidak melihatnya terdaftar, tanyakan kepada administrator Anda.
-
-
Untuk server Databricks, masukkan nama host ruang kerja yang ditentukan dalam detail koneksi Databricks Anda.
-
Untuk Jalur HTTP, masukkan URL Partial untuk instance spark yang ditentukan dalam detail koneksi Databricks Anda.
-
Untuk Port, masukkan port yang ditentukan dalam detail koneksi Databricks Anda.
-
Untuk Nama Pengguna dan Kata Sandi, masukkan kredensil koneksi Anda.
-
Untuk memverifikasi koneksi berfungsi, klik Validasi koneksi.
-
Untuk menyelesaikan dan membuat sumber data, klik Buat sumber data.
Menambahkan dataset Quick Sight baru untuk Databricks
Setelah Anda memiliki koneksi sumber data yang ada untuk data Databricks, Anda dapat membuat dataset Databricks untuk digunakan untuk analisis.
Untuk membuat dataset menggunakan Databricks
-
Pilih Data di sebelah kiri, lalu gulir ke bawah untuk menemukan kartu sumber data untuk koneksi Databricks Anda. Jika Anda memiliki banyak sumber data, Anda dapat menggunakan bilah pencarian di bagian atas halaman untuk menemukan sumber data Anda dengan kecocokan sebagian pada nama.
-
Pilih kartu sumber data Databricks, lalu pilih Buat kumpulan data.
-
Untuk menentukan tabel yang ingin Anda sambungkan, pertama-tama pilih Katalog dan Skema yang ingin Anda gunakan. Kemudian, untuk Tabel, pilih tabel yang ingin Anda gunakan. Jika Anda lebih suka menggunakan pernyataan SQL Anda sendiri, pilih Gunakan SQL kustom.
-
Pilih Edit/Pratinjau.
-
(Opsional) Untuk menambahkan lebih banyak data, gunakan langkah-langkah berikut:
-
Pilih Tambahkan data di kanan atas.
-
Untuk menyambung ke data yang berbeda, pilih Ganti sumber data, dan pilih kumpulan data yang berbeda.
-
Ikuti petunjuk UI untuk menyelesaikan penambahan data.
-
Setelah menambahkan data baru ke kumpulan data yang sama, pilih Konfigurasikan gabungan ini (dua titik merah). Siapkan gabungan untuk setiap tabel tambahan.
-
Jika Anda ingin menambahkan bidang terhitung, pilih Tambahkan bidang terhitung.
-
Untuk menambahkan model dari SageMaker AI, pilih Augment with SageMaker. Opsi ini hanya tersedia dalam edisi Quick Suite Enterprise.
-
Kosongkan kotak centang untuk bidang apa pun yang ingin Anda hilangkan.
-
Perbarui tipe data apa pun yang ingin Anda ubah.
-
-
Setelah selesai, pilih Simpan untuk menyimpan dan menutup kumpulan data.
Panduan Quick Sight Administrator untuk menghubungkan Databricks
Anda dapat menggunakan Amazon Quick Sight untuk terhubung ke Databricks aktif. AWS Anda dapat terhubung ke Databricks AWS apakah Anda mendaftar melalui AWS Marketplace atau melalui situs web Databricks.
Sebelum Anda dapat terhubung ke Databricks, Anda membuat atau mengidentifikasi sumber daya yang ada yang diperlukan koneksi. Gunakan bagian ini untuk membantu Anda mengumpulkan sumber daya yang Anda butuhkan untuk terhubung dari Quick Sight ke Databricks.
-
Untuk mempelajari cara mendapatkan detail koneksi Databricks Anda, lihat Koneksi Databricks ODBC
dan JDBC.. -
Untuk mempelajari cara mendapatkan kredensi Databricks Anda—token akses pribadi atau nama pengguna dan kata sandi—untuk autentikasi, lihat Persyaratan otentikasi dalam dokumentasi Databricks.
Untuk terhubung ke cluster Databricks, Anda perlu
Can Attach TodanCan Restartizin. Izin ini dikelola di Databricks. Untuk informasi selengkapnya, lihat Persyaratan Izindalam dokumentasi Databricks.. -
Jika Anda menyiapkan koneksi pribadi untuk Databricks, Anda dapat mempelajari lebih lanjut tentang cara mengonfigurasi VPC untuk digunakan dengan Quick Sight, lihat Menghubungkan ke VPC dengan Amazon Quick Sight dalam dokumentasi Quick Sight. Jika koneksi tidak terlihat, verifikasi dengan administrator sistem bahwa jaringan memiliki titik akhir masuk terbuka untuk Amazon Route 53. nama host dari ruang kerja Databricks menggunakan IP publik, perlu ada aturan masuk dan keluar DNS TCP dan DNS UDP untuk mengizinkan lalu lintas pada port DNS 53, untuk grup keamanan Route 53. Administrator perlu membuat grup keamanan dengan 2 aturan masuk: satu untuk DNS (TCP) pada port 53 ke VPC CIDR dan satu untuk DNS (UDP) untuk port 53 ke VPC CIDR.
Untuk detail terkait Databricks jika Anda menggunakan PrivateLink bukan koneksi publik, lihat Mengaktifkan AWS PrivateLink
dalam dokumentasi Databricks.