翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
Quick Sight での Databricks の使用
このセクションでは、Quick Sight から Databricks に接続する方法について説明します。
Databricks に接続するには
-
まず、新しいデータセットを作成します。左側のナビゲーションペインからデータを選択します。
-
Create then New Dataset を選択します。
-
[Databricks] (データブリック) データソースカードを選択します。
-
[Data source name] (データソース名) に、Databricks のデータソース接続のための分かりやすい名前を入力します (例:
Databricks CS)。Databricks への接続から多数のデータセットを作成できるようにするため、名前はシンプルにしておくことをお勧めします。 -
[Connection type] (接続タイプ) で、使用しているネットワークのタイプを選択します。
-
パブリックネットワーク — データがパブリックに共有されている場合。
-
VPC — データが VPC 内にある場合。
注記
VPC を使用していて、リストに表示されない場合は、管理者に確認してください。
-
-
[Database server] (データベースサーバー) には、Databricks 接続の詳細で指定されている [Hostname of workspace] (ワークスペースのホスト名) を入力します。
-
[HTTP Path] (HTTP パス) には、Databricks 接続の詳細で指定されている [Partial URL for the spark instance] (スパークインスタンスの部分 URL) を入力します。
-
[Port] (ポート) には、Databricks 接続の詳細で指定されている [port] (ポート) を入力します。
-
[Username] (ユーザー名) と [Password] (パスワード) に、接続認証情報を入力します。
-
接続が機能していることを確認するには、[Validate connection] (接続を検証) をクリックします。
-
完了後データソースを作成するには、[Create data source] (データソースの作成) をクリックします。
Databricks 用の新しい Quick Sight データセットの追加
Databricks データの既存のデータソース接続を取得した後、分析に使用する Databricks データセットを作成できるようになります。
Databricks を使用してデータセットを作成するには
-
左側のデータを選択し、下にスクロールして Databricks 接続のデータソースカードを見つけます。データソースが多数ある場合は、ページ上部の検索バーを使って、名前に部分一致するデータソースを検索できます。
-
[Databricks] (データブリック) のデータソースカードを選択し、[Create data set] (データセットの作成) をクリックします。
-
接続するテーブルを指定するには、まず使用する Catalog と Schema を選択します。[Tables] (テーブル) で、使用するテーブルを選択します。独自の SQL ステートメントを使用したい場合は、[Use custom SQL] (カスタム SQL を使用する) を選択します。
-
[Edit/Preview] (編集/プレビュー) を選択します。
-
(オプション) さらにデータを追加するときは、以下の手順を実行します。
-
右上にある [Add data] (データを追加) を選択します。
-
別のデータに接続するときは、[Switch data source] (データソースの切り替え) を選択し、別のデータセットを選択します。
-
UI のプロンプトに従ってデータの追加を完成させます。
-
新しいデータを同じデータセットに追加したら、[Configure this join] (この結合を設定します) (2 つの赤いドット) を選択します。追加した各テーブルで結合をセットアップします。
-
計算フィールドを追加するときは、[Add calculated field] (計算フィールドを追加) を選択します。
-
SageMaker AI からモデルを追加するときは、[SageMaker によるオーグメント] を選択します。このオプションは、Quick Suite Enterprise Edition でのみ使用できます。
-
省略したいフィールドがあるときは、チェックボックスをオフにします。
-
変更するデータ型があれば更新します。
-
-
完了したら、[Save] (保存) を選択し、データセットを保存して閉じます。
Databricks を接続するための Quick Sight 管理者ガイド
Amazon Quick Sight を使用して Databricks に接続できます AWS。Marketplace または Databricks ウェブサイトから にサインアップした AWS かどうかにかかわらず、 で AWS Databricks に接続できます。
Databricks に接続する前に、接続に必要な既存のリソースを作成または特定します。このセクションは、Quick Sight から Databricks に接続するために必要なリソースを収集するのに役立ちます。
-
Databricks 接続の詳細を取得する方法については、「Databricks ODBC and JDBC connections
」(Databricks の ODBC 接続と JDBC 接続) をご覧ください。 -
認証用の Databricks 認証情報 (個人アクセストークンまたはユーザー名とパスワード) を取得する方法については、「Databricks documentation
」(Databricks ドキュメント) の「Authentication requirements 」(認証要件) を参照してください。 Databricks クラスターに接続するには
Can Attach ToとCan Restartの権限が必要です。これらの権限は Databricks で管理されます。詳細については、「Databricks documentation」(Databricks ドキュメント) の「Permission Requirements 」(権限要件) を参照してください。 -
Databricks のプライベート接続を設定する場合は、Quick Sight で使用する VPC を設定する方法の詳細については、Quick Sight ドキュメントの「Amazon Quick Sight を使用した VPC への接続」を参照してください。接続が表示されない場合は、ネットワークに「inbound endpoints for Amazon Route 53」(Amazon Route 53 のインバウンドエンドポイント) が開いていることをシステム管理者に確認してください。Databricks ワークスペースのホスト名はパブリック IP を使用するため、Route 53 セキュリティグループの DNS ポート 53 でのトラフィックを許可するには、DNS TCP と DNS UDP のインバウンドルールとアウトバウンドルールが必要です。管理者は 2 つのインバウンドルールを含むセキュリティグループを作成する必要があります。1 つは VPC CIDR へのポート 53 の DNS (TCP) 用で、もう 1 つは VPC CIDR へのポート 53 の DNS (UDP) 用です。
パブリック接続の代わりに PrivateLink を使用している場合の Databricks 関連の詳細については、Databricks ドキュメント
の「Enable AWS PrivateLink 」を参照してください。