Les traductions sont fournies par des outils de traduction automatique. En cas de conflit entre le contenu d'une traduction et celui de la version originale en anglais, la version anglaise prévaudra.
Utilisation de Databricks dans Quick Sight
Utilisez cette section pour savoir comment vous connecter de Quick Sight à Databricks.
Se connecter à Databricks
-
Commencez par créer un nouveau jeu de données. Choisissez Data dans le volet de navigation de gauche.
-
Choisissez Créer, puis Nouvel ensemble de données.
-
Choisissez la carte de source de données Databricks.
-
Pour le Nom de la source de données, entrez un nom descriptif pour votre connexion à la source de données Databricks, par exemple
Databricks CS. Comme vous pouvez créer de nombreux jeux de données à partir d’une connexion à Databricks, il est préférable de conserver un nom simple. -
Pour Type de connexion, sélectionnez le type de réseau que vous utilisez.
-
Réseau public : si vos données sont partagées publiquement.
-
VPC : si vos données se trouvent dans un VPC.
Note
Si vous utilisez un VPC et que celui-ci n’apparaît pas dans la liste, contactez votre administrateur.
-
-
Pour le serveur de base de données, saisissez le nom d’hôte de l’espace de travail spécifié dans les détails de votre connexion Databricks.
-
Pour Chemin HTTP, saisissez l’URL partielle de l’instance Spark spécifiée dans les détails de votre connexion Databricks.
-
Pour Port, saisissez le port spécifié dans les détails de votre connexion Databricks.
-
Dans Nom d’utilisateur et Mot de passe, saisissez vos informations de connexion.
-
Pour vérifier que la connexion fonctionne, cliquez sur Valider la connexion.
-
Pour terminer et créer la source de données, cliquez sur Créer une source de données.
Ajout d'un nouveau jeu de données Quick Sight pour Databricks
Après avoir établi une connexion à une source de données existante pour les données Databricks, vous pouvez créer des jeux de données Databricks à utiliser pour l’analyse.
Créer un jeu de données avec Databricks
-
Choisissez Data sur la gauche, puis faites défiler l'écran vers le bas pour trouver la carte de source de données pour votre connexion Databricks. Si vous avez de nombreuses sources de données, vous pouvez utiliser la barre de recherche en haut de la page pour trouver un correspondance partielle avec votre source de données.
-
Choisissez la carte de source de données Databricks, puis choisissez Créer un jeu de données.
-
Pour spécifier le tableau auquel vous souhaitez vous connecter, sélectionnez d’abord le catalogue et le schéma que vous souhaitez utiliser. Ensuite, dans Tableaux, sélectionnez le tableau que vous souhaitez utiliser. Si vous préférez utiliser votre propre instruction SQL, sélectionnez Utiliser un code SQL personnalisé.
-
Choisissez Modifier/apercevoir.
-
(En option) Pour ajouter d’autres données, procédez comme suit :
-
Choisissez Ajouter des données en haut à droite.
-
Pour vous connecter à différentes données, choisissez Changer de source de données, puis choisissez un autre jeu de données.
-
Suivez les instructions de l’interface utilisateur et terminez l’ajout de données.
-
Après avoir ajouté de nouvelles données au même jeu de données, sélectionnez Configurer cette jointure (les deux points rouges). Configurez une jointure pour chaque tableau supplémentaire.
-
Pour ajouter des champs calculés, Sélectionnez Ajouter un champ calculé.
-
Pour ajouter un modèle issu de SageMaker l'IA, choisissez Augmenter avec SageMaker. Cette option n'est disponible que dans l'édition Quick Suite Enterprise.
-
Décochez tous les champs que vous souhaitez omettre.
-
Mettez à jour les types de données que vous souhaitez modifier.
-
-
Lorsque vous avez terminé, sélectionnez Enregistrer pour enregistrer et fermer le jeu de données.
Guide de connexion à Databricks destiné à l'administrateur de Quick Sight
Vous pouvez utiliser Amazon Quick Sight pour vous connecter à Databricks sur. AWS Vous pouvez vous connecter à Databricks, AWS que vous vous soyez inscrit via AWS Marketplace ou via le site Web de Databricks.
Avant de pouvoir vous connecter à Databricks, vous devez créer ou identifier les ressources existantes requises par la connexion. Utilisez cette section pour vous aider à rassembler les ressources dont vous avez besoin pour vous connecter de Quick Sight à Databricks.
-
Pour savoir comment obtenir les détails de votre connexion Databricks, consultez Connexions Databricks ODBCet JDBC
. -
Pour savoir comment obtenir vos informations d’identification Databricks (jeton d’accès personnel ou nom d’utilisateur et mot de passe) à des fins d’authentification, consultez la section Exigences d’authentification
dans la documentation Databricks . Pour vous connecter à un cluster Databricks, vous avez besoin d’autorisations
Can Attach ToetCan Restart. Ces autorisations sont gérées dans Databricks. Pour plus d’informations, consultez la section Exigences relatives aux autorisationsdans la documentation Databricks. -
Si vous configurez une connexion privée pour Databricks, vous pouvez en savoir plus sur la façon de configurer un VPC pour une utilisation avec Quick Sight. Consultez la section Connexion à un VPC avec Amazon Quick Sight dans la documentation de Quick Sight. Si la connexion n’est pas visible, vérifiez auprès d’un administrateur système que le réseau dispose de points de terminaison entrants ouverts pour Amazon Route 53. Le nom d’hôte d’un espace de travail Databricks utilise une adresse IP publique, ainsi, des règles DNS TCP et DNS UDP entrantes et sortantes sont nécessaires pour autoriser le trafic sur le port DNS 53, à destination du groupe de sécurité Route 53. L’administrateur doit créer un groupe de sécurité avec deux règles entrantes : une pour le DNS (TCP) sur le port 53 du CIDR VPC, et une pour le DNS (UDP) pour le port 53 du CIDR VPC.
Pour plus d'informations sur Databricks, si vous utilisez une connexion PrivateLink plutôt qu'une connexion publique, consultez la section Activer AWS PrivateLink
dans la documentation Databricks.