As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.
Usando Databricks no Quick Sight
Use esta seção para aprender como se conectar do Quick Sight ao Databricks.
Para se conectar ao Databricks
-
Comece criando um conjunto de dados. Escolha Dados no painel de navegação à esquerda.
-
Escolha Criar e, em seguida, Novo conjunto de dados.
-
Escolha o cartão da fonte de dados do Databricks.
-
Em Nome da fonte de dados, insira um nome descritivo para a fonte de dados do Databricks, por exemplo,
Databricks CS. Como você pode criar muitos conjuntos de dados usando uma conexão com o Databricks, é melhor manter o nome simples. -
Em Tipo de conexão, selecione o tipo de rede que você está usando.
-
Rede pública: se seus dados forem compartilhados publicamente.
-
VPC: se seus dados estiverem dentro de uma VPC.
nota
Se você estiver usando a VPC e não a encontrar na lista, consulte seu administrador.
-
-
Em Servidor de banco de dados, insira o Nome de host do espaço de trabalho especificado nos detalhes da conexão do Databricks.
-
Em Caminho HTTP, insira o URL parcial da instância do Spark especificado nos detalhes da conexão do Databricks.
-
Em Porta, insira a porta especificada nos detalhes da conexão do Databricks.
-
Em Nome de usuário e Senha, insira as credenciais de conexão.
-
Para verificar se a conexão está funcionando, clique em Validar conexão.
-
Para finalizar e criar a fonte de dados, clique em Criar fonte de dados.
Adicionando um novo conjunto de dados do Quick Sight para o Databricks
Depois de ter uma conexão de fonte de dados existente para dados do Databricks, você pode criar conjuntos de dados do Databricks para usar na análise.
Para criar um conjunto de dados usando o Databricks
-
Escolha Dados à esquerda e, em seguida, role para baixo para encontrar o cartão de origem de dados para sua conexão com o Databricks. Se você tiver muitas fontes de dados, poderá usar a barra de pesquisa na parte superior da página para encontrar sua fonte de dados com uma correspondência parcial no nome.
-
Escolha o cartão da fonte de dados do Databricks e selecione Criar conjunto de dados.
-
Para especificar a tabela à qual você deseja se conectar, primeiro selecione o catálogo e o esquema que deseja usar. Em seguida, em Tabelas, selecione a tabela que deseja usar. Se preferir usar sua própria instrução SQL, selecione Usar SQL personalizado.
-
Escolha Editar ou visualizar.
-
(Opcional) Para adicionar mais dados, use as seguintes etapas:
-
Escolha Adicionar dados no canto superior direito.
-
Para se conectar a dados diferentes, escolha Alternar fonte de dados e escolha um conjunto de dados diferente.
-
Siga as instruções da interface do usuário para concluir a adição de dados.
-
Após adicionar novos dados ao mesmo conjunto de dados, escolha Configurar esta junção (os dois pontos vermelhos). Configure uma junção para cada tabela adicional.
-
Se quiser adicionar campos calculados, escolha Adicionar campos calculados.
-
Para adicionar um modelo da SageMaker IA, escolha Aumentar com SageMaker. Essa opção está disponível somente na edição Quick Suite Enterprise.
-
Desmarque a caixa de seleção de todos os campos que deseja omitir.
-
Atualize todos os tipos de dados que deseja alterar.
-
-
Quando concluir, escolha Salvar para salvar e fechar o conjunto de dados.
Guia do administrador do Quick Sight para conectar o Databricks
Você pode usar o Amazon Quick Sight para se conectar ao Databricks em. AWS Você pode se conectar ao Databricks AWS se tiver se inscrito no AWS Marketplace ou no site do Databricks.
Antes de se conectar ao Databricks, você cria ou identifica os recursos existentes que a conexão requer. Use esta seção para ajudá-lo a reunir os recursos necessários para se conectar do Quick Sight ao Databricks.
-
Para saber como obter os detalhes da conexão do Databricks, consulte Configure os drivers de ODBC e JDBC do Databricks
. -
Para saber como obter suas credenciais do Databricks (token de acesso pessoal ou nome de usuário e senha) para autenticação, consulte Authentication requirements
na documentação do Databricks . Para se conectar a um cluster do Databricks, você precisa das permissões
Can Attach ToeCan Restart. Essas permissões são gerenciadas no Databricks. Para obter mais informações, consulte Permission Requirementsna documentação do Databricks . -
Se você estiver configurando uma conexão privada para o Databricks, você pode aprender mais sobre como configurar uma VPC para uso com o Quick Sight, consulte Conectando-se a uma VPC com o Amazon Quick Sight na documentação do Quick Sight. Se a conexão não estiver visível, verifique com um administrador do sistema se a rede tem abertos os endpoints de entrada do Amazon Route 53. O nome de host de um espaço de trabalho do Databricks usa um IP público. É necessário que haja regras de entrada e saída de DNS TCP e DNS UDP para permitir o tráfego na porta DNS 53, para o grupo de segurança do Route 53. Um administrador precisa criar um grupo de segurança com duas regras de entrada: uma para DNS (TCP) na porta 53 do CIDR da VPC e outra para DNS (UDP) para a porta 53 do CIDR da VPC.
Para obter detalhes relacionados ao Databricks, se você estiver usando PrivateLink em vez de uma conexão pública, consulte Habilitar AWS PrivateLink
na documentação do Databricks.