Las traducciones son generadas a través de traducción automática. En caso de conflicto entre la traducción y la version original de inglés, prevalecerá la version en inglés.
Uso de Databricks en Quick Sight
Utilice esta sección para aprender cómo conectarse de Quick Sight a Databricks.
Conexión a Databricks
-
Comience por crear un nuevo conjunto de datos. Selecciona Datos en el panel de navegación de la izquierda.
-
Elija Crear y luego Nuevo conjunto de datos.
-
Elija la tarjeta de origen de datos de Databricks.
-
En Nombre del origen de datos, introduzca un nombre descriptivo para su conexión al origen de datos de Databricks, por ejemplo,
Databricks CS. Como puede crear muchos conjuntos de datos a partir de una conexión a Databricks, es mejor que el nombre sea sencillo. -
En Tipo de conexión, seleccione el tipo de red que utiliza.
-
Red pública: si sus datos se comparten públicamente.
-
VPC: si sus datos están dentro de una VPC.
nota
Si utiliza una VPC y no la ve en la lista, póngase en contacto con su administrador.
-
-
En Servidor de bases de datos, introduzca el Nombre de host o del espacio de trabajo especificado en los detalles de conexión de Databricks.
-
En Ruta HTTP, introduzca la URL parcial de la instancia de Spark especificada en los detalles de su conexión a Databricks.
-
En Puerto, introduzca el puerto especificado en los detalles de conexión de Databricks.
-
En Nombre de usuario y Contraseña, introduzca sus credenciales de conexión.
-
Para comprobar que la conexión funciona, haga clic en Validar conexión.
-
Para terminar y crear el origen de datos, haga clic en Crear origen de datos.
Agregar un nuevo conjunto de datos de Quick Sight para Databricks
Una vez que tenga una conexión de origen de datos existente para los datos de Databricks, podrá crear conjuntos de datos de Databricks para usarlo en el análisis.
Creación de un conjunto de datos con Databricks
-
Elija Datos a la izquierda y, a continuación, desplácese hacia abajo para buscar la tarjeta fuente de datos para su conexión a Databricks. Si tiene muchos orígenes de datos, puede utilizar la barra de búsqueda situada en la parte superior de la página para buscar el origen de datos cuyo nombre coincida parcialmente.
-
Elija la tarjeta de origen de datos de Databricks y, a continuación, elija Crear conjunto de datos.
-
Para especificar la tabla a la que desea conectarse, primero seleccione el catálogo y el esquema que desee usar. Una vez hecho esto, en Tablas, seleccione la tabla que desea usar. Si prefiere usar su propia instrucción SQL, seleccione Usar consulta SQL personalizada.
-
Elija Editar/obtener vista previa.
-
(Opcional) Para agregar más datos, siga los siguientes pasos:
-
Seleccione Añadir datos en la parte superior derecha.
-
Para conectarse a datos diferentes, seleccione Cambiar origen de datos y elija un conjunto de datos diferente.
-
Siga las instrucciones de la interfaz de usuario para terminar de añadir datos.
-
Tras añadir nuevos datos al mismo conjunto de datos, seleccione Configurar esta unión (los dos puntos rojos). Configure una unión para cada tabla adicional.
-
Si desea añadir campos calculados, seleccione Añadir campo calculado.
-
Para añadir un modelo de SageMaker IA, selecciona Aumentar con. SageMaker Esta opción solo está disponible en la edición Quick Suite Enterprise.
-
Desactive la casilla de los campos que desea omitir.
-
Actualice los tipos de datos que desee cambiar.
-
-
Cuando haya terminado, elija Guardar para guardar y cerrar el conjunto de datos.
Guía del administrador de Quick Sight para conectar Databricks
Puedes usar Amazon Quick Sight para conectarte a Databricks on. AWS Puedes conectarte a Databricks AWS tanto si te has registrado a través de AWS Marketplace como a través del sitio web de Databricks.
Antes de poder conectarse a Databricks, debe crear o identificar los recursos existentes que requiere la conexión. Usa esta sección para ayudarte a reunir los recursos que necesitas para conectarte de Quick Sight a Databricks.
-
Para obtener información sobre cómo obtener los detalles de su conexión de Databricks, consulte Conexiones de ODBC y de JDBC de Databricks
. -
Para obtener información sobre cómo obtener sus credenciales de Databricks (token de acceso personal o nombre de usuario y contraseña) para la autenticación, consulte los requisitos de autenticación
en la documentación de Databricks . Para conectarse a un clúster de Databricks, necesita los permisos
Can Attach ToyCan Restart. Estos permisos se administran en Databricks. Para obtener más información, consulte Requisitos de permisosen la documentación de Databricks . -
Si está configurando una conexión privada para Databricks, puede obtener más información sobre cómo configurar una VPC para usarla con Quick Sight; consulte Conexión a una VPC con Amazon Quick Sight en la documentación de Quick Sight. Si la conexión no está visible, compruebe con un administrador del sistema que la red tenga puntos de conexión de entrada abiertos para Amazon Route 53. El nombre de host de un espacio de trabajo de Databricks utiliza una IP pública, es necesario que existan reglas de entrada y salida de TCP y UDP de DNS para permitir el tráfico en el puerto DNS 53, para el grupo de seguridad de Route 53. Un administrador debe crear un grupo de seguridad con dos reglas de entrada: una para el DNS (TCP) en el puerto 53 del CIDR de la VPC y otra para el DNS (UDP) para el puerto 53 del CIDR de la VPC.
Para obtener detalles relacionados con Databricks si utiliza una conexión pública en PrivateLink lugar de una conexión pública, consulte Habilitar en la documentación de Databricks. AWS PrivateLink