Unir datos - Amazon QuickSight

Unir datos

Puede utilizar la interfaz de unión de Amazon QuickSight para unir objetos de uno o más orígenes de datos. Al utilizar Amazon QuickSight para unir los datos, puede combinar datos dispares sin duplicar los datos de distintos orígenes.

Tipos de conjuntos de datos unidos

Se realiza una unión entre dos tablas lógicas de QuickSight, donde cada tabla lógica contiene información sobre cómo obtener datos. Al editar un conjunto de datos de QuickSight, el diagrama de unión de la mitad superior de la página muestra cada tabla lógica como un bloque rectangular.

Hay dos tipos diferentes de conjuntos de datos unidos en QuickSight: los del mismo origen y los de orígenes cruzados. Un conjunto de datos se considera del mismo origen cuando no tiene ninguna unión o cuando se cumplen todas las condiciones siguientes:

  • Si alguna de las tablas lógicas hace referencia a un origen de datos de QuickSight:

    • Todas las tablas lógicas de este conjunto de datos deben hacer referencia al mismo origen de datos de QuickSight. Esto no se aplica si dos orígenes de datos de QuickSight distintos hacen referencia a la misma base de datos subyacente. Debe ser exactamente el mismo origen de datos de QuickSight. Para obtener más información sobre el uso de un único origen de datos, consulte Creación de un conjunto de datos utilizando un origen de datos existente.

  • Si alguna de las tablas lógicas hace referencia a un conjunto de datos de QuickSight que es un conjunto de datos principal:

    • El conjunto de datos principal debe utilizar una consulta directa.

    • El conjunto de datos principal debe hacer referencia al mismo origen de datos de QuickSight.

Si no se cumplen las condiciones anteriores, el conjunto de datos se considera una unión entre orígenes.

Información sobre la unión de conjuntos de datos

Tanto las uniones de un conjunto de datos del mismo origen como las de orígenes cruzados tienen las siguientes limitaciones.

¿Cuál es la cantidad máxima de tablas que puede contener un conjunto de datos unido?

Todos los conjuntos de datos unidos pueden contener hasta 32 tablas.

¿Qué tamaño pueden tener los datos unidos?

El tamaño máximo permitido de una unión viene determinado por el modo de consulta y el motor de consulta que se utilice. La siguiente lista proporciona información sobre los diferentes límites de tamaño de las tablas que se van a unir. El límite de tamaño se aplica a todas las tablas secundarias combinadas. No hay límites de tamaño de unión para la tabla principal.

  • Tablas del mismo origen: cuando las tablas se crean a partir de un único origen de datos de consulta, QuickSight no impone restricciones al tamaño de la unión. Esto no anula las limitaciones de tamaño de las uniones que pueda tener el motor de consultas de origen.

  • Conjuntos de datos de orígenes distintos: este tipo de unión contiene tablas de diferentes orígenes de datos que no están almacenadas en SPICE. Para estos tipos de uniones, QuickSight identifica automáticamente la tabla de mayor tamaño del conjunto de datos. El tamaño combinado de todas las demás tablas secundarias debe ser inferior a 1 GB.

  • Conjuntos de datos almacenados en SPICE: este tipo de unión contiene tablas que están incorporadas en SPICE. El tamaño combinado de todas las tablas secundarias de esta unión no puede superar los 20 GB.

Para obtener más información sobre los cálculos de tamaño de conjuntos de datos de SPICE, consulte Estimación del tamaño de los conjuntos de datos de SPICE.

¿Puede un conjunto de datos unido utilizar la consulta directa?

Los conjuntos de datos del mismo origen admiten la consulta directa, siempre que no haya otras restricciones en cuanto al uso de la consulta directa. Por ejemplo, los orígenes de datos de S3 no admiten la consulta directa, por lo que un conjunto de datos de S3 del mismo origen debe utilizar SPICE igualmente.

Los conjuntos de datos de orígenes cruzados deben usar SPICE.

¿Se pueden usar los campos calculados en una combinación?

Todos los conjuntos de datos unidos pueden usar campos calculados, pero los campos calculados no se pueden usar en ninguna cláusula auxiliar.

¿Se pueden usar los datos geográficos en una unión?

Los conjuntos de datos del mismo origen admiten tipos de datos geográficos, pero los campos geográficos no se pueden usar en ninguna cláusula auxiliar.

Los conjuntos de datos de orígenes cruzados no admiten datos geográficos de ninguna forma.

Para ver ejemplos de cómo unir tablas entre orígenes de datos, consulte la publicación Joining across data sources on Amazon QuickSight en AWS Big Data Blog.

Creación de una unión

Utilice el siguiente procedimiento para unir tablas para utilizarlas en un conjunto de datos. Antes de comenzar, importe o conecte a sus datos. Puede crear una unión entre cualquiera de los orígenes de datos admitidos por Amazon QuickSight, excepto los datos del Internet de las cosas (IoT). Por ejemplo, puede añadir archivos de valores separados por comas (.csv), tablas, visualizaciones, consultas SQL u objetos JSON en un bucket de Amazon S3.

Adición de una o más uniones
  1. Abra el conjunto de datos con el que desea trabajar.

  2. (Opcional) Antes de empezar, decida si desea deshabilitar la vista previa generada automáticamente a partir de una muestra de sus datos. Para desactivarla, seleccione Vista previa automática en la parte superior derecha. Está activada de forma predeterminada.

  3. Si aún no ha elegido un modo de consulta, elija Modo de consulta.

    Elija SPICE para almacenar su conjunto de datos en SPICE, o elija Consulta directa para obtener datos en tiempo real en todo momento. Si el conjunto de datos contiene uno o más archivos cargados manualmente, el conjunto de datos se almacena automáticamente en SPICE.

    Si elige SPICE, los datos se incorporan a QuickSight. Los elementos visuales que utilizan el conjunto de datos ejecutan consultas en SPICE, en lugar de en la base de datos.

    Si elige Consulta directa, los datos no se incorporan a SPICE. Los elementos visuales que utilizan el conjunto de datos ejecutan consultas en la base de datos en lugar de en SPICE.

    Si elige el Modo de consulta, asegúrese de establecer claves únicas en la combinación, si corresponde, para mejorar el rendimiento al cargar elementos visuales.

  4. En la página de preparación de datos, seleccione Añadir datos.

  5. En la página Añadir datos que se abre, elija una de las siguientes opciones y siga estos pasos:

    • Agregue datos de un conjunto de datos:

      1. elija Conjunto de datos.

      2. Seleccione un conjunto de datos de la lista.

      3. Elija Seleccionar.

    • Agregue datos de un origen de datos:

      1. Elija Origen de datos.

      2. Seleccione un origen de datos de la lista.

      3. Elija Seleccionar.

      4. Seleccione una tabla de la lista.

      5. Elija Seleccionar.

    • Para crear uniones automáticas, añada una tabla varias veces. Aparece un contador después del nombre. Un ejemplo es Producto, Producto (2) y Producto (3). Los nombres de campos en las secciones Campos o Filtros incluyen el mismo contador para que pueda saber de qué instancia de la tabla proviene un campo.

    • Agregue un archivo nuevo seleccionando Cargar un archivo y, a continuación, elija el archivo que desee unir.

  6. (Opcional) Seleccione Usar consulta SQL personalizada para abrir el editor de consultas y escribir una consulta para un origen de datos de SQL.

  7. (Opcional) Tras añadir datos, interactúe con cada tabla seleccionando su icono de menú. Para reorganizar las tablas, arrástrelas y suéltelas.

    Aparece un icono con puntos rojos para indicar que necesita configurar esta unión. Aparecen dos puntos rojos para las uniones que aún no están configuradas. Para crear uniones, elija el icono de configuración de la primera unión.

    Database icon labeled "Sale" connected to another icon with red dots indicating configuration needed.
  8. (Opcional) Para cambiar una unión existente, vuelva a abrir Configuración de Join seleccionando el icono de unión entre dos tablas.

    Se abre el panel Configuración de Join. En la interfaz de unión, especifique el tipo de unión y los campos que se van a utilizar para unir las tablas.

  9. En la parte inferior de la pantalla, puede ver opciones para establecer un campo de una tabla igual a un campo de otra tabla.

    Join configuration interface showing fields to select and match from Sale and City tables.
    1. En la sección Cláusulas de Join, elija la columna de unión para cada tabla.

      Join configuration interface showing City Key selection in dropdown and join clause setup.

      (Opcional) Si las tablas que ha seleccionado se unen en varias columnas, seleccione Agregar una nueva cláusula de unión. Al hacerlo añade otra fila a las cláusulas de unión, para poder especificar el siguiente conjunto de columnas que unir. Repita este proceso hasta que haya identificado todas las columnas de unión de los dos objetos de datos.

      Join configuration interface showing FeedbackDetails and New custom SQL columns with matching fields.
  10. En el panel Configuración de Join, elija el tipo de unión que desee aplicar. Si los campos de unión son una clave única para una o ambas tablas, active la configuración de clave única. Las claves únicas solo se aplican a las consultas directas, no a los datos de SPICE.

    Para obtener más información sobre las uniones, consulte Tipos de combinación.

    Join types diagram showing Inner, Left, Right, and Full, with Right highlighted as recommended.
  11. Elija Aplicar para confirmar su elecciones.

    Para cancelar sin realizar cambios, seleccione Cancelar.

  12. El icono de unión del espacio de trabajo cambia para mostrar la nueva relación.

    Join icon showing a connection between two database symbols labeled Sale and City.
  13. (Opcional) En la sección Campos, puede usar el menú de cada campo para realizar una o varias de las siguientes acciones:

    • Agregar una jerarquía a un campo geoespacial.

    • Incluir o excluir el campo.

    • Editar el nombre y la descripción del campo.

    • Cambiar el tipo de datos.

    • Añadir un cálculo (un campo calculado).

    • Restringir el acceso solo a mí, para que solo usted pueda verlo. Esto puede resultar útil cuando se agregan campos a un conjunto de datos que ya está en uso.

  14. (Opcional) En la sección Filtros, puede añadir o editar filtros. Para obtener más información, consulte Filtrado de datos en Amazon QuickSight.

Tipos de combinación

Amazon QuickSight admite los siguientes tipos de uniones:

  • Uniones internas

  • Uniones externas izquierda y derecha

  • Uniones externas completas

Examinemos en mayor profundidad qué hacen con sus datos estos tipos de uniones. Para nuestros datos de ejemplo, estamos usando las siguientes tablas denominadas widget y safety rating.

SELECT * FROM safety-rating rating_id safety_rating 1 A+ 2 A 3 A- 4 B+ 5 B SELECT * FROM WIDGET widget_id widget safety_rating_id 1 WidgetA 3 2 WidgetB 1 3 WidgetC 1 4 WidgetD 2 5 WidgetE 6 WidgetF 5 7 WidgetG

Uniones internas

Utilice una unión interna ( Two overlapping circles representing a Venn diagram or intersection concept. ) si desea ver solo los datos donde hay una coincidencia entre dos tablas. Por ejemplo, suponga que realiza una unión interior en las tablas safety-rating y widget.

En el conjunto de resultados siguiente, se eliminan los widgets sin calificaciones de seguridad y se eliminan las calificaciones de seguridad que no están asociadas con ningún widget. Solo se incluyen las filas que coinciden perfectamente.

SELECT * FROM safety-rating INNER JOIN widget ON safety_rating.rating_id = widget.safety_rating_id rating_id safety_rating widget_id widget safety_rating_id 3 A- 1 WidgetA 3 1 A+ 2 WidgetB 1 1 A+ 3 WidgetC 1 2 A 4 WidgetD 2 5 B 6 WidgetF 5

Uniones externas izquierda y derecha

Se denominan también uniones externas izquierda o derecha. Utilice una unión externa izquierda ( Two circles, one blue and one gray, partially overlapping to form a Venn diagram. ) o derecha ( Two circular icons: a gray one with a checkmark and a blue one with an arrow. ) si desea ver todos los datos en una tabla y solo las filas coincidentes de la otra tabla.

En una interfaz gráfica, puede ver qué tabla está a la derecha o la izquierda. En una instrucción SQL, la primera tabla se considera que está a la izquierda. Por lo tanto, elegir una unión exterior izquierda en lugar de una unión exterior derecha sólo depende de cómo se hayan dispuesto las tablas en la herramienta de consulta.

Por ejemplo, suponga que realiza una unión externa izquierda ( Two circles, one blue and one gray, partially overlapping to form a Venn diagram. ) en safety-rating (la tabla izquierda) y widgets (la tabla derecha). En este caso, se devuelven todas las filas de safety-rating y solo se devuelven las filas de widget coincidentes. Puede ver espacios en blanco en el conjunto de resultados donde no hay datos coincidentes.

SELECT * FROM safety-rating LEFT OUTER JOIN widget ON safety_rating.rating_id = widget.safety_rating_id rating_id safety_rating widget_id widget safety_rating_id 1 A+ 2 WidgetB 1 1 A+ 3 WidgetC 1 2 A 4 WidgetD 2 3 A- 1 WidgetA 3 4 B+ 5 B 6 WidgetF 5

Si en su lugar utiliza una unión externa derecha ( Two circular icons: a gray one with a checkmark and a blue one with an arrow. ), llame a las tablas en el mismo orden de modo que safety-rating esté a la izquierda y widgets a la derecha. En este caso, se devuelven solo las filas de safety-rating coincidentes y todas las filas de widget. Puede ver espacios en blanco en el conjunto de resultados donde no hay datos coincidentes.

SELECT * FROM safety-rating RIGHT OUTER JOIN widget ON safety_rating.rating_id = widget.safety_rating_id rating_id safety_rating widget_id widget safety_rating_id 3 A- 1 WidgetA 3 1 A+ 2 WidgetB 1 1 A+ 3 WidgetC 1 2 A 4 WidgetD 2 5 WidgetE 5 B 6 WidgetF 5 7 WidgetG

Uniones externas completas

En ocasiones se denominan solo uniones exteriores, pero este término puede hacer referencia a unión exterior izquierda, unión exterior derecha o unión exterior completa. Para definir el significado, utilizamos el nombre completo: unión exterior completa.

Utilice una unión externa completa ( Two blue circular icons overlapping to form a figure-eight shape. ) para ver los datos que coinciden, además de ambas tablas que no coinciden. Este tipo de unión incluye todas las filas de ambas tablas. Por ejemplo, si realiza una unión exterior completa en las tablas safety-rating y widget, se devuelven todas las filas. Las filas están alineadas donde coinciden y todos los datos adicionales se incluyen en filas distintas. Puede ver espacios en blanco en el conjunto de resultados donde no hay datos coincidentes.

SELECT * FROM safety-rating FULL OUTER JOIN widget ON safety_rating.rating_id = widget.safety_rating_id rating_id safety_rating widget_id widget safety_rating_id 1 A+ 2 WidgetB 1 1 A+ 3 WidgetC 1 2 A 4 WidgetD 2 3 A- 1 WidgetA 3 4 B+ 5 B 6 WidgetF 5 5 WidgetE 7 WidgetG