Combinar datos

La combinación de datos es un método de combinación que agrega a una tabla de datos procedentes de una fuente de datos columnas de datos de otra fuente de datos.

Normalmente se utilizan las combinaciones para llevar a cabo este tipo de relación de datos, pero a veces, dependiendo de factores como el tipo de datos y su granularidad, es mejor utilizar la combinación de datos.

Imagínese, por ejemplo, que tiene datos transaccionales almacenados en Salesforce y datos sobre la cuota almacenados en un libro de trabajo de Excel. Los datos que quiere juntar se encuentran en bases de datos diferentes, y la granularidad de los datos capturados en cada tabla es diferente en cada fuente de datos, por lo que la combinación de datos es la mejor forma de combinar esos datos.

La combinación de datos es útil en las siguientes condiciones:

  • Quiere juntar datos de diferentes bases de datos que no admiten las combinaciones entre bases de datos.

    Las uniones entre bases de datos no admiten conexiones a cubos (por ejemplo, Oracle Essbase) ni a conexiones solo de extracciones (por ejemplo, Google Analytics). En este caso, deberá crear fuentes de datos individuales para los datos que desea analizar y, a continuación, usar la combinación de datos para combinar las fuentes de datos en una única hoja.

  • Los datos se encuentran en diferentes niveles de detalle.

    En ocasiones, un conjunto de datos puede capturar datos usando una granularidad mayor o menor que el otro conjunto de datos.

    Por ejemplo, supongamos que está analizando datos de transacciones y de cuotas. Los datos transaccionales pueden capturar todas las transacciones Pero los datos de cuota pueden agregar transacciones a nivel de trimestre Como los valores transaccionales se capturan en diferentes niveles de detalle en cada conjunto de datos, debe utilizar la combinación de datos para combinar los datos.

Use la combinación de datos en lugar de las combinaciones en las siguientes condiciones:

  • Los datos necesiten una limpieza.

    Si las tablas no se relacionan correctamente tras una combinación, cree fuentes de datos para cada tabla, realice los ajustes personalizados necesarios (es decir, cambie el nombre de las columnas o sus tipos de datos, cree grupos, use cálculos, etc.) y, a continuación, use la combinación de datos para juntar los datos.

  • Las combinaciones generen datos duplicados.

    La duplicación de datos después de una combinación en un síntoma de la presencia de datos con diferentes niveles de detalle. Si observa datos duplicados, en vez de crear una combinación, use la combinación de datos para combinarlos en función de una dimensión común.

  • Tenga muchos datos.

    Por lo general, se recomienda usar combinaciones para juntar datos de la misma base de datos. La base de datos gestiona las combinaciones, lo que permite a las combinaciones aprovechar algunas de las funcionalidades nativas de la base de datos. Sin embargo, si trabaja con grandes conjuntos de datos, las combinaciones pueden sobrecargar la base de datos y afectar considerablemente al rendimiento. En este caso, la combinación de datos puede ser la solución. Dado que Tableau gestiona la combinación de los datos tras su agregación Hay menos datos que combinar y, normalmente, al bajar la cantidad de datos que combinar, mejora el rendimiento.

    Nota: Al realizar la combinación en un campo con una alta granularidad, por ejemplo, con fechas en lugar de años, las consultas pueden ralentizarse.

Requisitos previos para la combinación de datos

Para poder utilizar la combinación de datos, sus datos deben cumplir los siguientes requisitos.

Fuentes de datos primaria y secundaria

La combinación de datos requiere una fuente de datos primaria y por lo menos una secundaria. Al designar una fuente de datos primaria, actúa como la tabla o fuente de datos principal. Las fuentes de datos posteriores que utilice en la hoja se considerarán fuentes de datos secundarias. En la vista solo aparecen las columnas de la fuente de datos secundaria que tienen coincidencias en la fuente de datos primaria.

Tomando como ejemplo el caso anterior, se designan los datos transaccionales como fuente de datos primaria y los datos de cuota, como fuente de datos secundaria.

Nota: las fuentes de datos de cubo (multidimensionales) se deben usar como fuente de datos primaria. No se pueden usar como fuente de datos secundaria.

Relación definida entre las fuentes de datos primaria y secundaria

Una vez designadas las fuentes de datos primaria y secundaria, debe definir la dimensión o dimensiones comunes entre ambas fuentes de datos. Esta dimensión común se llama campo de vinculación.

Continuando con el ejemplo anterior, cuando combina datos transaccionales y de cuota, el campo de fecha puede ser el campo de vinculación entre las fuentes de datos primaria y secundaria.

  • Si los campos de fecha de las dos fuentes de datos se llaman igual, Tableau crea la relación entre ambos campos y muestra un icono de vínculo () al lado del campo de fecha de la fuente de datos secundaria cuando el campo está en la vista.

  • En caso de que ambas dimensiones no tengan el mismo nombre, puede definir una relación que cree un mapeo correcto entre los campos de fecha en las fuentes de datos primaria y secundaria.

Diferencias entre las combinaciones y la combinación de datos

La combinación de datos simula una combinación izquierda tradicional. La diferencia principal es el momento en el que se efectúa la combinación con respecto a la agregación.

Combinación izquierda

Cuando usa una combinación izquierda para juntar datos, se envía una consulta a la base de datos en la que se lleva a cabo la combinación. Al usar una combinación izquierda, se indican todas las filas de la tabla izquierda y las de la tabla derecha que tienen una fila correspondiente en la tabla izquierda. A continuación, los resultados de la combinación se vuelven a enviar a Tableau para que los agregue.

Por ejemplo, supongamos que tiene las siguientes tablas. Si las columnas comunes son ID de usuario e ID de patrocinador, una combinación izquierda toma todos los datos de la tabla izquierda, así como todos los datos de la tabla derecha, puesto que cada fila tiene una coincidencia de filas correspondiente en la tabla izquierda.

 

 

Combinación de datos

Cuando usa la combinación de datos para juntar datos, se envía una consulta a la base de datos para cada fuente de datos que se usa en la hoja. Los resultados de las consultas, incluidos los datos agregados, se envían de vuelta a Tableau para que los combine. La vista utiliza todas las filas de la fuente de datos primaria, la tabla izquierda, y las filas agregadas de la fuente de datos secundaria, la tabla derecha, según la dimensión de los campos de vinculación. Los valores de dimensión se agregan con la función de agregación ATTR, de modo que la que la agregación indica un único valor para todas las filas de la fuente de datos secundaria. Si hay varios valores para las filas, se muestra un asterisco (*). Los valores de medidas se agregan en función de cómo se agrega el campo en la vista.

Si cambia el campo de vinculación o añade más, se pueden incluir filas de datos diferentes o adicionales desde la fuente de datos secundaria en la combinación, de modo que los valores agregados cambian.

Por ejemplo, supongamos que tiene las siguientes tablas. Si los campos de vinculación son ID de usuario e ID de patrocinador, al combinar los datos se toman todos los datos de la tabla izquierda y se suplementa la tabla izquierda con los datos de la tabla derecha. En este caso, no todos los valores pueden formar parte de la tabla resultante debido a lo siguiente:

  • Hay una fila de la tabla izquierda que no tiene una coincidencia de fila correspondiente en la tabla derecha, como indica el valor nulo.

  • Hay varios valores correspondientes en las filas de la tabla derecha, como indica el asterisco (*).

 

 

 

Supongamos que tiene las mismas tablas de arriba, pero la fuente de datos secundaria contiene el nuevo campo Multas. Como antes, si los campos de vinculación son ID de usuario e ID de patrocinador, al combinar los datos se toman todos los datos de la tabla izquierda y se sustituyen por datos de la tabla derecha. En el ejemplo anterior puede ver el mismo valor nulo y los asteriscos, además de lo siguiente:

  • Como el campo Multas es una medida, puede ver los valores de las filas del campo Multas agregados antes de que los datos de la tabla derecha se combinen con los datos de la tabla izquierda.

  • Como en el ejemplo anterior, hay una fila en la tabla izquierda que no tiene una fila correspondiente para el campo Multas, como indica el segundo valor nulo.

 

 

Combinar los datos

Puede usar la combinación de datos cuando tenga datos en dos fuentes de datos aparte que quiera analizar juntos en una sola hoja. En el ejemplo siguiente se realiza una demostración de cómo combinar datos de dos fuentes de datos: una de Excel y otra de SQL Server.

Paso 1: conéctese a los datos y configure la fuente de datos
  1. Conéctese a un conjunto de datos y configure la fuente de datos en la página Fuente de datos. En este ejemplo se utiliza la fuente de datos Sample - Superstore.

  2. Seleccione Datos > Nueva fuente de datos, conéctese al segundo conjunto de datos y, a continuación, configure la fuente de datos. En este ejemplo se usa una fuente de datos de SQL Server que contiene información sobre la previsión de ventas (Plan de ventas).

  3. Haga clic en la pestaña de hoja para empezar a crear la vista.

Paso 2: Designar una fuente de datos primaria

Arrastre como mínimo un campo de la fuente de datos primaria a la vista para designarla como fuente de datos primaria.

  1. En el panel Datos, haga clic en la fuente de datos que desea designar como la fuente de datos primaria. En este ejemplo se ha seleccionado Sample - Superstore.

  2. Arrastre los campos que quiera usar desde la fuente de datos a la vista. En este ejemplo, se ha creado una vista donde se muestran las ventas por segmento y categoría.

Paso 3: Designar una fuente de datos secundaria

Los campos utilizados en la vista de las fuentes de datos que no sean la primaria ni vínculos activos designan automáticamente las fuentes de datos siguientes como la fuente de datos secundaria.

  1. En el panel Datos, haga clic en la fuente de datos que desea designar como fuente de datos secundaria. En este ejemplo, se ha seleccionado la fuente de datos Plan de ventas.

    Al completar este paso, se muestra una barra naranja en la parte inferior del lado izquierdo del panel Datos. La barra naranja indica la fuente de datos secundaria. Además de la barra naranja, se muestran iconos de vínculos rotos al lado de posibles campos vinculantes.

  2. Haga clic en un icono de vínculo roto () para establecer una relación entre las fuentes de datos primaria y secundaria. Este es el campo que determina el nivel de detalle en el que Tableau tiene que agregar los datos. En este ejemplo, el campo vinculante es Segmento.

    Si no aparece ningún icono de vínculo roto al lado del campo que debería ser el campo vinculante o no aparecen vínculos dañados, consulte Paso 4: Definir o editar relaciones (opcional).

  3. Arrastre los campos que quiera usar desde la fuente de datos secundaria a la vista. En este ejemplo se usa el campo Plan de ventas en la tarjeta Detalle para cambiar el nivel de detalle de la vista.

Paso 4: Definir o editar relaciones (opcional)

Tableau detecta cuando un campo de la fuente de datos primaria también aparece en una fuente de datos secundaria; además, indica que los campos son campos vinculantes potenciales marcándolos con un icono de vínculo roto en el panel Datos. Haga clic en un icono de vínculo roto para establecer una relación entre las fuentes de datos primaria y secundaria, y para que Tableau combine los datos de las dos fuentes de datos en una misma hoja.

Debe tener como mínimo un campo vinculado para usar los datos de la fuente de datos secundaria.

  1. Seleccione Datos > Editar relaciones.

  2. En el cuadro de diálogo Relaciones, asegúrese de seleccionar la fuente de datos primaria en la lista desplegable Fuente de datos primaria. En este ejemplo se ha seleccionado la fuente de datos Sample - Superstore.

  3. Seleccione un valor en el panel Fuente de datos secundaria, seleccione Personalizado en la lista de relaciones y, a continuación, haga clic en el botón Añadir. En este ejemplo, se ha seleccionado la fuente de datos Plan de ventas.

  4. En el cuadro de diálogo Añadir/Editar asignación de campos, siga este procedimiento:

    1. Seleccione un campo de la fuente de datos primaria.

    2. Seleccione un campo de la fuente de datos secundaria para establecer el campo vinculante o la relación entre las fuentes de datos, aunque los campos no tengan el mismo nombre.

    3. Haga clic en Aceptar.

      En este ejemplo se ha seleccionado una relación entre el campo Segmento de la fuente de datos de ejemplo Superstore – Sample y el campo Segmento de clientes de la fuente de datos Plan de ventas. A continuación, podrá asignar estos dos campos para crear una relación, incluso aunque no tengan el mismo nombre.

  5. (Opcional) Siga añadiendo y quitando tantas relaciones como sea necesario y, a continuación, haga clic en Aceptar.

    Los campos relacionados se muestran en la fuente de datos secundaria como posibles campos vinculantes.

  6. Haga clic en el icono de vínculo roto () junto a estos campos del panel Datos para activar la relación entre las fuentes de datos primaria y secundaria. En este caso, se activa el icono de vínculo roto que hay junto a Segmento de clientes ().

    Si en la vista se usa el campo relacionado de la fuente de datos primaria, el vínculo se activa automáticamente.

Cuando se usa la combinación de datos, la relación encuentra coincidencias de valores en función de los alias de los miembros. Para corregir los campos que no coincidan, edite los alias. Por ejemplo, al asignar un campo Segmento de la fuente de datos primaria al campo Segmento de la fuente de datos secundaria, “Pequeña empresa” no se asigna correctamente a “PE”. Debe editar los alias de una de las fuentes de datos. Para obtener más información, consulte Crear alias para cambiar el nombre de los miembros en la vista.

También puede usar una fuente de datos secundaria para volver a asignar un alias a los valores de campo de una fuente de datos primaria. Para obtener más información, consulte Asignar un alias a valores de campo utilizando la combinación de datos.

Limitaciones de la combinación de datos

Existen algunas limitaciones de combinación de datos relacionadas con agregados no aditivos, como COUNTD, MEDIAN y RAWSQLAGG. Para obtener más información, consulte Solucionar problemas de combinación de datos.

Otros artículos en esta sección

¡Gracias por sus comentarios! Se ha producido un error al enviar sus comentarios.