Blog > Visualización de datos: diagrama aluvial

Visualización de datos: diagrama aluvial

Un diagrama aluvial es un tipo de visualización que muestra cambios a lo largo del tiempo en forma de flujos. Con algunos ejemplos te indicamos para qué sirven y te damos recomendaciones para su uso.

Disponible en:

Diagrama aluvial de la población de las ciudades de África de 1960 a 2025

Diagrama aluvial de la población de las ciudades de África de 1960 a 2025. Fuente: AFRICA - Big Change / Big Chance - Triennale di Milano

Por Juan Pablo Garnica Munévar. Publicado: 30 de septiembre de 2021.

¿Qué es un diagrama aluvial?

El diagrama aluvial es un tipo de diagrama de flujo que representa cambios en una estructura de red sobre el tiempo. En ese sentido, es útil para identificar patrones y tendencias. Recibe su nombre por el abanico aluvial, que es una corriente de agua que se extiende en una zona que se vuelve plana, así que hace referencia tanto a su forma como al flujo (en).

Trabaja con variables categóricas o cualitativas, que se asignan a ejes verticales paralelos.

Estos ejes cuentan con varios valores en forma de bloques. Cada bloque tiene cierto tamaño y por ellos pasan uno o más campos de flujo con diferentes proporciones que cambian a lo largo del tiempo.

¿Para qué sirve?

Según Data Viz Project (en), sirve para comparar, correlacionar, distribuir e identificar tendencias sobre el tiempo. Alberto Cairo considera a los diagramas de flujo como alternativas de gráficos de área apiladas (en), ya que muestran una parte del todo y rankings.

Martin Rosvall y Carl T. Bergstrom lo destacan por resaltar y resumir cambios estructurales significativos en ciencia, economía y negocios (en).

Los diagramas aluviales no suelen tener etiquetas del valor del campo de flujo (el número equivalente), así que se parte de estimaciones en la mayoría de los casos. Puedes decir que un campo de flujo es más grande que otro, pero no por cuánto. Te da una imagen general de los flujos.

Titanic: lo que el agua se llevó

Michał Bojanowski es el creador del paquete “alluvial” en el lenguaje de programación R y de uno de los ejemplos más famosos de los diagramas aluviales: las características demográficas de quienes sobrevivieron y fallecieron tras el hundimiento del Titanic (en). Las cuatro variables que tuvo en cuenta fueron la clase de pasajes, el sexo, la edad y si sobrevivieron.

Características demográficas de quienes sobrevivieron y fallecieron tras el hundimiento del Titanic

Características demográficas de quienes sobrevivieron y fallecieron tras el hundimiento del Titanic. Fuente: Creating Alluvial Diagrams

El color naranja identifica a las personas que sobrevivieron. A partir de la visualización podemos comparar qué clase tenía más personas, cuántas de ellas eran de cierto sexo y, de estas, la frecuencia de sobrevivientes.

Si nos enfocamos en los bloques de los ejes verticales que representan las variables, podemos ver un gráfico de barras apiladas. La diferencia es que las variables se relacionan e indican sus proporciones: todas las barras son clasificaciones del mismo conjunto de datos. Podemos conocer de los menores de edad, por ejemplo, cuántos estaban en la tercera clase, eran hombres y no sobrevivieron.

Recomendaciones

Diagrama aluvial sobre los cambios en los campos de la ciencia

Diagrama aluvial sobre los cambios en los campos de la ciencia. Fuente: Mapping Change in Large Networks

De la visualización pionera de Martin Rosvall y Carl T. Bergstrom sobre el mapeo del cambio en la ciencia (en) se pueden extraer varias recomendaciones:

  • Los colores se usan para resaltar un campo de flujo o componente de interés. Es el caso de la neurociencia, como una disciplina con trayectoria y que se vuelve independiente.
  • Los campos de flujo tienen un orden según su tamaño. El de Rosvall y Bergstrom va de menor a mayor, pero usualmente los campos de flujo más grandes van primero. No obstante, también se tiene en cuenta la posición de los bloques para disminuir los campos de flujos que atraviesan a otros y los tapan.
  • Con el fin de hacer transiciones suaves, los campos de flujo deberían ser curvados, usar gradientes en uniones o divergencias (más usuales en Sankeys que en aluviales) y representar los cambios significativos (los más grandes).

Este tipo de visualización ayuda a responder estas preguntas: ¿Qué dimensión o componente en forma de campo de flujo tiene más cambios a lo largo del tiempo? ¿Cuál campo de flujo es el más grande y se mantiene a lo largo de la visualización? ¿Cuáles son las combinaciones existentes de los valores de las variables?

Visualizaciones relacionadas

El diagrama de Sankey es un tipo de visualización cercano al diagrama aluvial. Ambos son diagramas de flujo. Sin embargo, Ben Peterson, creador de DataSmith, advierte las diferencias entre los dos tipos (en). Señala que pueden ser confundidos por los campos de flujo, el movimiento de cada uno y los bloques.

Mientras que los diagramas aluviales parten de los valores que toma un componente o campo de flujo a través variables categóricas (sexo, grupo etario, o grupos poblacionales), el Sankey se concentra en el flujo de energía, es decir, sus derivaciones y respectivas cantidades. Además, sus bloques no se encuentran necesariamente en un mismo punto. Por último, aunque los Sankey son más conocidos, los diagramas aluviales son más fáciles de hacer.

Data Viz Project (en) considera que el diagrama aluvial es una variación curvada de los conjuntos paralelos para variables categóricas. También es similar al gráfico de coordenadas paralelas, que corresponde a datos numéricos multivariados (en).

Echa un vistazo al resto del contenido de nuestro blog. Allí encontrarás más información sobre otros tipos de visualizaciones y boletines sobre gobierno abierto, periodismo y cultura de datos. Podrás suscribirte si quieres recibirlos dos veces al mes en tu bandeja de entrada.