Blog > Visualización de datos: diagrama de Sankey

Visualización de datos: diagrama de Sankey

El diagrama de Sankey es un tipo de visualización de datos que permite representar gráficamente el flujo de una serie de valores a otra. Te contamos cómo y cuándo puedes utilizarla y te mostramos cómo la están utilizando otras personas.

Disponible en:

Por María Juliana Rodríguez Urbano. Publicado el 29 de septiembre de 2021.

La visualización de datos contiene mucho más que los gráficos simples. Hay gráficos de barras y gráficos circulares, que son muy útiles para representar gráficamente una serie de datos. Sin embargo, también existen otros tipos de visualizaciones más interactivas y que pueden resultar más apropiadas para representar datos que varían entre una categoría y otra. Uno de ellos es el diagrama de Sankey. En Datasketch te explicamos en qué consiste y qué lo hace tan especial.

¿Qué hace un diagrama de Sankey?

Este diagrama muestra los flujos de datos entre categorías y su volumen de manera proporcional. El volumen es la magnitud de la relación entre esas categorías y se representa con flechas. Entre más grande sea la flecha, mayor es la magnitud de la relación. De acuerdo con la variación de los datos, puedes combinar las flechas entre sí o dividir tu diagrama en varias categorías, para lo cual puedes utilizar distintos colores.

Las flechas completan su conexión a través de puntos en común entre las categorías, conocidos como nodos, y estas conexiones son conocidas como vínculos. Por eso, el diagrama de Sankey es práctico si quieres visualizar un mapeo diverso de datos entre dos o más categorías principales, o si quieres representar distintos caminos a través de una serie de etapas dentro de un proceso.

Así se ve un diagrama de Sankey, en este caso, acerca de las lesiones fatales que sufrieron venezolanos en Colombia entre enero del 2017 y julio de 2021. Los datos pertenecen al Instituto Nacional de Medicina Legal de Colombia:

alt_text

El diagrama nos muestra cómo se relacionan el tipo de lesión y su frecuencia en cada uno de los años estudiados. Podemos observar que hay flechas que son más gruesas que otras, lo que significa que hay tipos de lesiones fatales que son más frecuentes que otras. Igualmente, las flechas que provienen de una sola lesión fatal dentro de esta categoría cambian de volumen entre unos años y otros, es decir, la ocurrencia o no de una de ellas cambia en cada año.

Un poco de historia

El diagrama de Sankey se llama así debido a su creador, el capitán irlandés Matthew Sankey, quien lo utilizó en 1898 para mostrar la eficiencia energética de una máquina de vapor. En su diseño inicial, Sankey representó el flujo del vapor con diferentes tonos para cada tipo de flujo que afectaba al principal. El diseño del capitán Sankey se convirtió en un modelo estándar en los campos de la ingeniería y la física para representar variables como los flujos de energía y de materiales. Aquí puedes observar el diagrama original:

alt_text

Fuente: Sankey diagram - Wikipedia

A pesar de que el diagrama como lo conocemos hoy fue diseñado por Sankey, existen otros antecedentes de este tipo de visualización. Uno de los ejemplos más famosos es el mapa de la campaña de Napoleón en Rusia en 1812, creado por el ingeniero civil francés Charles Minard en 1869.

La visualización, conocida como “Carta figurativa de las sucesivas pérdidas de hombres de la armada francesa en la campaña de Rusia de Napoleón en 1812”, nos muestra gráficamente la historia de esta campaña y cómo esta pasó de tener 422.000 soldados a tan solo 10.000. El diagrama nos enseña el recorrido que hicieron desde Francia hasta Moscú, representado por una línea dorada de la cual se desprenden cinco variables: dirección y localización geográfica, descenso de las temperaturas, fecha, dirección del ejército y el conteo de decesos. Este es el diagrama, tal como lo diseñó Minard:

alt_text

Fuente: Sankey diagram - Wikipedia

Otros usos del diagrama de Sankey

Actualmente, el diagrama de Sankey se utiliza para visualizar planes de evaluación del ciclo de vida de los productos y para visualizar flujos de dinero. Uno de sus usos más populares es el que implementa Google Analytics en sus informes para mostrar cómo es el tránsito de los usuarios cuando recorren la web:

alt_text

Fuente: Diagramas de flujo: ejemplos mas populares en 2020

Sankey y los diagramas de flujo

Como tal, el diagrama de Sankey es un tipo específico de diagrama de flujo. Este se usa para analizar, planificar y demostrar procesos de manera sencilla. Cada uno de los pasos del proceso se representan con distintas figuras geométricas que significan un tipo de paso específico y con flechas que indican el orden y el flujo de las categorías. Dependiendo del campo en el que se utilice, el diagrama de flujo suele ser llamado “diagrama de flujo de procesos” o “mapa de procesos”.

¿Cómo puedes crear un diagrama de Sankey?

En Datasketch, contamos con apps que te permiten crear diagramas de Sankey para visualizar el flujo de tus datos de forma sencilla y atractiva. En nuestra página web, encontrarás una app para un diagrama de Sankey sencillo y otra app para un diagrama de Sankey interactivo, que te ayudará a visualizar mejor el tipo de información que fluye en las flechas que viajan de una categoría a otra.

Si quieres aprender más sobre visualización de datos, visita nuestro blog, explora nuestras herramientas y suscríbete a nuestros newsletters.

Referencias y enlaces de interés