Tres claves para interpretar mapas de posicionamiento

Por Datasketch
17 May 2017
Quizá tambien te interese

¿Cómo visualizas un conjunto de datos de muchas variables para obtener la mayor cantidad de información posible? Por lo general, tenemos tres caminos para tomar una decisión: si tienes una tabla de contingencia, has un análisis de correspondencias simples; si tiene una tabla de múltiples variables, has un análisis de correspondencias múltiples, y si tienes una tabla de datos cuantitativos, piensa en un análisis de los componentes principales.

 

Lo que tienen en común estos tres métodos es que su finalidad es obtener una representación en pocas dimensiones de las variables sin perder información - o al menos sin perder tanta información.

 

El resultado final es un conjunto de coordenadas que se plasman en un plano cartesiano, también llamado mapa de posicionamiento.

 

Es muy importante que antes de visualizar esta información hagas una prueba de correlación para asegurarte de que exista cierta relación entre las variables analizadas.

 

En Datasketch utilizamos esta metodología para visualizar las causas de muertes de los diferentes premios Nobel, Grammy y Oscar en la historia.

 

 

 

¿Cómo debes interpretar esta información?

 

Es como jugar astucia naval: si dos categorías de variables escogidas por los mismos individuos coinciden, estarán cerca. En el ejemplo de las causas de muerte de los famosos, "física" está muy cerca a "enfermedad", lo que indica que una gran parte de ganadores del nobel en la categoría de física han muerto por una enfermedad no especificada.

 

Si se hiciera la respectiva prueba de asociación, y esta diera “significativa”, se podría decir que hay un fuerte relación entre ganar un Nobel de Física y morir por una enfermedad cualquiera.

 

Las categorías menos frecuentes están alejadas del centro de gravedad, lo que indica que si una variable está alejada del eje (0,0) es porque pocos individuos caen en esa categoría.

En el gráfico el ejemplo se puede ver que causas de muerte como "Guerra", "Eutanasia" o "rotura de cadera" , que están alejadas del centro del plano.

 

La proximidad entre categorías de una misma variable es excluyente por construcción, lo que quiere decir que un individuo solo puede estar en una y solo una de las categorías.

 

La lejanía entre categorías de una misma variable indica que los individuos presentan un comportamiento muy opuesto, por ejemplo las causas de muerte de los ganadores del Nobel de Medicina y los de Química, que son totalmente diferentes.

 

¿Has utilizado ese tipo de gráficos con anterioridad? ¿Qué usos le has dado? ¿Qué recomiendas evitar?

 

Datasketch

Equipo de datos

Todo el material en esta página, cuando no se indique lo contrario, es CC-BY-SA. Si reusas o adaptas recursos de esta página por favor vincula y referencia nuestro artículo o página.