Servicios

Captura de datos

Te ayudamos a conseguir y organizar información proveniente de datos públicos o diferentes sitios web con scrapping.

Limpieza de datos

Estructuramos bases de datos con información proveniente de múltiples bases de datos en múltiples formatos. Organización de información y estandarización de variables.

Aplicaciones de visualización

Creamos aplicaciones de visualización de datos públicos para que tus usuarios puedan conocer y explorar bases de datos. Utilizamos las últimas tecnologías en visualización de datos para comunicar información.

Algoritmos

Implementamos algoritmos de inteligencia artificial para facilitar tu trabajo con datos, desde algoritmos predictivos hasta reconocimiento de patrones.

Especiales web

Desarrollamos especiales web interactivos basados en datos. Los especiales tienen diferentes componentes visuales para orientar a tus lectores. Ver ejemplos de nuestros especiales.

Quiénes somos

Datasketch es una plataforma digital de periodismo de investigación y de datos. Nuestro portal permite que periodistas, científicos de datos, científicos sociales y la ciudadanía en general pueda aprender y consultar sobre visualizaciones de datos, herramientas, software e investigaciones profundas sobre diversos temas coyunturales. Contamos con herramientas gratuitas de datos y diferentes proyectos para tender un puente entre los datos y la ciudadanía que facilite la democratización del conocimiento y una revisión crítica de las realidades sociales a partir de contrastes de información.

Nuestro equipo

Juan Pablo Marín

Ingeniero electrónico con máster en estadística computacional. Experto en ciencia de datos con aplicaciones en múltiples áreas como la economía, hidrología y periodismo.

Camila Achuri

Estadística y experta en lenguaje de programación R. Ha desarrollado diversas aplicaciones de visualización de datos en temas de movilidad y datos abiertos.

Juliana Galvis

Politóloga y candidata a magíster en Humanidades Digitales. Actualmente lidera el desarrollo de la base de datos Who Is, además de apoyar investigaciones periodísticas y creación de bases de datos.

David Daza

Licenciado en Electrónica. Experto en desarrollo de aplicaciones y sitios web con énfasis en periodismo de datos y gestión de contenidos de múltiples bases de datos.

Verónica Toro

Antropóloga e investigadora. Encargada de la gestión y organización de la comunidad datera en Colombia y Latinoamérica, además de apoyar las investigaciones periodísticas y la creación de bases de datos.

Andrea Cervera

Periodista y Comunicadora Social, encargada de la redacción de artículos, apoyo investigativo y community manager.

Ana Hernández

Matemática y experta en lenguaje de programación R. Ha colaborado para diversos proyectos como Infraestructura Visible y en el desarrollo de herramientas de visualización.

Contacto

Cómo no hacer visualizaciones de declaraciones de renta de funcionarios públicos

Agosto 18, 2016

Hace algunas semanas descubrimos una historia de la revista Semana en Colombia. Nos llamó la atención su componente caricaturezco para contar una historia detrás de los datos de declaraciones de renta de funcionarios públicos, desafortunadamente nos encontramos con la peor visualización que hemos visto en mucho tiempo.

Hace algunas semanas descubrimos esta historia de la revista Semana en Colombia. Nos llamó la atención su componente caricaturezco para contar una historia detrás de los datos de declaraciones de renta de funcionarios públicos, en este caso, los ministros del gabinete del presidente Santos en Colombia.

Lo primero que se piensa al ver la historia es que se trata de algún tema económico y político. El juego de palabras entre el nombre del presidente de Colombia y la palabra monopolio invita a indagar más sobre los juegos políticos en la economía.

Desafortunadamente en realidad de lo que trata la historia no tiene qué ni con el presidente, ni con economía. La única forma de conocer de qué trata la historia es leyendo un título o nota al pie encabezado que dice que se puede conocer las declaraciones de renta de los ministros, datos que solo se pueden apreciar una vez el usuario pasa su cursor sobre los diferentes ministerios, sin forma alguna de poder siquiera comparar lo valores entre ellos.

 

Lo peor de la visualización:

  • El diseño gráfico completamente desalineado con los datos o el tema a tratar.

  • Existe información adicional que causa confusión en lugar de aportar al mensaje final, por ejemplo: ¿qué tiene que ver el tema de Uber o el del cannabis medicinal con las declaraciones de renta de los ministros?

  • En temas de visualización no hay una guía clara para que el usuario interactúe con la gráfica, cuesta mucho encontrar dónde o por qué dar clic. Debería ser intuitivo y no buscar hacer que el usuario busque las instrucciones que aparecen en la parte superior.

 

El mensaje a los usuarios finales debería estar orientado alrededor de las declaraciones de renta de los ministros, nada más.

Al mirar un poco el código de la página, descubrimos que este es el vínculo de la visualización original: http://static.iris.net.co/semana/upload/media/2016/7/5/480579/index.htmlPara extraer la información estructurada simplemente utilizamos el excelente servicio https://magic.import.io, que nos permitió obtener los datos para descarga en formato csv al que le hicimos algunos ajustes manuales.

Con una tabla ordenable podemos rápidamente descubrir cosas como las siguientes:

  • El ministro más endeudado es Luis Gilberto Murillo de ambiente con 1942 millones de pesos.

  • La ministra de comercio María Claudia Lacotoure no tiene deudas.

  • Los ingresos laborales más altos son los del Ministro de defensa con 483 millones de pesos. Él también declara el mayor patrimonio líquido, que excede los 4400 millones de pesos.

  • El ministro TIC, David Luna es el que menos declara ingresos laborales.

  • La ministra de trabajo Clara López es la que declara mayores ingresos como "Otros" con 761 millones de pesos.

 

Esta es la tabla con la información relevante (cifras en millones de pesos colombianos)

 

Ver aquí en pantalla completa.

Como cualquier investigación, una visualización (en este caso con una simple tabla) se puede considerar efectiva cuando siembra inquietudes en la audiencia. Al explorar la tabla en 5 segundos me pregunto:

  • ¿Por qué hay tanta diferencia en los ingresos laborales de los ministros, no deberían ganar lo mismo todos?

  • ¿De dónde provienen los "Otros Ingresos" de los ministros?

  • ¿De dónde sacó su capital el ministro de defensa? Su capital corresponde casi al doble del ministro que le sigue.

 

Por el contrario, al toparme con la visualización original de Semana, lo único que me puedo preguntar es ¿a quién se le ocurre comunicar datos de esa forma tan terrible?

 

 

Juan Pablo Marín Díaz

Juan Pablo es científico de datos. Ha trabajado en temas de estadística computacional aplicada en diversos campos como macroeconomía, hidrología y periodismo de datos.