Servicios

Captura de datos

Te ayudamos a conseguir y organizar información proveniente de datos públicos o diferentes sitios web con scrapping.

Limpieza de datos

Estructuramos bases de datos con información proveniente de múltiples bases de datos en múltiples formatos. Organización de información y estandarización de variables.

Aplicaciones de visualización

Creamos aplicaciones de visualización de datos públicos para que tus usuarios puedan conocer y explorar bases de datos. Utilizamos las últimas tecnologías en visualización de datos para comunicar información.

Algoritmos

Implementamos algoritmos de inteligencia artificial para facilitar tu trabajo con datos, desde algoritmos predictivos hasta reconocimiento de patrones.

Especiales web

Desarrollamos especiales web interactivos basados en datos. Los especiales tienen diferentes componentes visuales para orientar a tus lectores. Ver ejemplos de nuestros especiales.

Quiénes somos

Datasketch es una plataforma digital de periodismo de investigación y de datos. Nuestro portal permite que periodistas, científicos de datos, científicos sociales y la ciudadanía en general pueda aprender y consultar sobre visualizaciones de datos, herramientas, software e investigaciones profundas sobre diversos temas coyunturales. Contamos con herramientas gratuitas de datos y diferentes proyectos para tender un puente entre los datos y la ciudadanía que facilite la democratización del conocimiento y una revisión crítica de las realidades sociales a partir de contrastes de información.

Nuestro equipo

Juan Pablo Marín

Ingeniero electrónico con máster en estadística computacional. Experto en ciencia de datos con aplicaciones en múltiples áreas como la economía, hidrología y periodismo.

Camila Achuri

Estadística y experta en lenguaje de programación R. Ha desarrollado diversas aplicaciones de visualización de datos en temas de movilidad y datos abiertos.

Juliana Galvis

Politóloga y candidata a magíster en Humanidades Digitales. Actualmente lidera el desarrollo de la base de datos Who Is, además de apoyar investigaciones periodísticas y creación de bases de datos.

David Daza

Licenciado en Electrónica. Experto en desarrollo de aplicaciones y sitios web con énfasis en periodismo de datos y gestión de contenidos de múltiples bases de datos.

Verónica Toro

Antropóloga e investigadora. Encargada de la gestión y organización de la comunidad datera en Colombia y Latinoamérica, además de apoyar las investigaciones periodísticas y la creación de bases de datos.

Andrea Cervera

Periodista y Comunicadora Social, encargada de la redacción de artículos, apoyo investigativo y community manager.

Mariana Villamizar

Ingeniera de Sistemas y diseñadora. Experta en experiencia de usuario, visualización de datos y comunicación gráfica. Feminista.

Contacto

Imprecisiones pagadas por los contribuyentes: otra historia de datos

Junio 05, 2016

Malas de decisiones de diseño pueden causar confusión o incluso llevar a conclusiones erróneas. Este es otro ejemplo de una mala selección de escala de colores y de procesamiento de datos que puede llevar a interpretar de manera errónea la información que se quiere comunicar usando mapas coropletos.

Desde los orígenes de la humanidad, se han hecho decisiones por un sinfín de razones, e.g. placer, trabajo o mera supervivencia. Ahora, como los seres humanos somos propensos a cometer errores, las decisiones equivocadas están a la orden del día también: escoger el compañero equivocado para un emprendimiento, tomar una ruta más larga al ir al trabajo, o simplemente arrepentirse de haber comido un plato en un restaurante.

En la mayoría de los casos, las decisiones equivocadas se toman con base en datos incompletos, inexactos, inexistentes o incluso falsos (e.g. la última guerra de Irak). Sin embargo, hay veces en las que los datos están presentados inadecuadamente, aun cuando dichos datos son exactos y correctos. Los datos provenientes de instituciones gubernamentales no son la excepción, como se puede apreciar en la imagen:

 

Personas ingresadas a los centros penitenciarios estatales por presuntos delitos del fuero común – Por estado . Año: 2014 (Fuente: http://www3.inegi.org.mx/sistemas/mexicocifras/default.aspx)

 

Hay un par de detalles a ser resaltados acá:

 

·         Escala de colores: A pesar que la escala de colores usada va desde un rojo casi sanguíneo a un azul cielo, es una escala discreta (i.e. en randos predeterminados) e irregular, lo que conduce a:

o   Confusión: un estado con un dato cercano a la frontera inferior de un rango de colores y otro estado que sea cercano a la frontera superior de dicho rango tendrán el mismo color en el mapa.

o   Más confusión: La escala de colores del mapa se torna poco intuitiva y difícil de interpretar debido a que la crominancia no va de la mano con el número de personas.

o   Falta de contexto: aún cuando el número de personas ingresadas de cada estado es exacto, dicho número no conduce a insights accionables, sino a insights meramente informativos. Esto parte desde el hecho que los estados más poblados tenderán a tener más personas ingresadas.

Las consecuencias de difundir este mapa al público podrían ser:

 

·         Dificultad para poder interpretar correctamente el mapa (o, sencillamente, no poder interpretar el mapa);

·         Oportunidad para que funcionarios del gobierno sobreestimen los resultados en estados grandes e ignoren a estados pequeños.

Las siguientes podrían ser acciones para contrarrestar las cuestiones anteriormente mencionadas:

 

·         Usar cifras relativas y no absolutas. Al usar, por ejemplo, personas ingresadas por cada 100.000 habitantes, se obtendrá un diagnóstico más realista de la situación de las personas ingresadas  en cada estado, lo cual conduce a mejores interpretaciones y, por ende, mejores decisiones.

·         Usar una escala de colores continua en vez de una discreta. Una escala continua (e.g. una de “arcoíris” hará que el mapa sea más útil, ya que el número de personas ingresadas estará directamente relacionada al color de la escala.

 

Elías de la Rosa

Entusiasta del Data Science. Siempre haciendo que el Data Science sea algo fácil de entender para toda clase de personas