Servicios

Captura de datos

Te ayudamos a conseguir y organizar información proveniente de datos públicos o diferentes sitios web con scrapping.

Limpieza de datos

Estructuramos bases de datos con información proveniente de múltiples bases de datos en múltiples formatos. Organización de información y estandarización de variables.

Aplicaciones de visualización

Creamos aplicaciones de visualización de datos públicos para que tus usuarios puedan conocer y explorar bases de datos. Utilizamos las últimas tecnologías en visualización de datos para comunicar información.

Algoritmos

Implementamos algoritmos de inteligencia artificial para facilitar tu trabajo con datos, desde algoritmos predictivos hasta reconocimiento de patrones.

Especiales web

Desarrollamos especiales web interactivos basados en datos. Los especiales tienen diferentes componentes visuales para orientar a tus lectores. Ver ejemplos de nuestros especiales.

Quiénes somos

Datasketch es una plataforma digital de periodismo de investigación y de datos. Nuestro portal permite que periodistas, científicos de datos, científicos sociales y la ciudadanía en general pueda aprender y consultar sobre visualizaciones de datos, herramientas, software e investigaciones profundas sobre diversos temas coyunturales. Contamos con herramientas gratuitas de datos y diferentes proyectos para tender un puente entre los datos y la ciudadanía que facilite la democratización del conocimiento y una revisión crítica de las realidades sociales a partir de contrastes de información.

Nuestro equipo

Juan Pablo Marín

Ingeniero electrónico con máster en estadística computacional. Experto en ciencia de datos con aplicaciones en múltiples áreas como la economía, hidrología y periodismo.

Camila Achuri

Estadística y experta en lenguaje de programación R. Ha desarrollado diversas aplicaciones de visualización de datos en temas de movilidad y datos abiertos.

Juliana Galvis

Politóloga y candidata a magíster en Humanidades Digitales. Actualmente lidera el desarrollo de la base de datos Who Is, además de apoyar investigaciones periodísticas y creación de bases de datos.

David Daza

Licenciado en Electrónica. Experto en desarrollo de aplicaciones y sitios web con énfasis en periodismo de datos y gestión de contenidos de múltiples bases de datos.

Verónica Toro

Antropóloga e investigadora. Encargada de la gestión y organización de la comunidad datera en Colombia y Latinoamérica, además de apoyar las investigaciones periodísticas y la creación de bases de datos.

Andrea Cervera

Periodista y Comunicadora Social, encargada de la redacción de artículos, apoyo investigativo y community manager.

Ana Hernández

Matemática y experta en lenguaje de programación R. Ha colaborado para diversos proyectos como Infraestructura Visible y en el desarrollo de herramientas de visualización.

Contacto

Así fue la cuarta versión de nuestro #DatosYGuaros

Junio 30, 2017

Datos & Guaros es el encuentro de periodistas, infoactivistas, investigadores y curiosos de la ciencia de datos que se reúnen para compartir sus proyectos y aprender sobre la comunidad al calor de unos guaros.

El pasado 22 de junio tuvimos la cuarta edición de este encuentro que ha sido importado desde México. Aquí un resumen de las mejores exposiciones.

Claudia Báez: La vida tiene precio

lavidatieneprecio.PNG

Una investigación trasnacional sobre los métodos de las farmacéuticas para prolongar sus monopolios en América Latina

Claudia Baéz es periodista de investigación y de datos. En su exposición,  ilustró la investigación realizada en seis países que muestra evidencia del padecimiento que se vive en latinoamérica a la hora de acceder a medicamentos que tratan enfermedades patológicas como la Hepatitis C, el  VIH, Diabetes, Cáncer, entre otras. Muestra con datos los métodos de las farmacéuticas para prolongar los monopolios de compra y venta de medicamentos,  una visualización de comparador de precios de medicamentos y  el historial de acciones de farmacéuticas internacionales.

Este problema genera situaciones críticas a nivel de salud pública, ya que hay millones de personas en el mundo que no disponen de los medicamentos necesarios para tratarse y hay cifras de la Organización Mundial para la Salud (OMS) que superan los 600 mil registros de personas que mueren por no acceder a los medicamentos.

Aquí el link para que consulten y lean la investigación completa.

Nicolás Moreno: El fin de la privacidad

La recolección masiva de datos por parte de Facebook, Google, Apple, Microsoft etc y las implicaciones que esto tiene para los usuarios de los servicios que estas empresas ofrecen.  

Nicolás Moreno es matemático y profesor. En su exposición nos mostró cómo esta sociedad moderna informatizada está reconstruyendo las escalas de poder y vigilancia. El correo no es tan personal y tan privado, organismos de control y vigilancia como la NSA y la CIA pueden acceder y son dueños de todos los movimientos que hacemos en  las redes sociales, por dónde navegamos y qué estamos buscando. Es sencillo, de todo eso no dan tanto, y me refiero a que cuando eres usuario de redes sociales gratuitas, ¡sorpresa! tu eres el producto. Por eso las compañías de internet tienen acceso a toda tu actividad y te meten publicidad relacionada a tus búsquedas.

En últimas, la digitalización de nuestras vidas ha implicado un vínculo directo con la amenaza a nuestra integridad y nuestra privacidad. Nicolás nos recomienda aprender un nivel básico de criptografía (Tomar información en formato de texto plano y cifrarla y codificarla de manera que sea ininteligible). y usar navegadores como TOR, que no dejan rastro ni huella de tu actividad.

Miguel Olaya y Emmanuel Ariza: Sipsa Abierto

Hacia una síntesis de información para entender lo cotidiano

 

El Sipsa es el sistema de información de precios del sector agropecuario, una iniciativa del Ministerio de Agricultura pero que actualmente lo controla y lo maneja el DANE. Este sistema de precios del agro, reporta los precios de frutas, verduras  y tubérculos, así como también el insumo para la producción agropecuaria.

Lo que hicieron estos historiadores y desarrolladores fue pasar un derecho de petición al DANE, en el que pedían un archivo estructurado de datos tales como fecha, producto, mercado y el precio de cada producto. Después de analizar estos datos y seguir explorando la aplicación diariamente, los planes a futuro de este equipo es que puedan publicar mejor la información, crear canastas de referencia a la medida de cada usuario y crear la base de un sistema de toma de decisiones a partir de precios, con el fin de que los consumidores estén mejor informados sobre los balances de cada producto, así como sus precios, la región de donde viene etc.

Lorena Cala: Los retos de un diseñador a la hora de trabajar con datos

Lorena Cala es diseñadora industrial y freelance. En su larga trayectoria ha trabajado en múltiples proyectos e investigaciones muy diversas. Su cercanía a los datos surgió de la aleatoriedad de sus conocidos y sus clientes y se le midió al reto. En este caso, se encargó de ilustrarnos  los proyectos con datos en los que ha trabajado:

Urbano: Proyecto novedoso que utiliza datos en el espacio urbano. Lorena se encargó de diseñar los kits donde cada grupo de personas podía visualizar sus datos en el espacio público.

 

Transparencia por Colombia: Tuvo la oportunidad de hacer todo el diseño de la página en un nuevo proyecto de Transparencia por Colombia en el que un mapa desglosa casos de corrupción con nombre completo, fecha, departamento y monto de dinero robado. Esta aplicación todavía no ha salido públicamente.

Feria Internacional del Libro de Bogotá: En el 2016, tuvo la oportunidad de ayudar a fabricar unos muebles hechos de libros y enciclopedias desarrollado por un diseñador holandés llamado Richard Hutten.

 

Alejandro Londoño: Códigos binarios para generar piezas de arte

 

Alejandro Londoño es artista y ha querido explorar cómo los códigos, los números y los algoritmos son los encargados de codificar nuestro mundo en esta modernidad. Así que decidió explorar la base de datos del Banco Mundial y extraer cuanta cantidad de datos cupiera en su ordenar para luego hacer piezas que ilustran que estamos poseídos por múltiples traducciones computarizadas que reducen nuestra existencia sólo a números y a cifras.

 

Andrés Clavijo:

  • El Laboratorio Urbano:

laburbano.PNG

Es una iniciativa interinstitucional en apoyo con Data Pop Alliance, La Cámara de Comercio de Bogotá y La Alcaldía Mayor de Bogotá que busca promover ideas innovadoras para solucionar problemas de mayor impacto en la capital colombiana. El objetivo principal de la alianza de este laboratorio urbano es establecer estructuras de trabajo en co-creación con la ciudadanía y dar forma a una idea que se construye desde la interacción y el trabajo colectivo, con el ánimo de generar propuestas, soluciones e ideas innovadoras para mejorar Bogotá.

Aquí esta el  link para que consulten la página y exploren temas de interés urbano.

 

  • Vizdatalab: Análisis del plebiscito

plebiscito.PNG

Esta visualización muestra en un mapa de Colombia, los grados de similitud y polaridad que hubo entre los resultados del SI y el NO en el plebiscito de Octubre del año pasado. Como pueden explorar en el siguiente link, los círculos representan los municipios en total que tiene el país (1122), cuando seleccionamos un punto (o un municipio), el círculo inmediatamente se colorea de verde, y de ahí se desglosan las comparaciones de todos los municipios restantes, comparando el SI y el NO, la abstención, y los votos nulos. Por otro lado, se pueden ver las distintas convenciones que colorean el mapa, como la cercanía o la lejanía de los resultados  dependiendo del municipio.

 

  • Gol y Futból: Visión histórica y análisis estadístico del fútbol

 

 

Gol y Fútbol surge del interés de investigar el fútbol, conocer su historia, los números que rodean a cada jugador, sus cifras y las relaciones económicas que se generar a partir de este legendario deporte.

 

Por esto en el 2012 se abrió el blog  Gol y Fútbol  y de ahí se han desprendido libros y artículos que reportan el desempeño de este deporte, así como su análisis en distintas perspectivas.

 

Datasketch

Equipo de datos