Servicios

Captura de datos

Te ayudamos a conseguir y organizar información proveniente de datos públicos o diferentes sitios web con scrapping.

Limpieza de datos

Estructuramos bases de datos con información proveniente de múltiples bases de datos en múltiples formatos. Organización de información y estandarización de variables.

Aplicaciones de visualización

Creamos aplicaciones de visualización de datos públicos para que tus usuarios puedan conocer y explorar bases de datos. Utilizamos las últimas tecnologías en visualización de datos para comunicar información.

Algoritmos

Implementamos algoritmos de inteligencia artificial para facilitar tu trabajo con datos, desde algoritmos predictivos hasta reconocimiento de patrones.

Especiales web

Desarrollamos especiales web interactivos basados en datos. Los especiales tienen diferentes componentes visuales para orientar a tus lectores. Ver ejemplos de nuestros especiales.

Quiénes somos

Datasketch es una plataforma digital de periodismo de investigación y de datos. Nuestro portal permite que periodistas, científicos de datos, científicos sociales y la ciudadanía en general pueda aprender y consultar sobre visualizaciones de datos, herramientas, software e investigaciones profundas sobre diversos temas coyunturales. Contamos con herramientas gratuitas de datos y diferentes proyectos para tender un puente entre los datos y la ciudadanía que facilite la democratización del conocimiento y una revisión crítica de las realidades sociales a partir de contrastes de información.

Nuestro equipo

Juan Pablo Marín

Ingeniero electrónico con máster en estadística computacional. Experto en ciencia de datos con aplicaciones en múltiples áreas como la economía, hidrología y periodismo.

Camila Achuri

Estadística y experta en lenguaje de programación R. Ha desarrollado diversas aplicaciones de visualización de datos en temas de movilidad y datos abiertos.

Juliana Galvis

Politóloga y candidata a magíster en Humanidades Digitales. Actualmente lidera el desarrollo de la base de datos Who Is, además de apoyar investigaciones periodísticas y creación de bases de datos.

David Daza

Licenciado en Electrónica. Experto en desarrollo de aplicaciones y sitios web con énfasis en periodismo de datos y gestión de contenidos de múltiples bases de datos.

Verónica Toro

Antropóloga e investigadora. Encargada de la gestión y organización de la comunidad datera en Colombia y Latinoamérica, además de apoyar las investigaciones periodísticas y la creación de bases de datos.

Andrea Cervera

Periodista y Comunicadora Social, encargada de la redacción de artículos, apoyo investigativo y community manager.

Mariana Villamizar

Ingeniera de Sistemas y diseñadora. Experta en experiencia de usuario, visualización de datos y comunicación gráfica. Feminista.

Contacto

Mujeres “listas para reproducirse”

Junio 19, 2019

La base de datos de China que cuenta con información de 1.8 millones de mujeres del país, contiene un campo que establece si están listas para reproducirse o no.

En marzo del presente año, GDI.Foundation, una organización no-gubernamental encontró en China una base de datos con 1.8 millones de nombres de mujeres, sus edades, sus números de teléfono, direcciones, educación, número de identificación, estado civil y un campo que dice si están listas para reproducirse o no.

 

El experto Víctor Gevers fue quién encontró y reveló la información mientras buscaba datos abiertos de China. Gevers comenta en Twitter: “en China tienen una escasez de mujeres así que una organización empezó a registrar información de 1.8 millones de mujeres”

 

La mujer más joven que aparece en la base de datos tiene 15 años de edad y la más joven con estado de “lista para reproducirse” (BreedReady) tiene 18 años. La edad promedio es de 32 años y las mujer más “vieja” con estado de “lista para reproducirse” tiene 39 años. La edad más vieja registrada es de 95 años.  89% de las mujeres registradas se encuentran solteras, 10% divorciadas y 1% viudas y el 86% residen cerca de la capital, Pekín.

 

Estamos hablando de información altamente sensible y el hecho de que haya sido tan poco protegida es alarmante. Muchos comparan el hecho de que se esté recolectando información sobre la fertilidad de la mujer al “Cuento de la criada” de Margaret Artwood, en el que las mujeres son oprimidas y marcadas (visten siempre de rojo) como criadas según su estado de fertilidad, para luego servir a políticos teócratas, quienes violentan sexualmente a las criadas en un ritual para que queden embarazadas y así “mantener la población”.

 

Después de dos días de revelada la violación de seguridad en los datos, Víctor Gevers volvió a twittear avisando que ya no se podía acceder a la base de datos, y que iban a mantener la IP observada para asegurarse de que no volviera a ser pública.

 

Más tarde, se reveló por medio de un estudiante que la base de datos había sido parte de un programa de aprendizaje de ciencia de datos, en el que los estudiantes aprenden a usar Big Data para solucionar problemas sociales. Gevers revela: “La base de datos original pertenece a una fuente oficial, así que toda información identificada es real, de acuerdo al estudiante, el proveedor de servicio de internet tuvo un error, permitiendo tráfico de externos (vía internet) haciendo cambios en el firewall”.

 

Aún así, China no ha dado declaraciones sobre este hecho a pesar de que se trata de una violación a la regulación de protección de datos del país.

 

 

Fotografía: "Conversation between women" by matteodamiani is licensed under CC BY-NC-SA 2.0

Andrea Cervera

Periodista y Comunicadora Social, reportera de contenido basado en datos e investigadora aplicada en temas de datos abiertos.

Mi vida no es tu porno: Mujeres y cámaras ocultas en Corea del Sur

Mayo 31, 2019
Mi vida no es tu porno: Mujeres y cámaras ocultas en Corea del Sur

Una bolsa sin mujeres en la junta directiva

Marzo 07, 2019
Una bolsa sin mujeres en la junta directiva

13 consejos para fortalecer tu seguridad en la web

Abril 02, 2019
13 consejos para fortalecer tu seguridad en la web