Servicios

Captura de datos

Te ayudamos a conseguir y organizar información proveniente de datos públicos o diferentes sitios web con scrapping.

Limpieza de datos

Estructuramos bases de datos con información proveniente de múltiples bases de datos en múltiples formatos. Organización de información y estandarización de variables.

Aplicaciones de visualización

Creamos aplicaciones de visualización de datos públicos para que tus usuarios puedan conocer y explorar bases de datos. Utilizamos las últimas tecnologías en visualización de datos para comunicar información.

Algoritmos

Implementamos algoritmos de inteligencia artificial para facilitar tu trabajo con datos, desde algoritmos predictivos hasta reconocimiento de patrones.

Especiales web

Desarrollamos especiales web interactivos basados en datos. Los especiales tienen diferentes componentes visuales para orientar a tus lectores. Ver ejemplos de nuestros especiales.

Quiénes somos

Datasketch es una plataforma digital de periodismo de investigación y de datos. Nuestro portal permite que periodistas, científicos de datos, científicos sociales y la ciudadanía en general pueda aprender y consultar sobre visualizaciones de datos, herramientas, software e investigaciones profundas sobre diversos temas coyunturales. Contamos con herramientas gratuitas de datos y diferentes proyectos para tender un puente entre los datos y la ciudadanía que facilite la democratización del conocimiento y una revisión crítica de las realidades sociales a partir de contrastes de información.

Nuestro equipo

Juan Pablo Marín

Ingeniero electrónico con máster en estadística computacional. Experto en ciencia de datos con aplicaciones en múltiples áreas como la economía, hidrología y periodismo.

Camila Achuri

Estadística y experta en lenguaje de programación R. Ha desarrollado diversas aplicaciones de visualización de datos en temas de movilidad y datos abiertos.

Juliana Galvis

Politóloga y candidata a magíster en Humanidades Digitales. Actualmente lidera el desarrollo de la base de datos Who Is, además de apoyar investigaciones periodísticas y creación de bases de datos.

David Daza

Licenciado en Electrónica. Experto en desarrollo de aplicaciones y sitios web con énfasis en periodismo de datos y gestión de contenidos de múltiples bases de datos.

Verónica Toro

Antropóloga e investigadora. Encargada de la gestión y organización de la comunidad datera en Colombia y Latinoamérica, además de apoyar las investigaciones periodísticas y la creación de bases de datos.

Andrea Cervera

Periodista y Comunicadora Social, encargada de la redacción de artículos, apoyo investigativo y community manager.

Ana Hernández

Matemática y experta en lenguaje de programación R. Ha colaborado para diversos proyectos como Infraestructura Visible y en el desarrollo de herramientas de visualización.

Contacto

Si eres periodista tienes que usar Wayback Machine

Mayo 25, 2017

Recuperar los datos no sólo los sitios gubernamentales, dino de los sitios interrumpidos, las noticias falsas y los tweets -que pueden ser eliminados en cualquier momento- es una necesidad fundamental para los periodistas.

"Yo ciertamente estaría abierto a cerrar las áreas donde estamos en guerra con alguien, seguro que no quiero que la gente que quiera matarnos y matar a nuestra nación use nuestro internet." "Sí, señor, lo soy". - Donald Trump. CNN 15 de diciembre de 2015.

 

Una vez Donald Trump asumió como presidente, la Casa Blanca eliminó muchos de sus contenidos incluyendo todas las páginas en español y sobre derechos civiles y la comunidad LGBT. ¿Sería posible recuperar ese contenido para analizar más tarde? ¿Sería útil tener copias de esa información?

 

Recuperar los datos no sólo los sitios gubernamentales, dino de los sitios interrumpidos, las noticias falsas y los tweets -que pueden ser eliminados en cualquier momento- es una necesidad fundamental para los periodistas.

 

También es necesario ser capaz de compartir esta información cuando está alojado por un tercero de confianza y no sólo con capturas de pantalla que pueden ser fácilmente manipulados por cualquier persona.

 

Para resolver todas estas necesidades surge la plataforma Wayback Machine, uno de los servicios de The Internet Archive. La plataforma es una colección de instantáneas históricas de diferentes páginas de Internet, para brindar acceso universal a las mismas. Es un intento de mantener viva nuestra memoria digital para que no perdamos años y años de inteligencia colectiva y conocimiento en el caso de un tremendo peligro o accidente, como sucedió con la Biblioteca de Alejandría.

 

 

El proyecto comenzó en 1996 para descargar todas las páginas públicas disponibles en Internet y mantenerlas como una referencia. Ahora tiene más de 286.000 millones de páginas guardadas, lo que asciende a más de 9 petabytes de datos, y agrega más de 20 terabytes cada semana.

 

Como referencia, 2 Petabytes corresponden a la información que tienen todas las bibliotecas de investigación académica de los Estados Unidos.



El Archivo

 

A partir de noviembre de 2016, The Archive se embarcó en una misión para mantener copia completa de sus datos en servidores en otro país. Actualmente tienen copias parciales del en Alejandría, Egipto y Amsterdam.

 

Durante la campaña electoral del Presidente Trump, la naturaleza de sus declaraciones impulsó los esfuerzos de la organización sin fines de lucro para hacer una copia adicional completa del Archivo en Canadá en caso de fracaso institucional en los Estados Unidos.

 

Muchas páginas no tienen una captura histórica cada día. Por lo tanto, es necesario que los usuarios guarden manualmente las páginas que les interesan en caso de que necesiten una instantánea específica.

El proceso en bastante simple, pueden visitar este enlace y simplemente guardar una página que les interesa. Obtendrán un enlace, con la información de esa página web y el momento en que la guardó, que puede compartir o publicar para que sus lectores puedan saber exactamente dónde y cuándo se capturó la información.

 

También puede guardar las páginas con la extensión de Chrome directamente desde su navegador. Con esta extensión, además de guardar la página web, también puede obtener la última instantánea de la página cuando no esté disponible actualmente.

 

 

Anímate a utilizar Wayback Machine para documentar tus publicaciones y fuentes antes de que desaparezcan de Internet.



Juan Pablo Marín Díaz

Juan Pablo es científico de datos. Ha trabajado en temas de estadística computacional aplicada en diversos campos como macroeconomía, hidrología y periodismo de datos.