La información en tiempo real en sitios de noticias, blogs y redes sociales cambia dinámicamente y se extiende a través de la web. El desarrollo de métodos para interrogar y descubrir las historias de la información a esta escala requiere pensar cómo varía el contenido de la información a lo largo del tiempo, cómo se transmite y cómo muta mientras se extiende.

 

NIFTY es un sistema que encuentra mutaciones de una sola pieza de información en el ciclo de noticias diarias. Basado en Memetracker, cada día el sistema analiza a través de 3,5 millones de artículos de noticias y 2 millones de citas para encontrar los mejores grupos frases compartidos en la Web.

 

La herramienta utiliza un proceso llamado clustering incremental, que es una novedosa y escalable manera para extraer e identificar variantes de un solo meme.

 

NIFTY proporciona una manera simplificada de identificar qué frases y citas están haciendo las noticias y el interés en las historias a través del tiempo, separándolos en clusters diarios, semanales, mensuales y trimestrales.

 

El proyecto se desarrolló como parte del programa de prácticas de verano de Stanford en Ciencias de la Computación (CURIS). El proyecto fue apoyado por varias organizaciones y diseñado por Caroline Suen, Sandy Huang, y Chantat Eksombatchai asesorado por el profesor Jure Leskovec y el científico Rok Sosic.