[ad_1]
El algoritmo Google Flu Trends, como se le conoce, funcionó mal. Por ejemplo, sobreestimó continuamente las visitas al médico, se encontraron evaluaciones posteriores, debido a las limitaciones de los datos y la influencia de factores externos como la atención de los medios, que pueden impulsar búsquedas que no están relacionadas con una enfermedad real.
Desde entonces, los investigadores han realizado múltiples ajustes a este enfoque, combinando las búsquedas de Google con otros tipos de datos. Los equipos de la Universidad Carnegie-Mellon, University College London y la Universidad de Texas, entre otros, tienen modelos que incorporan algunos análisis de datos en tiempo real.
“Sabemos que ningún flujo de datos único es útil de forma aislada”, dijo Madhav Marathe, un científico informático de la Universidad de Virginia. “La contribución de este nuevo documento es que tienen una buena y amplia variedad de transmisiones”.
En el nuevo documento, el equipo analizó datos en tiempo real de cuatro fuentes, además de Google: publicaciones de Twitter relacionadas con Covid, geoetiquetadas por ubicación; búsquedas de médicos en una plataforma de médicos llamada UpToDate; datos de movilidad anónimos de teléfonos inteligentes; y lecturas del termómetro inteligente Kinsa, que se carga en una aplicación. Integró esos flujos de datos con un modelo de predicción sofisticado desarrollado en la Northeastern University, basado en cómo las personas se mueven e interactúan en las comunidades.
El equipo probó el valor predictivo de las tendencias en el flujo de datos al observar cómo cada uno se correlacionaba con los recuentos de casos y las muertes durante marzo y abril, en cada estado.
En Nueva York, por ejemplo, una fuerte tendencia alcista en las publicaciones de Twitter relacionadas con Covid comenzó más de una semana antes de que los recuentos de casos explotaran a mediados de marzo; Las búsquedas relevantes de Google y las medidas de Kinsa se dispararon varios días antes.
El equipo combinó todas sus fuentes de datos, en efecto ponderando cada una de acuerdo con su fuerte correlación con el aumento de casos. Los investigadores encontraron que este algoritmo “armonizado” preveía brotes en 21 días, en promedio.
[ad_2]
Fuente