Caracas.- Un equipo de investigadores europeos comenzó una estudio en España para conocer el alcance del nuevo coronavirus cuando la infección aún no sumaba las 10.000 víctimas mortales que se han registrado en todo el mundo, de acuerdo con datos oficiales, hasta la primera semana de abril.
El 13 de marzo Antonio Fernández Anta, investigador del Instituto IMDEA Networks y doctor en Ciencias de la Computación por la Universidad de Louisiana, lanzó una encuesta a través de las redes sociales; ahora, Corona Surveys pretende determinar la incidencia real del virus en 17 países: Argentina, Australia, Chile, Chipre, Ecuador, Francia, Alemania, Grecia, Italia, Japón, Países Bajos, España, Portugal, Reino Unido, Ucrania, Estados Unidos y Venezuela.
“La capacidad para hacer pruebas de infección en laboratorio era muy limitada y muchos casos no se llegaban a confirmar como COVID-19, a pesar de tener todos los síntomas. Eso hace que las cifras de casos confirmados no reflejan fielmente el alcance de la pandemia”, apunta el investigador.
El domingo 5 de abril, la encuesta fue lanzada en Venezuela -el cuarto país en Latinoamérica en el que se realiza-. En entrevista con El Pitazo, Fernández Anta explicó la metodología y el uso de la información recolectada.
LEE TAMBIÉN
APLICACIÓN DE GOOGLE DEMUESTRA QUE VENEZOLANOS REDUCEN SU MOVILIDAD DURANTE LA CUARENTENA
–¿Qué metodología están usando?
-Nuestra metodología se basa en hacer una encuesta diaria abierta a la participación de cualquier persona. En ella se hacen solo tres preguntas: ¿de qué región puedes proporcionar datos? (entendiendo que región puede ser un país o un área administrativa más pequeña); ¿a cuántas personas conoces en esa zona?; ¿a cuántas personas de esa zona conoces que tengan síntomas de COVID-19? Uno de los objetivos a la hora de diseñar estas preguntas fue respetar escrupulosamente las leyes de protección de datos. Por esa razón, la encuesta es anónima y no recoge ninguna información que pueda llevar a la identificación ni de los participantes ni de los casos de infectados que se cuentan. Para hacer la estimación, se toman las respuestas obtenidas en la encuesta y se procesan. Primero se eliminan las respuestas que son muy posiblemente incorrectas, como alguien que dice conocer a mil personas y todas con síntomas. Luego se calcula la proporción de casos reportados con síntomas de COVID-19 respecto al total de personas. Esta proporción finalmente se extiende a toda la población de la región. El equipo está trabajando para elaborar métodos más sofisticados que compensen posibles sesgos en los datos, pero lo que se ha observado es que las estimaciones obtenidas son parecidas a otros métodos indirectos.
–¿Cómo ha sido la receptividad hasta ahora?
-La receptividad ha variado mucho de un país a otro. Al ser una iniciativa de un grupo pequeño de investigadores, no es fácil llegar a una gran fracción de la población. Sin embargo, por suerte estamos teniendo éxito en atraer la atención de colaboradores que, poco a poco, están dando a conocer el proyecto a más gente. Lo mejor es que quien conoce el proyecto y sus objetivos rápidamente se identifica con ellos y colabora.
LEE TAMBIÉN
-¿Cuál es el principal obstáculo que enfrentan para la recolección de datos?
-Los principales obstáculos para la recolección de datos es llegar a un conjunto suficientemente grande y variado de personas que participen en las encuestas, y que lo hagan de manera regular casi todos los días. Por suerte el número de respuestas que necesitamos para sondear un número alto de personas es pequeña, ya que no preguntamos al participante por su salud, sino por la de sus conocidos. Esto aumenta el alcance de la encuesta a una población mayor y más heterogénea, que calculamos no es menor de unas 10.000 personas cada día en España. Para lograr que los participantes rellenen la encuesta a menudo la hemos hecho muy sencilla, con solo tres preguntas.
–¿Tienen alguna forma de garantizar la fiabilidad de los datos que aporten las personas encuestadas?
-La encuesta es absolutamente anónima y por ello no tenemos control de si la muestra que obtenemos es una buena representación de la población. Suponemos que la encuesta tiene sesgos de tipo geográfico y social, ya que quien la responde es posiblemente un sector de la población cercano a aquellos que la promovemos. Sin embargo, al hacer preguntas sobre los conocidos del participante ampliamos el número y variedad de las personas muestreadas. Otro aspecto que no controlamos es que los participantes no informen del mismo caso varias veces (por ser cercanos). Bajo ciertos supuestos, podemos demostrar que esto no cambia substancialmente la estimación, pero estamos viendo formas de tenerlo en cuenta en el futuro en nuestros algoritmos. Finalmente, es posible que haya participantes que directamente den respuestas inverosímiles. Nuestro sistema de filtrado de estas respuestas todavía es bastante sencillo, y consiste en identificar y eliminar respuesta con valores atípicos usando técnicas estadísticas, como se hace al limpiar los datos en cualquier encuesta. Principalmente eliminamos respuestas donde el participante da valores que difieren en exceso de lo que la mayoría responde.
LEE TAMBIÉN
VENEMERGENCIA CREA PLATAFORMA PARA DIAGNÓSTICO TEMPRANO DE CONTAGIOS DE COVID-19
–¿De dónde surge la idea? ¿En qué se basa?
-La idea surgió como solución sencilla al problema de estimar el número de infectados cuando no hay datos fiables. Como he dicho, la primera encuesta la hice en Twitter en España y solo preguntaba por el número de conocidos con síntomas. La estimación se obtenía de combinar esta cifra con el número de Dunbar (150), que es el número medio de personas con las que se mantiene contacto. Con ambos valores obtuve la primera estimación de infectados en España. Hay un gran número de encuestas en marcha para obtener información del alcance y características de los infectados de COVID-19. Sin embargo, estas encuestas preguntan directamente al participante sobre su salud, con lo que se obtiene información de tantos individuos como participantes. Por lo que sé, esta es la primera encuesta donde se hacen preguntas sobre la salud de los conocidos, ampliando así el alcance de la encuesta.
-¿Por qué es importante conocer data epidemiológica que se actualice frecuentemente?
-Yo no soy epidemiólogo, por lo que no tengo toda la información para responder de forma exhaustiva. Una primera razón que se me ocurre es poder estimar de manera más precisa los recursos que van a ser necesarios en el futuro. Sabiendo el número total de infectados se puede estimar cuántos de ellos podrían necesitar hospitalización, acceso a la UCI y respiradores en los próximos días. Otra razón es para conocer la evolución del número real de infectados y así saber si realmente se está frenando la propagación de la pandemia. Finalmente, sirve para saber cuándo hemos llegado a tener un número de infectados suficientemente alto como para que se haya alcanzado la inmunidad de grupo, y se puedan empezar a levantar algunas de las medidas de aislamiento
Aunque el experimento apenas comienza, para el investigador es un recurso valioso cuyos resultados reflejan la participación de la sociedad. “Lo que queremos demostrar es que se pueden hacer estimaciones del número de casos de COVID-19 usando la colaboración ciudadana, cuando formas más fiables y sistemáticas de hacerlo no son posibles. Queremos demostrar que en nuestro experimento se produce lo que se llama ‘sabiduría de los grupos’: la agregación de las respuestas de muchos participantes lleva a un valor cercano al real”.
La encuesta online ya está disponible. Y si, además, desea conocer las respuestas y los datos obtenidos por el equipo investigador puede conocerlos a través del enlace: https://github.com/GCGImdea/coronasurveys