Aprovechar la IA para combatir esta pandemia y la próxima

En la lucha contra la pandemia de coronavirus, los gobiernos no han aprovechado los avances del aprendizaje automático y la IA, específicamente la tecnología de predicción personalizada, que han caracterizado tanto al sector privado. Hacerlo haría que la gestión de una futura pandemia fuera mucho más eficaz e incluso podría ayudar a que el proceso de salir del confinamiento social relacionado con la COVID-19 fuera más seguro y económico. Para que esto suceda, los gobiernos tienen que revisar sus enfoques actuales en materia de privacidad de los datos.

••• Durante los últimos meses, el mundo ha sufrido una serie de brotes de COVID-19 que, en general, han seguido el mismo camino: una fase inicial con pocas infecciones y una respuesta limitada, seguida del despegue del famoso[curva epidémica](https://en.wikipedia.org/wiki/Epidemic_curve) acompañado de un bloqueo nacional para[aplanar la curva](https://en.wikipedia.org/wiki/Epidemic_curve#/media/File:20200410_Flatten_the_curve,_raise_the_line_-_pandemic_(English).gif). Luego, una vez que la curva alcance su punto máximo, los gobiernos tienen que abordar lo que el presidente Trump ha denominado»[la decisión más importante](https://abcnews.go.com/Politics/coronavirus-government-response-updates-trump-americans-back-work/story?id=70083632)» de su vida: cuándo y cómo gestionar el desconfinamiento. A lo largo de la pandemia, se ha hecho gran hincapié en compartir (o no hacerlo) la información crítica entre los países:[en particular de China](https://www.latimes.com/world-nation/story/2020-04-15/china-didnt-warn-public-of-likely-pandemic-for-6-key-days) — sobre la propagación de la enfermedad. Por el contrario, se ha dicho relativamente poco sobre cómo se podría haber gestionado mejor la COVID-19 mediante el aprovechamiento de las tecnologías de datos avanzadas que han transformado las empresas en los últimos 20 años. En este artículo analizamos una forma en que los gobiernos podrían aprovechar esas tecnologías para gestionar una futura pandemia, y quizás incluso las fases de cierre de la actual. ### **El poder de la predicción personalizada** Un enfoque alternativo para que los responsables políticos consideren añadir su combinación para luchar contra la COVID-19 se basa en[la tecnología de predicción personalizada](https://store.hbr.org/product/prediction-machines-the-simple-economics-of-artificial-intelligence/10195?sku=10195-HBK-ENG), que ha transformado muchos sectores en los últimos 20 años. Con la tecnología de aprendizaje automático e inteligencia artificial (IA), las empresas basadas en datos (desde las «grandes tecnologías» hasta los servicios financieros, los viajes, los seguros, la venta minorista y los medios de comunicación) hacen recomendaciones personalizadas sobre qué comprar y practican precios, riesgos, créditos y similares personalizados utilizando los datos que han acumulado sobre sus clientes. [En un artículo reciente de HBR](/2018/09/alibaba-and-the-future-of-business), por ejemplo, Ming Zeng, exdirector de estrategia de Alibaba, describió cómo Ant Financial, la operación de préstamos para pequeñas empresas de su empresa, puede evaluar a los solicitantes de préstamos en tiempo real analizando sus datos de transacciones y comunicaciones en las plataformas de comercio electrónico de Alibaba. Mientras tanto, empresas como Netflix evalúan las elecciones y características anteriores de los consumidores para hacer predicciones sobre lo que verán después. El mismo enfoque podría funcionar para las pandemias e incluso para el futuro de la COVID-19. Con múltiples fuentes de datos, los modelos de aprendizaje automático se entrenarían para medir la[riesgo clínico de sufrir resultados graves (si se infecta por Covid):](https://www.thelancet.com/lancet/article/s0140-6736(20)30566-3) ¿Cuál es la probabilidad de que necesiten cuidados intensivos, para los que los recursos son limitados? ¿Qué probabilidades hay de que mueran? Los datos podrían incluir los historiales médicos básicos de las personas (en el caso de la COVID-19, la gravedad de los síntomas parece aumentar con la edad y con la [presencia de comorbilidades](https://www.who.int/docs/default-source/coronaviruse/who-china-joint-mission-on-covid-19-final-report.pdf) como[diabetes](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7144611/) o[hipertensión)](https://www.nejm.org/doi/full/10.1056/NEJMoa2002032) así como otros datos, como la composición de los hogares. Por ejemplo, una persona joven y sana (que de otro modo podría clasificarse como de «bajo riesgo») podría clasificarse como «de alto riesgo» si vive con personas mayores o enfermas que probablemente necesitarían cuidados intensivos en caso de infectarse. Estas predicciones del riesgo clínico podrían utilizarse entonces para personalizar las políticas y la asignación de recursos a nivel individual o familiar, teniendo en cuenta adecuadamente las responsabilidades y los riesgos médicos estándar. Podría, por ejemplo, permitirnos centrar en el distanciamiento social y la protección de las personas con puntuaciones de riesgo clínico altas y, al mismo tiempo, permitir que las personas con puntuaciones bajas vivan con más o menos normalidad. Por supuesto, habría que determinar los criterios para asignar a las personas a grupos de alto o bajo riesgo, teniendo en cuenta también los recursos disponibles, los riesgos de responsabilidad médica y otras compensaciones de riesgo, pero los enfoques de la ciencia de datos para ello son estándar y se utilizan en numerosas aplicaciones. Un enfoque personalizado tiene múltiples ventajas. Puede que ayude a construir[inmunidad colectiva](https://en.wikipedia.org/wiki/Herd_immunity) con una mortalidad más baja y rápida. También permitiría una asignación mejor (y más justa) de los recursos, por ejemplo, de los escasos equipos médicos (como kits de pruebas, máscaras protectoras y camas de hospital) u otros recursos. Las estrategias de desconfinamiento en las etapas posteriores de una pandemia (el siguiente paso clave para la COVID-19 en la mayoría de los países) pueden beneficiarse de manera similar. Decidir con qué personas iniciar el proceso de desconfinamiento es, por naturaleza, un problema de clasificación similar a los problemas de clasificación que conocen la mayoría de las empresas basadas en datos. Algunos gobiernos ya están abordando la desconfinación utilizando la edad como indicador del riesgo, una clasificación relativamente burda que podría pasar por alto a otras personas de alto riesgo (como el ejemplo anterior de jóvenes sanos que viven con personas mayores). Realizar una clasificación basada en datos y modelos de predicción de la IA podría llevar a tomar decisiones de desconfinamiento que sean seguras a nivel comunitario y mucho menos costosas para la persona y la economía. Sabemos que una característica clave de la COVID-19 es que tiene una tasa de transmisión excepcionalmente alta, pero también una tasa de síntomas graves o mortalidad relativamente baja. Los datos indican que es posible que más del 90% de las personas infectadas estén asintomáticas o presenten síntomas leves al infectarse. En teoría, con una predicción fiable de quiénes son ese 90%, podríamos desconfinar a todas estas personas. Incluso si se infectaran entre sí, no tendrían síntomas graves y no abrumarían al sistema médico ni morirían. Estas personas desconfinadas con un 90% de bajo riesgo clínico también ayudarían a acumular rápidamente una alta inmunidad colectiva, momento en el que el 10% restante también podría ser desconfinado. Si la puntuación de una predicción resultara errónea, las consecuencias se limitarían a las personas «más seguras» que fueran puestas en libertad por primera vez. Podrían gestionarse con los recursos médicos disponibles, lo que no se sobrecargaría si se tratara al 10% restante o más de las personas de alto riesgo que permanecían confinadas. En la práctica, por supuesto, introduciríamos la desconfinación de forma más gradual, empezando primero por los grupos de riesgo clínico más bajo y aumentando la inmunidad colectiva con el tiempo. Por supuesto, no tenemos modelos de predicción del riesgo clínico perfectos, al igual que no tenemos modelos perfectos[sistemas de triaje hospitalarios](http://prod-upp-image-read.ft.com/765d3430-7a57-11ea-af44-daa3def9ae03) o modelos de predicción de incumplimiento crediticio. Sin embargo, esto no impide la concesión de crédito a muchas empresas y personas que, con herramientas de calificación crediticia lo suficientemente buenas, en su mayoría no dejan de pagar. Sin duda, lo que está en juego en este caso es significativamente más alto que un impago crediticio, por lo que tenemos que hacer que los modelos sean lo más sólidos posible. Pero eso no significa que no debamos considerar usarlos. A diferencia de las pruebas médicas, que son escasas, caras y lentas de implementar, este enfoque de personalización digital basado en los datos clínicos se puede aplicar rápidamente y es fácil de escalar. Podría permitir, con los modelos correctos, un desconfinamiento más seguro a un ritmo mucho más rápido que el actual[probar, rastrear y aislar las mejores prácticas para la Covid-19,](https://jamanetwork.com/journals/jama/fullarticle/2762689) según el cual cualquier persona infectada y sus contactos permanecerían recluidos, aunque tuvieran un riesgo bajo de sufrir síntomas graves. ### **Obtener los datos** En la actualidad, no se puede acceder fácilmente a los datos necesarios para evaluar el riesgo clínico de una persona de contraer un virus determinado. No cabe duda de que los gobiernos pueden aumentar la recopilación de datos de salud nacionales mediante la creación o el despliegue de historiales médicos electrónicos más completos, pero su valor puede ser limitado, ya que tardarían en surgir patrones entre los datos históricos de los registros médicos y el impacto de un virus en sus víctimas. En el contexto de una pandemia que podría afectar rápidamente a millones de personas en todo el mundo, un enfoque mejor podría ser crear y compartir un modelo de predicción que se «entrene» con los datos de un brote inicial. Un conjunto de datos con decenas de miles de personas gravemente afectadas (las que requieren una UCI), junto con muchas más personas relativamente menos afectadas (las que presentan síntomas leves), es lo suficientemente grande como para permitir cierto nivel de predicción personalizada, cuya calidad mejora a medida que se añaden más datos. Una vez que un modelo esté en funcionamiento, se puede compartir para ayudar a otras ciudades e incluso países en las primeras etapas de la propagación, ya que los datos biológicos y fisiológicos básicos subyacentes en el historial médico de las personas no varían mucho (todo el mundo envejece y la diabetes en Wuhan es igual que la diabetes en Baltimore). Si un virus ataca a dos países cuyas poblaciones se parecen entre sí, es probable que los resultados sean similares. En vista de ello, los dos países podrían utilizar exactamente el mismo modelo de predicción sin tener que compartir el historial médico real que se utilizó para entrenar el modelo. Por supuesto, los patrones de datos entre los países pueden variar debido, por ejemplo, a la demografía (Japón tiene más personas mayores que México) y a las diferencias culturales o de estilo de vida (los abuelos italianos pueden participar más en el cuidado de los niños que los alemanes), pero los analistas de datos pueden reelaborar el modelo para adaptarlo a estas variaciones si los datos se recopilan de acuerdo con un estándar o protocolo desarrollado comúnmente. Piense en cómo podría haberse desarrollado esto con la COVID-19: cuando apareció el coronavirus en Wuhan, los datos inicialmente no existían, lo que hizo inviable la personalización basada en modelos. En ese momento, el enfoque de confinamiento tenía sentido: cerrar las ciudades, implementar un distanciamiento social total y vigilar de cerca, sin excepciones importantes. Obviamente, esto ayudó a contener la enfermedad, pero también creó la oportunidad para que el gobierno chino recopilara todos los datos de entrenamiento disponibles para los modelos de predicción del riesgo clínico que luego podría haber compartido con otros países, que a su vez podrían haber añadido sus propios datos de entrenamiento para mejorar aún más el modelo. ### **El desafío de la privacidad** Sin embargo, implementar las innovaciones tecnológicas requerirá cambios en las políticas. Las políticas actuales sobre la privacidad de los datos y la ciberseguridad, y sus interpretaciones respectivas y diferentes según los países, prohibirán en gran medida el tipo de enfoque personalizado de gestión de la pandemia que defendemos. Esto se debe en gran medida a que las políticas actuales no diferencian entre los datos de entrada (que se utilizan para entrenar un modelo), los propios modelos de predicción y los «datos de salida» (predicciones del modelo entrenado). Cuando una política, implícita o explícitamente, prohíbe compartir datos o exige que los datos se almacenen en servidores de un país, cubre todo lo que pueda interpretarse legalmente como datos, incluidos los modelos y sus parámetros. Por lo tanto, instamos a los responsables políticos a que consideren la posibilidad de distinguir el intercambio de modelos y el intercambio de datos. También animamos a los gobiernos nacionales a que acuerden un protocolo para determinar cuándo se pueden compartir los datos. Por ejemplo, una declaración de la OMS o la ONU de que un brote en particular califica de pandemia podría provocar la suspensión de las leyes de privacidad normales y permitir el intercambio de datos anónimos. En esos momentos, es posible que muchas personas estén dispuestas a proporcionar sus datos de forma excepcional y temporal, a través de los canales adecuados y seguros, para modelos de formación que puedan guiar las decisiones políticas con importantes consecuencias económicas y vitales. Si eso ocurre, la ciencia de datos y la IA modernas podrían hacer mucho para mitigar las consecuencias de esta pandemia y prepararnos para limitar el impacto de la próxima.