Aprovechamiento de la IA para combatir esta pandemia — y la próxima
En los últimos meses el mundo ha experimentado una serie de brotes de Covid-19 que generalmente han seguido la misma vía: una fase inicial con pocas infecciones y respuesta limitada, seguida por el despegue de la famosa curva epidémica acompañado de un bloqueo en todo el país a aplanar la curva. Luego, una vez que la curva se ciñe, los gobiernos tienen que abordar lo que el presidente Trump ha llamado « la mayor decisión» de su vida: cuándo y cómo gestionar el desconfinamiento. A lo largo de la pandemia se ha hecho gran hincapié en el intercambio (o la falta de ella) de información crítica entre los países, en particular de China — sobre la propagación de la enfermedad. Por el contrario, se ha dicho relativamente poco acerca de cómo Covid-19 podría haberse administrado mejor aprovechando las tecnologías de datos avanzadas que han transformado las empresas en los últimos 20 años. En este artículo discutimos una manera en que los gobiernos podrían aprovechar esas tecnologías en la gestión de una futura pandemia, y quizás incluso las fases de cierre de la actual.
El poder de la predicción personalizada
Un enfoque alternativo para que los responsables de la formulación de políticas consideren agregar en su mezcla para luchar contra Covid-19 se basa en la tecnología de predicción personalizada, que ha transformado muchas industrias en los últimos 20 años. Utilizando la tecnología de aprendizaje automático e inteligencia artificial (IA), las empresas basadas en datos (desde «Big Tech» hasta servicios financieros, viajes, seguros, minoristas y medios de comunicación) hacen recomendaciones personalizadas sobre qué comprar, y practican precios personalizados, riesgos, crédito y similares utilizando los datos que han acumulado sobre sus clientes. Por ejemplo, Ming Zeng, ex director de estrategia de Alibaba, describió cómo Ant Financial, la operación de préstamos para pequeñas empresas de su empresa, puede evaluar a los solicitantes de préstamos en tiempo real analizando sus datos de transacciones y comunicaciones en las plataformas de comercio electrónico de Alibaba. Mientras tanto, empresas como Netflix evalúan las opciones y características del pasado de los consumidores para hacer predicciones sobre lo que van a ver a continuación. El mismo enfoque podría funcionar para las pandemias, e incluso para el futuro de Covid-19. Utilizando múltiples fuentes de datos, se capacitaría a los modelos de aprendizaje automático para medir la riesgo clínico de sufrir desenlaces graves (si está infectado con Covid): ¿Cuál es la probabilidad de que necesitarán cuidados intensivos, para los cuales hay recursos limitados? ¿Cuán probable es que mueran? Los datos podrían incluir historias clínicas básicas de los individuos (para Covid-19, la gravedad de los síntomas parece aumentar con la edad y con la presencia de comorbilidades tales como diabetes o hipertensión) así como otros datos, como la composición de los hogares. Por ejemplo, una persona joven y sana (que de otro modo podría clasificarse como «de bajo riesgo») podría clasificarse como «de alto riesgo» si vive con personas mayores o enfermas que probablemente necesitarían cuidados intensivos si se infectan. Estas predicciones de riesgo clínico podrían utilizarse entonces para personalizar las políticas y la asignación de recursos a nivel individual/familiar, teniendo debidamente en cuenta las responsabilidades y riesgos médicos estándar. Podría, por ejemplo, permitirnos orientar el distanciamiento social y la protección de las personas con altas puntuaciones de riesgo clínico, permitiendo a las personas con puntuaciones bajas vivir más o menos normalmente. Los criterios para asignar individuos a grupos de alto o bajo riesgo, por supuesto, tendrían que ser determinados, teniendo en cuenta también los recursos disponibles, los riesgos de responsabilidad médica y otras compensaciones de riesgos, pero los enfoques de la ciencia de datos para esto son estándar y se utilizan en numerosas aplicaciones. Un enfoque personalizado tiene múltiples beneficios. Puede ayudar a construir inmunidad del rebaño con menor mortalidad - y rápido. También permitiría una mejor y más justa asignación de recursos, por ejemplo, de escaso equipo médico (como kits de prueba, máscaras protectoras y camas de hospital) u otros recursos. Las estrategias de desconfinamiento en las etapas posteriores de una pandemia, un paso clave siguiente para Covid-19 en la mayoría de los países, pueden beneficiarse de una manera similar. Decidir con qué personas iniciar el proceso de desconfinamiento es, por naturaleza, un problema de clasificación similar a los problemas de clasificación conocidos por la mayoría de las empresas basadas en datos. Algunos gobiernos ya se están acercando a la desconfinación utilizando la edad como indicador del riesgo, una clasificación relativamente cruda que puede faltar a otras personas de alto riesgo (como el ejemplo anterior de jóvenes sanos que viven con ancianos). Realizar una clasificación basada en datos y modelos de predicción de IA podría conducir a decisiones de desconfinamiento seguras a nivel comunitario y mucho menos costosas para el individuo y la economía. Sabemos que una característica clave de Covid-19 es que tiene una tasa de transmisión excepcionalmente alta, pero también síntomas graves relativamente bajos o tasa de mortalidad. Los datos indican que posiblemente más del 90% de las personas infectadas son asintomáticas o presentan síntomas leves cuando están infectadas. En teoría, con una predicción fiable de quiénes son estos 90% podríamos desconfinar a todos estos individuos. Incluso si se infectaban unos a otros, no tendrían síntomas graves y no abrumarían el sistema médico ni morirían. Estas personas desconfinadas en un 90% de bajo riesgo clínico también ayudarían a la rápida acumulación de alta inmunidad del rebaño, momento en el que el 10% restante también podría ser desconfinado. Si una puntuación de predicción resultara errónea, las consecuencias se limitarían a las personas «más seguras» que fueron liberadas por primera vez del confinamiento. Podrían gestionarse con los recursos médicos disponibles, que no se sobrecargaría si se tratara al 10% restante o más personas de alto riesgo que permanecían confinadas. En la práctica, por supuesto, introduciremos la desconfinación de manera más gradual, comenzando primero desde los grupos de riesgo clínico más bajo y aumentando la inmunidad del rebaño a lo largo del tiempo. Por supuesto que no tenemos modelos de predicción de riesgos clínicos perfectos, al igual que no tenemos sistemas de triaje hospitalario o modelos de predicción de impago de crédito. Sin embargo, esto no impide la concesión de crédito a muchas empresas e individuos que, con suficientes herramientas de calificación crediticia, en su mayoría no se detienen. Sin duda, las apuestas en este caso son significativamente más altas que un incumplimiento de préstamo, por lo que tenemos que hacer que los modelos sean lo más robustos posible. Pero eso no significa que no debamos considerar utilizarlas. A diferencia de las pruebas médicas que son escasas, costosas y lentas de implementar, este enfoque de personalización digital basado en datos clínicos se puede aplicar rápidamente y es fácil de escalar. Podría permitir, con los modelos adecuados, un desconfinamiento más seguro a un ritmo mucho más rápido que el actual las mejores prácticas de aislamiento de la pista de pruebas para Covid-19, en virtud del cual las personas infectadas y sus contactos permanecerían confinadas, aun cuando corran bajo riesgo de sufrir síntomas graves.
Obtención de los datos
En la actualidad, no es fácil acceder a los datos necesarios para evaluar el riesgo clínico de una persona de contraer un virus determinado. Sin duda, los gobiernos pueden aumentar la recopilación nacional de datos sanitarios creando o poniendo en marcha registros médicos electrónicos más completos, pero su valor puede ser limitado, ya que tardaría tiempo en surgir patrones entre los datos históricos de los registros médicos y los efectos de un virus en sus víctimas. En un contexto de pandemia que podría afectar rápidamente a millones de personas a nivel mundial, un mejor enfoque podría consistir en crear y compartir un modelo de predicción «entrenado» utilizando los datos de un brote inicial. Un conjunto de datos con decenas de miles de individuos gravemente afectados (aquellos que requieren una UCI), equilibrado con muchos más relativamente menos afectados (aquellos que presentan síntomas leves), es lo suficientemente grande como para permitir algún nivel de predicción personalizada, cuya calidad mejora a medida que se agregan más datos. Una vez que un modelo está en funcionamiento, se puede compartir para ayudar a otras ciudades e incluso países en las primeras etapas de la propagación, porque los datos biológicos y fisiológicos básicos subyacentes en los registros médicos de las personas no varían mucho (todos envejece, y la diabetes en Wuhan es la misma que la diabetes en Baltimore). Si un virus afecta a dos países cuyas poblaciones se parecen entre sí, es probable que los resultados sean similares. Dado esto, los dos países podrían utilizar exactamente el mismo modelo de predicción sin tener que compartir los registros médicos reales que entraron en el entrenamiento del modelo. Por supuesto, los patrones de datos entre los países pueden variar debido, por ejemplo, a la demografía (Japón tiene más personas mayores que México) y a las diferencias culturales o de estilo de vida (los abuelos italianos pueden estar más involucrados en el cuidado de niños que los alemanes), pero los analistas de datos pueden reelaborar el modelo para adaptarse a estas variaciones si los datos se recogieron de acuerdo con un estándar o protocolo comúnmente desarrollado. Considere cómo esto podría haber tenido lugar para Covid-19: Cuando surgió el coronavirus en Wuhan, los datos eran inicialmente inexistentes, lo que hacía inviable la personalización basada en modelos. En este punto, el enfoque de bloqueo tenía sentido: Cierren las ciudades, implementen el distanciamiento social total y monitoreen de cerca, sin hacer excepciones importantes. Obviamente, esto ayudó a contener la enfermedad, pero también creó la oportunidad para que el gobierno chino recogiera todos los datos de capacitación disponibles para modelos de predicción de riesgos clínicos que podría haber compartido con otros países, lo que a su vez podría haber agregado sus propios datos de capacitación para mejorar el modelo más adelante.
El reto de la privacidad
Sin embargo, la aplicación de las innovaciones tecnológicas requerirá cambios de política. Las políticas existentes que cubren la privacidad de los datos y la ciberseguridad, y sus interpretaciones respectivas y diferentes entre los países, prohibirán en gran medida el tipo de enfoque personalizado de gestión de pandemias que estamos defendiendo. Esto se debe en gran medida a que las políticas actuales no diferencian entre los datos de entrada (utilizados para entrenar un modelo), los propios modelos de predicción y los «datos de salida» (predicciones del modelo entrenado). Cuando una política, implícita o explícitamente, prohíbe el intercambio de datos o requiere que los datos se almacenen en servidores dentro de un país, abarca todo lo que pueda interpretarse legalmente como datos, incluidos los modelos y sus parámetros. Por consiguiente, instamos a los encargados de formular políticas a que consideren la posibilidad de distinguir entre el intercambio de modelos y el intercambio de datos. También animamos a los gobiernos nacionales a acordar un protocolo para determinar cuándo podrían compartirse los datos. Por ejemplo, una declaración de la OMS o de las Naciones Unidas en el sentido de que un brote determinado califica de pandemia podría servir de detonante para suspender las leyes normales de privacidad para permitir el intercambio de datos anónimos. En esos momentos, muchas personas podrían estar dispuestas a proporcionar de manera excepcional y temporal sus datos, a través de canales apropiados y seguros, para modelos de capacitación que puedan orientar las decisiones de política con consecuencias vitales y económicas importantes. Si eso sucede, la ciencia moderna de datos y la IA podrían hacer mucho para mitigar las consecuencias de esta pandemia y prepararnos para limitar el impacto de la próxima.
Si nuestro contenido gratuito le ayuda a lidiar con estos desafíos, por favor considere suscribirse a HBR. Una compra de suscripción es la mejor manera de apoyar la creación de estos recursos.
— Theodoros Evgeniou David R. Hardoon Anton Ovchinnikov Via HBR.org