Aportar una mentalidad analítica a la pandemia
La crisis de la COVID-19 nos recuerda que los problemas del análisis de datos nunca son sencillos. Los analistas suelen tener que hacer juicios difíciles y, hasta cierto punto, subjetivos sobre la cantidad de datos que recopilar (y del tamaño del universo), el peso relativo que se debe dar a los diferentes factores al evaluar la cadena causal y cómo informar de los resultados del análisis.
••• Dedique solo 10 minutos a Twitter para ponerse al día con las noticias sobre la COVID-19 y se encontrará con cifras actualizadas y discusiones en voz alta (a veces airadas) sobre lo que significan todos los datos que estamos recopilando. Está resultando difícil precisar qué tan infeccioso es el virus, cuál es su tasa de mortalidad, qué tan eficaces son las diferentes iniciativas de mitigación y por qué las diferentes regiones sufren patrones tan diferentes de infección, mortalidad y recurrencia. Esa falta de certeza no sorprende en absoluto; al fin y al cabo, es una nueva enfermedad de la que nos enteramos en tiempo real, en condiciones de una presión terriblemente alta. Además, las diferentes regiones tienen capacidades de pruebas y sistemas de salud muy diferentes; esos factores por sí solos pueden explicar gran parte de la variabilidad que estamos presenciando. Dicho esto, los epidemiólogos y otros expertos se enfrentan a muchos de los mismos problemas que surgen en cualquier problema de análisis de datos. La verdad es que recopilar y analizar datos rara vez es sencillo; en cada etapa, hay que tomar decisiones difíciles. Las decisiones que tome sobre tres factores (a quién incluir en su conjunto de datos, cuánto peso relativo dar a los diferentes factores al investigar las cadenas causales y cómo informar de los resultados) tendrán un impacto significativo en sus conclusiones. Tomar las decisiones correctas salvará vidas en la actual crisis sanitaria y mejorará el rendimiento en entornos empresariales menos drásticos. **¿Quién debería hacerse la prueba?** En el caso de una enfermedad desconocida, lo más fácil es hacer la prueba solo a personas muy enfermas o incluso a personas que ya hayan fallecido. (En áreas sin suficientes kits de pruebas, puede que no haya otra opción.) Lamentablemente, si bien este enfoque es el más fácil, aumenta la tasa de mortalidad percibida. Supongamos que 10 personas están muy enfermas y 1 sería víctima de una enfermedad. Entonces registraríamos una tasa de mortalidad del 10%. Pero si 100 personas se infectaran realmente y 90 de ellas tuvieran síntomas leves (o ningún síntoma), la tasa de mortalidad real sería del 1%, pero no lo sabría a menos que se hiciera las pruebas más ampliamente. La lección: solo observar los casos más obvios hace que el virus se vea peor de lo que es. Los estadísticos denominan a este problema un sesgo de selección en el muestreo. Las empresas pueden cometer fácilmente el mismo error. Por ejemplo, supongamos que una organización quiere saber qué hay detrás de un repunte de las ventas. El director de marketing plantea la hipótesis de que se debió a una nueva campaña publicitaria. En este caso, es tentador centrarse en los resultados que sean fáciles de medir, en nombre de la eficiencia. Supongamos que observamos todos los nuevos clientes que llegan a nuestra tienda o sitio web y descubrimos que la mitad de ellos vieron nuestra publicidad antes de comprarnos. Ahora podemos concluir que la tasa de conversión de nuestra publicidad es del 50%. Sin embargo, ¿qué pasa con todas las personas que vieron la publicidad y _no_ ¿viene a nuestra tienda o sitio web? Si los incluyéramos, la tasa de conversión de clientes sería mucho más baja. No seleccionamos a esas personas como candidatas a las pruebas para nuestro análisis, porque era más caro y más difícil incluirlas. Una tasa de conversión incorrecta tiene grandes implicaciones para las asignaciones presupuestarias y, en última instancia, para la rentabilidad de la inversión, del mismo modo que entender las tasas de infección y mortalidad de la COVID-19 tiene enormes implicaciones para la política de salud pública en el futuro. _Solución: no mida muestras prácticas; amplíe el estudio para incluir un grupo más representativo. El grado en que esto pueda suceder depende de los costes y los recursos disponibles, por supuesto._ **¿Cuánto peso debemos dar a los diferentes factores a la hora de interpretar los datos?** El segundo desafío consiste en determinar el impacto relativo de un factor en el resultado. Supongamos que los funcionarios de salud pública están intentando entender qué factores fueron más importantes para los resultados individuales de los pacientes en la pandemia actual. Determinar eso no es simple ni sencillo, ya que hay muchos posibles factores que contribuyen: la edad, las afecciones preexistentes, como las enfermedades cardíacas o la diabetes, la salud del sistema inmunitario, el momento de la intervención y si los proveedores de atención médica estaban sobrecargados, por nombrar algunos. Estas preguntas son muy difíciles de responder, ya que la influencia de muchos factores críticos y sus interacciones no se pueden observar ni medir directamente. Las empresas se enfrentan a dilemas similares todo el tiempo. Volvamos a nuestro ejemplo anterior de un repunte significativo de las ventas. La directora de marketing podría pensar que ocurrió por la nueva campaña publicitaria que promovió. Pero tal vez se deba a los recientes ajustes en el diseño del sitio web, a un cambio en los precios, a los nuevos talentos en la fuerza de ventas o a que un competidor clave haya hecho una mala jugada, o (muy probablemente) a alguna combinación de factores. Es imposible saberlo con certeza, después de los hechos. _Solución: Necesitamos un método científico que distinga y aísle la contribución de los factores individuales, como hacen los ensayos controlados aleatorios (experimentos). En los entornos empresariales, normalmente es posible utilizar experimentos que puedan poner a prueba la importancia de los cambios pequeños e independientes. En una pandemia, eso no va a ser posible (aunque están surgiendo experimentos naturales a medida que diferentes países adoptan diferentes enfoques para gestionar la crisis)._ **¿Cómo informar de los resultados?** Una vez realizados todos los cálculos y estimaciones, los analistas tienen que decidir cómo informar de sus conclusiones. La forma en que se informan los resultados suele afectar a la percepción de lo mala o buena que es una situación. En el caso de la pandemia, varias partes interesadas han presentado las cifras de infección de formas muy diferentes. Vimos a muchos medios de comunicación informar sobre el total de casos y comparar las curvas de crecimiento del virus para argumentar que ciertos métodos funcionan mejor o para criticar las políticas gubernamentales. Sin embargo, ¿es justo comparar 100 casos de infección en los EE. UU. con 100 casos en Singapur? Estados Unidos tiene más de 320 millones de personas, Singapur 5,6 millones. Los números absolutos siempre deben verse en su contexto. Una vez ajustemos los casos de COVID-19 per cápita, las cifras son muy diferentes. Al mismo tiempo, mostrar solo los aumentos relativos también puede resultar engañoso. Que las cifras aumenten un 50% tiene implicaciones muy diferentes para un país con 2 infecciones que para un país con 10 000 casos conocidos. Los resultados empresariales también se pueden presentar de forma diferente según el informe. Imagine que tiene la oportunidad de invertir en diferentes empresas. Una informa de un crecimiento de los ingresos del 20% y la segunda empresa solo un 10%. Al igual que con el ejemplo de las cifras de infección, podemos ver lo engañosa que puede resultar la tasa de crecimiento si no se tiene en cuenta el número total de productos vendidos. Aumentar las ventas un 10% es mucho más fácil si solo vende 10 productos en lugar de 10 000 al mes (en igualdad de condiciones). Del mismo modo, es posible que informar las cifras totales de ventas por sí solo (sin un punto de referencia) tampoco sirva para ofrecer una comparación justa. _Solución: proporcione siempre (o solicite) varios indicadores, en particular números absolutos y relativos, para entender el contexto completo de una situación. Puede ser «aumento total de ventas» y «aumento porcentual» y comparaciones anuales o regionales._