5 conceptos que ayudarán a su equipo a basarse más en los datos

Los datos están invadiendo todos los rincones de todos los equipos, departamentos y empresas de todos los sectores y de todas partes. Desarrollar el talento necesario para aprovechar al máximo debe ser una de las principales prioridades. De hecho, todo el mundo debe poder contribuir a mejorar la calidad de los datos, interpretar los análisis y realizar sus propios experimentos. Los sistemas de educación pública tardarán décadas en producir suficientes personas con las habilidades necesarias, demasiado tiempo para que las empresas esperen. Afortunadamente, los directores, con la ayuda de un científico de datos sénior que trabaja unas horas a la semana, pueden introducir cinco poderosas «herramientas» que ayudarán a sus equipos a empezar a utilizar la analítica para resolver problemas empresariales importantes.

••• He dedicado mi carrera a ayudar a las empresas a aprovechar sus oportunidades de datos y calidad de los datos. En general, califico el progreso como»[más lento de lo esperado](/2018/10/5-ways-your-data-strategy-can-fail).» Si bien hay muchos factores que contribuyen, uno de los más importantes es la enorme falta de talento analítico, arriba y abajo en el organigrama. A su vez, esta falta de talento dificulta que las empresas aprovechen sus datos, aprovechen al máximo a sus científicos de datos y se enfrenten a los problemas de calidad de los datos. La falta de talento genera miedo y agrava las dificultades para adoptar una cultura basada en los datos. Y así sucesivamente, en un círculo vicioso. Aun así, el progreso en el espacio de los datos es inexorable y las empresas inteligentes saben que deben abordar sus brechas de talento. Los sistemas de educación pública tardarán décadas en producir suficientes personas con las habilidades necesarias, demasiado tiempo para que las empresas esperen. Afortunadamente, los directores, con la ayuda de un científico de datos sénior que trabaja unas horas a la semana, pueden introducir cinco poderosas «herramientas» que ayudarán a sus equipos actuales a empezar a utilizar la analítica con más eficacia para resolver problemas empresariales importantes. Sin duda, estas no son las únicas herramientas que necesitará; por ejemplo, aquí no he incluido las pruebas A/B, la comprensión de la variación o la visualización. Mi intención tampoco es convertir a las personas en expertos. Más bien, según mis experiencias trabajando con empresas en su estrategia de datos, estos cinco conceptos ofrecen la mayor rentabilidad a corto plazo. La primera es aprender a **piense como un científico de datos**. No hablamos de esto con suficiente frecuencia, pero es muy difícil adquirir buenos datos, analizarlos adecuadamente, seguir las pistas que ofrecen esos análisis, explorar las implicaciones y presentar los resultados de una manera justa y convincente. Esta es la esencia de la ciencia de datos. No puede leer sobre esto en un libro, simplemente tiene que experimentar el trabajo para apreciarlo. Para que su equipo practique de forma práctica, pídales que seleccionen un tema que les interese (por ejemplo, «si las reuniones comienzan a tiempo») y, a continuación, haga que terminen [el ejercicio descrito en este artículo](/2013/11/how-to-start-thinking-like-a-data-scientist). El primer paso llevará a una imagen similar a la de abajo y el resto del ejercicio consistirá en explorar las implicaciones de esa imagen. Cargue al científico sénior con el que se ha comprometido a ayudar a las personas a completar el ejercicio, enseñándoles a interpretar algunas estadísticas, tablas y gráficos básicos, como un diagrama de series temporales y un diagrama de Pareto. A medida que adquieran experiencia, anime a su equipo a aplicar lo que ha aprendido en su trabajo todos los días. Asegúrese de reservar tiempo para que las personas muestren a los demás lo que están aprendiendo, por ejemplo, dedicando quince minutos al tema en cada reunión de personal. Lo más importante es predicar con el ejemplo: haga este trabajo usted mismo, presente sus resultados y discuta libremente los desafíos a los que se enfrentó al hacer el trabajo. A medida que usted y su equipo se sumerjan en los datos, no cabe duda de que se encontrarán con problemas de calidad, razón por la cual **gestionar de forma proactiva la calidad de los datos** es la siguiente habilidad importante que hay que aprender. Los datos deficientes son la norma: ensucian las operaciones, aumentan los costes y generan desconfianza en la analítica. Afortunadamente, prácticamente todo el mundo puede tener un impacto positivo en este sentido. El primer paso es realizar una medición sencilla con el[Método de medición del viernes por la tarde](https://www.youtube.com/watch?v=X8iacfMX1nw) (la técnica adquirió este nombre porque muchos equipos acaban utilizándola los viernes por la tarde). Para ello, dé instrucciones a los miembros de su equipo para que recopilen de 10 a 15 atributos de datos críticos para las últimas 100 unidades de trabajo completadas por sus departamentos, básicamente los últimos 100 registros de datos. Luego, deberían revisar cada registro, marcando los errores obvios. Luego deberían hacer un recuento de los registros sin errores. El número, que puede oscilar entre 0 y 100, representa el porcentaje de datos creados correctamente, su puntuación de calidad de datos (DQ). El DQ también se puede interpretar como la fracción de tiempo que el trabajo se completa correctamente, la primera vez. A la mayoría de los directivos les sorprenden los resultados: esperan conseguir una puntuación alta de los 90,[pero DQ = 54 es la puntuación media.](/2017/09/only-3-of-companies-data-meets-basic-quality-standards) FAM también puede indicar qué atributos de los datos tienen las tasas de error más altas y sugerirle dónde se pueden realizar mejoras, mediante el análisis de la causa raíz, que se describe a continuación. Haga que cada miembro de su equipo haga una de esas mejoras. La tercera habilidad es **realizar un análisis de la causa raíz (RCA)** y su requisito previo, **entender la distinción entre correlación y causalidad**. Estudiar los números puede indicar dónde se producen la mayoría de los errores o demostrar que dos (o más) variables suben y bajan a la vez, pero no puede describir completamente _por qué_ esto es.[Por ejemplo, los estudios muestran que el número de nacidos vivos y de cigüeñas en el campo estaba altamente correlacionado](https://priceonomics.com/do-storks-deliver-babies/). ¡Pero las cigüeñas no traen bebés! Por lo tanto, consulte los números para entender la correlación y los fenómenos del mundo real para entender la causalidad. El análisis de la causa raíz es un enfoque estructurado para llegar a las verdaderas razones por las que las cosas van mal: las causas fundamentales. Es importante porque, con demasiada frecuencia, los directivos y los equipos suelen aceptar explicaciones fáciles y no profundizan lo suficiente. Y los problemas persisten. El RCA puede permitirles tener una imagen más clara y tomar medidas que tengan más probabilidades de resolver el problema. Para desarrollar esta habilidad con su equipo, comience por hablar[«cómo explorar la causa y el efecto como un científico de datos»](/2014/02/how-to-explore-cause-and-effect-like-a-data-scientist?autocomplete=true) con su personal. Entonces, la próxima vez que se sienta tentado a aceptar el razonamiento intuitivo de alguien sobre por qué algo ha ido mal, aproveche la oportunidad para realizar un análisis sólido de la causa raíz. Hay muchos medios formales para hacerlo.[«Los cinco porqués»,](https://en.wikipedia.org/wiki/5_Whys) lo que lo obliga a asegurarse de que ha ido a la causa fundamental, y[diagramas de espina de pescado](https://whatis.techtarget.com/definition/fishbone-diagram), que representan gráficamente múltiples causas, son probablemente las más conocidas. ¡Haga que su científico de datos elija uno y lo siga! Con el tiempo, trate de hacer del análisis de la causa raíz su estándar para todos los temas importantes. La cuarta habilidad se debe al deseo que tienen todos los directivos de «tener el control». Mi definición práctica de control es «el acto directivo de comparar el proceso con los estándares y actuar en función de la diferencia». Pero incluso el proceso más simple varía. ¿Cómo se puede distinguir la variación normal día tras día de las situaciones que realmente están fuera de control? Afortunadamente, **entender y aplicar las gráficas de control** proporciona una forma poderosa de hacer precisamente eso. Los gráficos de control incluyen un gráfico de los datos, la media y dos «límites de control» (un límite de control superior y un límite de control inferior). Por muy básicos que sean, ¡revelan mucho! Por ejemplo, en la siguiente figura: ![](https://hbr.org/resources/images/article_assets/2018/11/W181030_REDMAN_ANEXAMPLE.png)   1. Como el día 9 está fuera de los límites de control, el gerente puede asegurarse de que este proceso está fuera de control. Deberían iniciar un análisis de la causa raíz para averiguar por qué. 2. Hay un repunte en el cuarto día que parece alentador. Pero un entrenador no debería entusiasmarse demasiado: es más probable que el repunte se deba a una variación aleatoria y no se mantuvo. 3. Está bastante claro que este proceso solo tiene éxito el 60% de las veces. Si esto no es suficiente, el director debe hacer cambios fundamentales. Haga que su científico de datos les ayude a usted y a su equipo a probar los gráficos de control en algunos procesos importantes. Aprenda sobre la marcha, entendiendo los términos clave, determinando qué gráficos de control utilizar y esforzándose primero por controlar los procesos; su confianza aumentará, al igual que su capacidad para gestionar su equipo. Por último, todos los directivos y sus equipos deberían aprender a **entender y aplicar el análisis de regresión**. La regresión proporciona un medio eficaz de explorar las relaciones numéricas entre las variables. Para ilustrarlo, piense en «ventas globales». Hay docenas de factores que podrían aumentar las ventas (por ejemplo, la lluvia) o reducirlas (por ejemplo, la reducción de precios de la competencia). La regresión permite determinar qué variables son más importantes y su impacto en las ventas. Por ejemplo, un análisis puede arrojar: Ventas mensuales = 200 + 5* (días de lluvia) — 10* (reducción del precio de la competencia en $) + término de error Quiere decir que: - Sin otros factores, las ventas mensuales son de unas 200 unidades. - Un día de lluvia está asociado a la venta de cinco paraguas más, - Que la competencia reduzca su precio en un dólar se asocia con la venta de diez paraguas menos El modelo no es perfecto, de ahí el término de error. Por ejemplo, supongamos que vendió 250 sombrillas en un mes cuando había 15 días de lluvia y un competidor redujo su precio en 2 dólares. Según la fórmula, cabría esperar que las ventas de paraguas fueran de 200 + 5*15 — 10*2 = 255 unidades. Así que el término de error en ese caso es 5 paraguas. Como todos los análisis, cuantas más variables, más complejo es el análisis, así que empiece por centrarse en una variable independiente (por ejemplo, explicativa). Paralelamente, lea[«Un repaso del análisis de regresión»,](/2015/11/a-refresher-on-regression-analysis) que utiliza las ventas globales como ejemplo para explicar los términos y los conceptos subyacentes. Haga que su científico de datos ayude a su equipo a hacer el trabajo y se asegure de que los miembros del equipo no se queden atascados en los detalles. Solo entonces debería pasar a dos, tres o más variables y a modelos de regresión más complejos. Estas cinco herramientas son potentes, incluso elegantes, a su manera. Ofrecen capacidades mucho mayores que las que se describen aquí, cuyo único objetivo es ayudarle a empezar. Seguro que dará algunos pasos en falso en el camino, pero siga adelante. Trabaje con su científico de datos para obtener aún más información. A medida que su equipo confíe más en el uso de la analítica, los beneficios empresariales que obtenga justificarán con creces el esfuerzo.