Cuándo dar a los empleados acceso a los datos y los análisis
Mientras los líderes empresariales buscan democratizar los datos y los análisis en sus organizaciones, la verdadera pregunta que deberían hacerse es «cuándo» tiene más sentido. Ofrecemos los siguientes criterios para ayudarlo a determinar cuándo capacitar a los ciudadanos de los datos: piense en el nivel de habilidad del ciudadano, mida la importancia del problema, determine la complejidad del problema, capacite a quienes tienen experiencia en el campo y desafíe a los expertos a buscar sesgos.
••• A medida que los líderes empresariales se esfuerzan por aprovechar al máximo sus inversiones en análisis, la ciencia de datos democratizada suele ofrecer la solución perfecta. El uso de software de análisis con herramientas sin código y con poco código puede poner las técnicas de ciencia de datos en manos de prácticamente cualquier persona. En el mejor de los casos, esto lleva a una mejor toma de decisiones y a una mayor autosuficiencia y autoservicio en el análisis de datos, sobre todo porque la demanda de científicos de datos supera con creces su oferta. A eso hay que añadir la reducción de los costes de talento (con menos científicos de datos costosos) y una personalización más escalable para adaptar los análisis a las necesidades y al contexto empresarial en particular. Sin embargo, en medio de todo el debate sobre si se debe democratizar la ciencia y el análisis de datos y cómo hacerlo, se ha pasado por alto un punto crucial. La conversación tiene que definirse _cuando_ democratizar los datos y la analítica, incluso hasta el punto de redefinir lo que debe significar la democratización. La ciencia y el análisis de datos totalmente democratizados presentan muchos riesgos. Como escribieron Reid Blackman y Tamara Sipes en un[artículo reciente](/2022/12/the-risks-of-empowering-citizen-data-scientists), la ciencia de datos es difícil y un «experto» sin formación no necesariamente puede resolver problemas difíciles, ni siquiera con un buen software. La facilidad de hacer clic en un botón que produce resultados no garantiza que la respuesta sea buena; de hecho, podría tener muchos defectos y solo un científico de datos formado lo sabría. ## Es solo cuestión de tiempo Sin embargo, a pesar de estas reservas, la democratización de la ciencia de datos llegó para quedarse, como lo demuestra la proliferación de[software y herramientas de análisis](https://www.enterpriseai.news/2021/02/26/how-automl-is-democratizing-data-science-and-what-that-means-for-data-scientists/). Thomas Redman y Thomas Davenport están entre los que abogan por el desarrollo de»[científicos de datos ciudadanos](/2021/03/4-ways-to-democratize-data-science-in-your-organization)», incluso evaluando las habilidades y aptitudes básicas de la ciencia de datos en cada puesto contratado. Sin embargo, la democratización de la ciencia de datos no debe llevarse al extremo. La analítica no tiene por qué estar al alcance de todo el mundo para que una organización prospere. ¿Cuántas personas con un talento tremendo no serían contratadas simplemente porque carecen de «habilidades básicas de ciencia de datos»? No es realista y es demasiado limitante. Mientras los líderes empresariales buscan democratizar los datos y los análisis en sus organizaciones, la verdadera pregunta que deberían hacerse es «cuándo» tiene más sentido. Esto comienza por reconocer que no todos los «ciudadanos» de una organización tienen habilidades comparables para ser científicos de datos ciudadanos. Como me dijo Nick Elprin, CEO y cofundador de Domino Data Lab, que proporciona herramientas de ciencia de datos y aprendizaje automático a las organizaciones, en una conversación reciente: «En cuanto se dedica al modelado, suelen ocultarse cuestiones estadísticas más complicadas». ## El desafío de la democratización de los datos Pensemos en una cadena de supermercados que recientemente utilizó métodos predictivos avanzados para dimensionar correctamente su planificación de la demanda, en un intento de evitar tener demasiado inventario (lo que se estropea) o muy poco (se traduce en una pérdida de ventas). Las pérdidas por deterioro y desabastecimiento no fueron enormes, pero el problema de reducirlas era muy difícil de resolver, dadas todas las variables de la demanda, la estacionalidad y el comportamiento de los consumidores. La complejidad del problema hizo que la cadena de supermercados no pudiera dejar que los científicos de datos ciudadanos lo descubrieran, sino que recurriera a un equipo de científicos de datos genuinos y bien formados. La ciudadanía de los datos requiere una «democracia representativa», como comentamos Elprin y yo. Así como los ciudadanos estadounidenses eligen a los políticos para que los representen en el Congreso (presumiblemente para que actúen en beneficio de sus intereses en materia legislativa), las organizaciones también necesitan la representación adecuada de científicos y analistas de datos para opinar sobre temas que otros simplemente no tienen la experiencia para abordar. En resumen, se trata de saber cuándo y en qué medida democratizar los datos. Le sugiero los cinco criterios siguientes: **Piense en el nivel de habilidad del «ciudadano»:** El científico de datos ciudadanos, de alguna forma y forma, llegó para quedarse. Como he dicho anteriormente, simplemente no hay suficientes científicos de datos para todos y utilizar este escaso talento para abordar todos los problemas de los datos no es sostenible. Más concretamente, la democratización de los datos es clave para inculcar el pensamiento analítico en toda la organización. Un ejemplo muy reconocido es[Coca-Cola](https://www.mckinsey.com/capabilities/operations/our-insights/coca-cola-the-people-first-story-of-a-digital-transformation), que ha creado una academia digital para formar a los directores y líderes de equipo, y ha producido graduados del programa a los que se les atribuyen unas 20 iniciativas digitales, de automatización y análisis en varios sitios de las operaciones de fabricación de la empresa. Sin embargo, cuando se trata de utilizar modelos predictivos y análisis de datos avanzados que podrían cambiar radicalmente las operaciones de una empresa, es crucial tener en cuenta el nivel de habilidad del «ciudadano». Una herramienta sofisticada en manos de un científico de datos es aditiva y valiosa; la misma herramienta en manos de alguien que simplemente está «jugando con los datos» puede provocar errores, suposiciones incorrectas, resultados cuestionables y una mala interpretación de los resultados y las conclusiones. **Mida la importancia del problema:** Cuanto más importante sea un problema para la empresa, más imprescindible es que un experto se encargue del análisis de los datos. Por ejemplo, alguien con un panel que muestre los datos en una forma visualmente atractiva pueda generar un gráfico sencillo de las tendencias de compra históricas. Sin embargo, una decisión estratégica que tenga un impacto significativo en las operaciones de una empresa requiere experiencia y una precisión confiable. Por ejemplo, cuánto debe cobrar una compañía de seguros por una póliza es tan fundamental para el propio modelo de negocio que no sería prudente relegar esta tarea a un no experto. **Determine la complejidad del problema:** Resolver problemas complejos va más allá de la capacidad del típico científico de datos ciudadano. Tenga en cuenta la diferencia entre comparar las puntuaciones de satisfacción de los clientes en todos los segmentos de clientes (métricas simples y bien definidas y de menor riesgo) y utilizar el aprendizaje profundo para detectar el cáncer en un paciente (complejo y de alto riesgo). No se puede dejar que un no experto tome decisiones arrogante y, potencialmente, decisiones equivocadas. Cuando la complejidad y las apuestas son bajas, democratizar los datos tiene sentido. Un ejemplo es una empresa de Fortune 500 con la que trabajo, que utiliza datos en todas sus operaciones. Hace unos años, dirigía un[programa de formación](https://www.forbes.com/sites/joelshapiro/2020/08/25/the-right-way-to-democratize-analytics/?sh=3aeaae5b3a6a) en el que se dividió a más de 4 500 directivos en equipos pequeños, a cada uno de los cuales se le pidió que articulara un problema empresarial importante que pudiera resolverse con la analítica. Los equipos podían resolver problemas sencillos con las herramientas de software disponibles, pero la mayoría de los problemas surgían precisamente porque eran difíciles de resolver. Es importante destacar que estos gerentes eran _no_ encargado de resolver realmente esos difíciles problemas, sino de colaborar con el equipo de ciencia de datos. Cabe destacar que estos 1000 equipos identificaron no menos de 1000 oportunidades de negocio y 1000 formas en las que la analítica podía ayudar a la organización. **Capacite a quienes tengan experiencia en el campo:** Si una empresa busca información «direccional» (el cliente X tiene más probabilidades de comprar un producto que el cliente Y), entonces la democratización de los datos y un poco de ciencia de datos ciudadana de nivel inferior probablemente basten. De hecho, abordar este tipo de análisis de nivel inferior puede ser una excelente manera de capacitar a quienes tienen experiencia en el campo (es decir, estar más cerca de los clientes) con algunas herramientas de datos simplificadas. Una mayor precisión (por ejemplo, en temas complejos y de alto riesgo) requiere experiencia. El argumento más convincente a favor de la precisión es cuando hay decisiones de alto riesgo que tomar en función de algún umbral. Si se emprendiera un plan de tratamiento oncológico agresivo con efectos secundarios importantes con, por ejemplo, una probabilidad superior al 30% de padecer cáncer, sería importante diferenciar entre el 29,9% y el 30,1%. La precisión importa, especialmente en la medicina, las operaciones clínicas, las operaciones técnicas y para las instituciones financieras que navegan por los mercados y el riesgo, a menudo para obtener márgenes muy pequeños a gran escala. **Desafíe a los expertos a buscar sesgos:** Los análisis avanzados y la IA pueden llevar fácilmente a decisiones que se consideran «sesgadas». Esto es un desafío en parte porque el objetivo de la analítica es discriminar, es decir, basar las elecciones y decisiones en determinadas variables. (Envíe esta oferta a un hombre mayor, pero no a una mujer más joven, ya que creemos que tendrá diferentes comportamientos de compra en respuesta). La gran pregunta, por lo tanto, es cuándo esa discriminación es realmente aceptable e incluso buena, y cuándo es intrínsecamente problemática, injusta y peligrosa para la reputación de una empresa. Considere el ejemplo de[Goldman Sachs](https://www.theverge.com/2021/3/23/22347127/goldman-sachs-apple-card-no-gender-discrimination), que fue acusado de discriminar al ofrecer menos crédito en una tarjeta de crédito de Apple a mujeres que a hombres. En respuesta, Goldman Sachs dijo que no utilizaba el género en su modelo, solo factores como el historial crediticio y los ingresos. Sin embargo, se podría argumentar que el historial crediticio y los ingresos están correlacionados con el género y el uso de esas variables castiga a las mujeres que tienden a ganar menos dinero de media e, históricamente, han tenido menos oportunidades de acumular crédito. Cuando se utilizan resultados que discriminan, tanto los responsables de la toma de decisiones como los profesionales de los datos tienen que entender cómo se generaron los datos y su interconexión, así como cómo medir cosas como el tratamiento diferencial y mucho más. Una empresa nunca debería arriesgar su reputación haciendo que un científico de datos ciudadano determine por sí solo si un modelo está sesgado. Democratizar los datos tiene sus méritos, pero conlleva desafíos. Dar las llaves a todo el mundo no lo convierte en experto, y recopilar información equivocada puede resultar catastrófico. Las nuevas herramientas de software pueden permitir a todo el mundo utilizar los datos, pero no hay que confundir ese acceso generalizado con una experiencia genuina.