Qué hacen los grandes analistas de datos y por qué todas las organizaciones los necesitan

Científico de datos «completo» significa dominio del aprendizaje automático, las estadísticas y la analítica. La moda actual de la ciencia de datos favorece la sofisticación llamativa con un toque de ciencia ficción, lo que convierte a la IA y al aprendizaje automático en los favoritos del mercado laboral. Los aspirantes alternativos al puesto alfa provienen de la estadística, gracias a una reputación centenaria de rigor y superioridad matemática. ¿Qué hay de los analistas? Mientras que la excelencia en las estadísticas tiene que ver con el rigor y la excelencia en el aprendizaje automático tiene que ver con el rendimiento, la excelencia en la analítica tiene que ver con la velocidad. Los analistas son su mejor opción para proponer esas hipótesis en primer lugar. A medida que los analistas maduren, empezarán a acostumbrarse a juzgar lo que es importante además de lo interesante, lo que permitirá a los responsables de la toma de decisiones dejar el papel de intermediario. De las tres razas, los analistas son los herederos más probables del trono de la toma de decisiones.

••• Contratar el mejor trofeo en ciencia de datos es difícil de alcanzar y no es de extrañar: un científico de datos «completo» domina el aprendizaje automático, la estadística y la analítica. Cuando los equipos no pueden hacerse con un erudito de tres en uno, se centran en conseguir el premio más impresionante entre los especialistas de origen único. ¿Cuál de esas habilidades se queda con el pedestal? La moda actual de la ciencia de datos favorece la sofisticación llamativa con un toque de ciencia ficción, lo que convierte a la IA y al aprendizaje automático en los favoritos del mercado laboral. Los aspirantes alternativos al puesto alfa provienen de la estadística, gracias a una reputación centenaria de rigor y superioridad matemática. ¿Qué hay de los analistas? ### La analítica como ciudadano de segunda clase Si su habilidad principal es la analítica (o la minería de datos o la inteligencia empresarial), lo más probable es que su confianza en sí mismo se haya visto afectada, ya que el aprendizaje automático y las estadísticas se han hecho muy apreciados en las empresas, el mercado laboral y los medios de comunicación. Pero lo que los no iniciados rara vez comprenden es que las tres profesiones que abarca la ciencia de datos son completamente diferentes entre sí. Puede que usen algunos de los mismos métodos y ecuaciones, pero ahí es donde termina la similitud. Lejos de ser una versión inferior a la de otros tipos de ciencia de datos, los buenos analistas son un requisito previo para la eficacia de sus esfuerzos con los datos. Es peligroso que lo dejen, pero eso es exactamente lo que harán si los infravalora. En lugar de pedirle a un analista que desarrolle sus habilidades de estadística o aprendizaje automático, considere la posibilidad de animarlo a que busque primero los niveles de su propia disciplina. En la ciencia de datos, la excelencia en un área supera a la mediocridad en dos. Entonces, examinemos qué significa ser realmente excelente en cada una de las disciplinas de la ciencia de datos, qué valor aportan y qué rasgos de personalidad se necesitan para sobrevivir a cada trabajo. Hacerlo ayudará a explicar por qué los analistas son valiosos y cómo deben utilizarlos las organizaciones. ### Excelencia en estadística: rigor Los estadísticos son especialistas en sacar conclusiones más allá de sus datos de forma segura; son su mejor protección para no dejarse engañar en un mundo incierto. Para ellos, deducir algo de manera descuidada es un pecado mayor que dejar la mente en blanco, así que espere que un buen estadístico frene su exuberancia. Les importa profundamente si los métodos aplicados son los adecuados para el problema y se preocupan por saber qué inferencias son válidas a partir de la información disponible. ¿El resultado? Una perspectiva que ayude a los líderes a tomar decisiones importantes de una manera controlada por los riesgos. En otras palabras, utilizan los datos para minimizar las posibilidades de que llegue a una conclusión imprudente. ### Excelencia en el aprendizaje automático: rendimiento Puede que sea ingeniero de aprendizaje automático aplicado/IA si su respuesta a «Apuesto a que no podría crear un modelo que pase las pruebas con una precisión del 99,99999%» es «Obsérveme». Con la habilidad de programar para crear prototipos y sistemas de producción que funcionen y la obstinada resiliencia a fallar cada hora durante varios años si es lo que hace falta, los especialistas en aprendizaje automático saben que no encontrarán la solución perfecta en un libro de texto. En cambio, se enfrentarán a una maratón de prueba y error. Tener una gran intuición del tiempo que tardarán en probar cada nueva opción es una gran ventaja y es más valioso que un conocimiento profundo del funcionamiento de los algoritmos (aunque es bueno tener ambas). El rendimiento significa más que cumplir una métrica, también significa modelos fiables, escalables y fáciles de mantener que funcionan bien en producción. La excelencia en ingeniería es imprescindible. ¿El resultado? Un sistema que automatiza una tarea difícil lo suficientemente bien como para superar las estrictas pruebas de un estadístico y ofrecer el audaz desempeño que un líder empresarial exigía. ### Ancho contra profundo Lo que las dos funciones anteriores tienen en común es que ambas ofrecen soluciones exigentes a problemas específicos. Si no vale la pena resolver los problemas que abordan, acabará desperdiciando su tiempo y su dinero. Un lamento frecuente entre los líderes empresariales es: «Nuestro grupo de ciencia de datos es inútil». Y el problema normalmente reside en la falta de experiencia en análisis. Los estadísticos y los ingenieros de aprendizaje automático trabajan con poco (la forma de una madriguera de conejo, dicho sea de paso), por lo que es muy importante señalarles los problemas que merecen el esfuerzo. Si sus expertos resuelven con cuidado los problemas equivocados, su inversión en ciencia de datos tendrá una baja rentabilidad. Para asegurarse de que puede hacer un buen uso de los expertos limitados y profundos, tiene que asegurarse de que ya tiene el problema correcto o necesita un enfoque amplio y superficial para encontrarlo. ### Excelencia en análisis: velocidad Los mejores analistas son programadores veloces que pueden navegar rápidamente por vastos conjuntos de datos y encontrar y sacar a la luz posibles información más rápido de lo que otros especialistas pueden decir «pizarra». Su estilo de codificación semisaludado desconcierta a los ingenieros de software tradicionales, pero los deja en el polvo. La velocidad es su mayor virtud, seguida de cerca por la habilidad de identificar gemas potencialmente útiles. El dominio de la presentación visual de la información también ayuda: los gráficos hermosos y efectivos permiten a la mente extraer la información más rápido, lo que se traduce en tiempo para obtener información potencial. El resultado es que la empresa se pone el dedo en el pulso y pone la vista en incógnitas previamente desconocidas. Esto genera la inspiración que ayuda a los responsables de la toma de decisiones a seleccionar misiones valiosas para enviar a los estadísticos e ingenieros de aprendizaje automático, lo que les ahorra la impresionante excavación de inútiles madrigueras de conejos. ### ¿Tonterías descuidadas o una narración estelar? «Pero», objetan los estadísticos, «la mayoría de sus supuestas ideas no tienen sentido». Con eso quieren decir que los resultados de su exploración pueden reflejar solo ruido. Quizás, pero hay más en la historia. Los analistas cuentan historias de datos. Su misión es resumir los datos interesantes y utilizar los datos como fuente de inspiración. En algunas organizaciones, esos datos y esa inspiración se convierten en información para los responsables humanos de la toma de decisiones. Pero en las operaciones de datos más sofisticadas, la inspiración basada en los datos se marca para un seguimiento estadístico adecuado. Los buenos analistas respetan inquebrantablemente la única regla de oro de su profesión: no sacar conclusiones más allá de los datos (e impedir que su público también lo haga). Con este fin, una forma de encontrar a un buen analista es que utilice un lenguaje suavizado y de cobertura. Por ejemplo, no «llegamos a una conclusión» sino «nos inspira la duda». También desalientan el exceso de confianza de los líderes al hacer hincapié en una multitud de posibles interpretaciones para cada visión. Mientras los analistas se ciñan a los hechos (solo digan «Esto es lo que hay aquí».) y no se tomen a sí mismos demasiado en serio, el peor delito que podrían cometer es hacerle perder el tiempo a alguien si lo hace pasar por alto. Si bien se requieren habilidades estadísticas para poner a prueba las hipótesis, los analistas son su mejor opción para elaborar esas hipótesis en primer lugar. Por ejemplo, podrían decir algo como «Es solo una correlación, pero sospecho que podría estar impulsada por...» y luego explicar por qué piensan eso. Esto requiere una fuerte intuición sobre lo que podría estar sucediendo más allá de los datos y las habilidades de comunicación para transmitir las opciones al responsable de la toma de decisiones, quien normalmente toma las decisiones sobre qué hipótesis (de muchas) son lo suficientemente importantes como para justificar el esfuerzo de un estadístico. A medida que los analistas maduren, empezarán a acostumbrarse a juzgar lo que es importante además de lo interesante, lo que permitirá a los responsables de la toma de decisiones dejar el papel de intermediario. De las tres razas, los analistas son los herederos más probables del trono de la toma de decisiones. Como la experiencia en la materia contribuye en gran medida a detectar patrones interesantes en los datos con mayor rapidez, los mejores analistas se toman en serio la idea de familiarizarse con el dominio. No hacerlo es una señal de alerta. A medida que su curiosidad los lleve a desarrollar un sentido para el negocio, espere que su producción pase de ser una mezcla de falsas alarmas a un conjunto de ideas seleccionadas con sensatez que probablemente interesen a los responsables de la toma de decisiones. ### Análisis para la toma de decisiones Para evitar perder tiempo, los analistas deberían exponer la historia que tienen la tentación de contar y analizarla desde varios ángulos con investigaciones de seguimiento para ver si es válida antes de llevarla a los responsables de la toma de decisiones. El responsable de la toma de decisiones debería funcionar entonces como filtro entre el análisis de datos exploratorios y el rigor estadístico. Si alguien con la responsabilidad de tomar decisiones considera que la exploración del analista es prometedora para tomar una decisión, puede aprobar que un estadístico dedique tiempo a hacer un análisis más riguroso. (Este proceso indica por qué el simple hecho de decir a los analistas que mejoren en las estadísticas pierde el sentido de una manera importante. Las dos actividades no solo están separadas, sino que hay otra persona entre ellas, lo que significa que no es necesariamente más eficiente que una persona haga ambas cosas.) ### Análisis para el aprendizaje automático y la IA Los especialistas en aprendizaje automático someten un montón de posibles entradas de datos a través de algoritmos, modifican la configuración y siguen iterando hasta que se producen los resultados correctos. Si bien puede parecer que la analítica no tiene ninguna función en este caso, en la práctica una empresa suele tener demasiados ingredientes potenciales como para meterlos en la batidora de una vez. Una forma de filtrar un conjunto prometedor de entradas para probar es la experiencia en el dominio: pregunte a un humano con su opinión sobre cómo podrían funcionar las cosas. Otra forma es mediante la analítica. Para usar la analogía de la cocina, al ingeniero de aprendizaje automático se le da muy bien hacer pequeños retoques en la cocina, pero ahora mismo está de pie frente a un enorme y oscuro almacén lleno de posibles ingredientes. Podrían empezar a cogerlos al azar y arrastrarlos de vuelta a sus cocinas, o podrían enviar primero a un velocista armado con una linterna a través del almacén. Su analista es el velocista; su habilidad para ayudarlo a ver y resumir rápidamente lo que hay aquí es una superpotencia para su proceso. ### Los peligros de infravalorar a los analistas Un analista excelente no es una mala versión del ingeniero de aprendizaje automático; su estilo de codificación está optimizado para ser rápido, a propósito. Tampoco son malos estadísticos, ya que no se ocupan en absoluto de la incertidumbre, sino de los hechos. La función principal del analista es decir: «Esto es lo que contienen nuestros datos. No es mi trabajo hablar de lo que significa, pero quizás eso inspire al responsable de la toma de decisiones a tratar la cuestión con un estadístico». Si hace demasiado hincapié en la contratación y en la recompensa de las habilidades de aprendizaje automático y estadística, perderá a sus analistas. Entonces, ¿quién lo ayudará a determinar qué problemas vale la pena resolver? Se quedará con un grupo de pésimos expertos a los que se les sigue pidiendo que trabajen en proyectos inútiles o tareas de análisis a las que no se apuntaron. Sus datos estarán por ahí inútiles. En caso de duda, contrate analistas antes que a otras funciones. Los aprecio y recompénsalos. Anímelos a crecer hasta la cima de la carrera que elijan (y no la de otra persona). Del elenco de personajes mencionado en esta historia, los únicos que toda empresa necesita son los responsables de la toma de decisiones y los analistas. Los demás solo los podrá usar cuando sepa exactamente para qué los necesita. Comience con la analítica y siéntase orgulloso de su nueva habilidad de abrirle los ojos a la rica y hermosa información que tiene ante sí. La inspiración basada en los datos es algo poderoso.