PathMBA Vault

Gestión del talento humano

Qué separa a un buen científico de datos de uno excelente

por Thomas C. Redman

Las empresas que desean aprovechar al máximo sus datos deben crear una base sólida, nueva y diferente capacidades organizativas. Hay mucho que hacer y los científicos de datos están al frente y al centro. Los buenos son poco frecuentes. Y lo que es más importante, la diferencia entre uno bueno y uno bueno es como la diferencia entre un rayo y una luciérnaga.

Una buena puede ayudarlo a encontrar relaciones entre enormes cantidades de datos dispares, a menudo información importante que no habría obtenido de ninguna otra manera. Los grandes científicos de datos, por otro lado, desarrollan nuevos conocimientos sobre el mundo en general. No cabe duda de que utilizan los datos para desarrollar esa información, pero ese no es el punto.

A lo largo de los años, he tenido el privilegio de trabajar con docenas, quizás cientos, de buenos estadísticos, analistas y científicos de datos. Y algunos geniales. Los grandes científicos de datos aportan cuatro rasgos que se refuerzan mutuamente y que ni siquiera los buenos pueden soportar.

1. Una sensación de asombro. Recientemente, muchos han señalado que la curiosidad es el rasgo número uno de un científico de datos. No hace falta decirlo. Los buenos científicos de datos deben ser curiosos, igual que debe serlo un científico de cualquier disciplina.

Pero los grandes llevan este rasgo al extremo. Tienen un sentido de asombro por el mundo y son más felices cuando descubren cómo funciona algo o por qué funciona de esa manera. Buscan esas explicaciones en los datos y en cualquier otra cosa que pueda ayudar. Por ejemplo, los grandes científicos de datos están interesados en muchas cosas y desarrollan redes de personas con perspectivas diferentes a las suyas. Tanto mejor para explorar el mundo, y una masa de datos dispares, ¡desde muchos ángulos!

2. Un cierto don cuantitativo. Los grandes científicos de datos simplemente ven cosas que otros no ven. Por ejemplo, resulta que hablé con un becario de verano (que ahora utiliza su destreza analítica como director de una empresa de medios) en su segundo día en un banco de inversiones. Su jefe le había dado un montón de cosas para leer y, al escanearlas, descubrió un error en el cálculo de las devoluciones. Tardó alrededor de una hora en comprobar el error y determinar la corrección.

Lo importante aquí es que miles de personas más no hayan visto el error. Era obvio para él, pero no para nadie más. Y era un banco de inversiones de primer nivel. Presumiblemente, al menos algunos buenos analistas leyeron el mismo material y no lo vieron.

Las matemáticas se han convertido en un lenguaje práctico e increíblemente eficaz (Einstein usó la frase «irrazonablemente eficaz») para describir el mundo real. El gran científico de datos utiliza ese lenguaje de forma intuitiva y sencilla de formas que ni siquiera los buenos científicos de datos pueden.

3. Persistencia. Los grandes científicos de datos son persistentes y en muchos sentidos. El becario de la viñeta de arriba hizo su descubrimiento de un vistazo y lo confirmó en una hora. Rara vez funciona de esa manera. Creo que fue Jeff Hooper, que entonces trabajaba en los grandes Laboratorios Bell, quien señaló que «los datos no revelan sus secretos fácilmente. Deben ser torturados para que confiesen».

Esto es muy importante. Incluso en las mejores circunstancias, demasiados datos son mal definido y simplemente incorrecto, y la mayoría resultan irrelevantes para el problema en cuestión. Analizar estos ruidosos datos es un trabajo arduo y frustrante. Incluso los buenos científicos de datos pueden pasar al siguiente problema. Los grandes científicos de datos se quedan con ello.

Los grandes científicos de datos también persisten en hacerse oír. Lidiar con una burocracia recalcitrante puede resultar incluso más frustrante que tratar con datos ruidosos. Continuando con la viñeta de arriba, le dije al becario que le esperaba un verano largo. Es casi seguro que se lo dedicaría a defender su descubrimiento. El grupo que cometiera el error se sentiría muy ofendido e incluso podría atacarlo personalmente. Otros reaccionarían con alegría al celebrar la ignorancia de sus compañeros. Y quedaría atrapado en el medio.

4. Por último, las habilidades técnicas. La capacidad de acceder y analizar los datos con los métodos más nuevos es obviamente importante. Pero me preocupan menos que la capacidad de aplicar el rigor estadístico. A riesgo de simplificar demasiado, hay dos tipos de análisis: descriptivos y predictivos. Los análisis descriptivos ya son bastante difíciles. Pero los análisis realmente rentables implican la predicción, que es intrínsecamente incierta.

Los grandes científicos de datos aceptan la incertidumbre. Reconocen cuando una predicción se basa en bases sólidas y cuando no es más que una ilusión. Son simplemente excelentes a la hora de describir lo que tiene que ir bien para que la predicción se mantenga; esto es lo que realmente lo estropeará; y estas son las incógnitas que me mantendrán despierto por la noche. A menudo pueden cuantificar la incertidumbre y son buenos para sugerir experimentos sencillos para confirmar o negar las suposiciones, reducir la incertidumbre, explorar la siguiente serie de preguntas, etc.

Para que quede claro, esta habilidad no es «esa habilidad cuantitativa». Es una potencia inferencial entrenada, sofisticada y disciplinada, que se practica y perfecciona tanto con el éxito como con el fracaso.

Los grandes científicos de datos son realmente especiales. Son los Derek Jeters, los Michael Jordan, los Mikhail Barishnikov y los Julia Roberts del espacio de datos. Si se toma en serio el big data y la analítica avanzada, necesita encontrar uno o dos, crear en torno a él o ella y crear un entorno que les ayude a hacer lo suyo.