La democratización de la ciencia de datos

La democratización de la ciencia de datos

Resumen.

A pesar de la explosión del interés por el big data, muchas organizaciones siguen relegando el conocimiento de la ciencia de datos a un pequeño número de empleados. Eso es un error, y a largo plazo, es insostenible. Muy pocas empresas esperan sólo escritores profesionales para saber escribir. Entonces, ¿por qué preguntar sólo científicos profesionales de datos para entender y analizar los datos, al menos a un nivel básico? Las empresas que desean competir en la era de los datos deben hacer tres cosas: compartir herramientas de datos, difundir habilidades de datos y difundir la responsabilidad de los datos.


¿Quieres atrapar a los tramposos fiscales? El gobierno de Ruanda lo hace, y los está encontrando estudiando anomalías en los datos de recolección de ingresos.

¿Quieres entender cómo está cambiando la cultura americana? También lo hace un sociólogo en ciernes en Indiana. Está usando la ciencia de datos para encontrar patrones en las cantidades masivas de texto que la gente usa cada día para expresar sus visiones del mundo, patrones que ningún lector individual podría reconocer.

Las personas inteligentes encuentran nuevos usos para la ciencia de datos todos los días. Sin embargo, a pesar de la explosión de interés en los datos recopilados por casi todos los sectores de las empresas estadounidenses —desde empresas financieras y empresas de salud hasta consultorías de gestión y el gobierno— muchas organizaciones continúan relegando el conocimiento de la ciencia de datos a un pequeño número de empleados.

Eso es un error, y a largo plazo, es insostenible. Piénsalo de esta manera: Muy pocas empresas esperan sólo escritores profesionales para saber escribir. Entonces, ¿por qué preguntar sólo científicos profesionales de datos para entender y analizar los datos, al menos a un nivel básico?

Relegar todo el conocimiento de datos a un puñado de personas dentro de una empresa es problemático en muchos niveles. Los científicos de datos encuentran frustrante porque es difícil para ellos comunicar sus hallazgos a colegas que carecen de conocimientos básicos sobre los datos. Las partes interesadas de la empresa no están satisfechos porque las solicitudes de datos tardan demasiado en cumplirlas y a menudo no responden a las preguntas originales. En algunos casos, eso se debe a que el interrogador no pudo explicar la pregunta correctamente al científico de datos.

¿Por qué los científicos que no son de datos necesitarían aprender ciencia de datos? Eso es como preguntar por qué se debe esperar que los no contables permanezcan dentro del presupuesto.

Hoy en día, cada industria está empapada de datos, y las organizaciones que tienen éxito son las que más rápidamente dan sentido a sus datos para adaptarse a lo que viene. La mejor manera de permitir un descubrimiento rápido y conocimientos más profundos es dispersar la experiencia en ciencia de datos en toda una organización.

Las empresas que desean competir en la era de los datos deben hacer tres cosas: compartir herramientas de datos, difundir habilidades de datos y difundir la responsabilidad de los datos.

Herramientas para compartir

La mayoría de las herramientas de datos se encuentran en el equipo de ciencia de datos. Si bien esto puede parecer lógico, crear un silo de herramientas de datos y restringir el acceso a un grupo reducido de empleados supone una carga demasiado pesada para esos empleados. La mayoría de las consultas de otros departamentos —ingeniería, finanzas, productos, marketing — son solicitudes relativamente simples que cualquier persona con formación básica podría satisfacer. Al ensillar a los científicos de datos con tareas básicas de control, las organizaciones desvían su atención de los proyectos más grandes que requieren su profunda experiencia.

Airbnb, un gran creyente en la democratización de la ciencia de datos, se esfuerza por capacitar a cada miembro del equipo para que tome decisiones basadas en datos. Para ello, la empresa creó su propia Universidad de Datos.

Las herramientas colaborativas también ayudan. En Airbnb, cualquiera puede publicar un artículo en un repositorio de conocimientos. El resto de la compañía ve nuevos análisis en un canal de noticias, haciéndoles saber (1) qué nuevo problema se acaba de resolver y (2) quién lo resolvió, para que cualquiera con más preguntas pueda saber a quién llamar. Además de ayudar a toda la empresa a ser más eficaz, estos artículos dan reconocimiento a las personas que los publican, lo que incentiva a otros a hacer lo mismo.

Compartir habilidades

Por supuesto, cuando comparte herramientas de datos, también debe permitir que las personas utilicen esas herramientas. No todas las empresas pueden crear su propia Universidad de Datos. Sin embargo, dependiendo de las herramientas de datos que utilice su organización, una variedad de programas educativos, tanto en línea como en persona, pueden poner al día su equipo. (Por supuesto, estoy sesgada: cofundé uno de ellos.)

A medida que su equipo obtenga la oportunidad de aprender esas habilidades, se sentirá más cómodo aportando datos para cada decisión importante. Se hará evidente que algunos miembros del equipo se sienten más cómodos usando las habilidades de datos que otros. Anime a los competentes a que menten a los demás. Incluso en nuestra empresa, donde la ciencia de datos es nuestro negocio, algunas personas no trabajan con datos todo el tiempo. Cuando necesitan ayuda en un problema nudoso, se emparejan con los que lo hacen.

Un equipo alfabetizado en datos hace mejores solicitudes. Incluso una comprensión básica de las herramientas y los recursos mejora enormemente la calidad de la interacción entre colegas. Cuando el «nivel de esfuerzo» —la cantidad de ida y vuelta necesaria para aclarar lo que se quiere — de cada solicitud baja, la velocidad y la calidad suben.

Las habilidades compartidas mejoran la cultura del lugar de trabajo y también dan resultados de otra manera: mejoran la comprensión mutua. Si sabe lo difícil que será obtener una salida de datos en particular, ajustará la forma en que interactúa con las personas encargadas de darle esa salida. Tales ajustes mejoran el lugar de trabajo para todos.

Compartir la responsabilidad

Una vez que una organización está proporcionando el acceso y la educación necesarias para democratizar los datos entre sus empleados, puede ser el momento de ajustar roles y responsabilidades. Como mínimo, los equipos deben poder acceder y comprender los conjuntos de datos más relevantes para sus propias funciones. Sin embargo, al equipar a más miembros del equipo con habilidades básicas de codificación, las organizaciones también pueden esperar que los equipos de ciencia de datos no apliquen este conocimiento a la resolución de problemas departamentales, lo que conduce a resultados mucho mejores.

Si su personal está alfabetizado en datos, por ejemplo, su equipo de datos centralizado puede cambiar su enfoque de «hacer el trabajo de datos de todos los demás» a «crear herramientas que permitan a todos hacer su trabajo de datos más rápido». Nuestro propio equipo de datos no realiza análisis todos los días. En su lugar, crea nuevas herramientas que todo el mundo puede usar para que 50 proyectos puedan avanzar tan rápido como un proyecto se movió antes.

La ciencia de datos ya no es sólo para científicos de datos, si alguna vez lo fue. Hoy en día, las empresas inteligentes se aseguran de que muchos de sus empleados puedan hablar el idioma de los datos y utilizarlos para mejorar los resultados laborales. Al capacitar a los empleados con estas habilidades fundamentales, las empresas están logrando enormes niveles de innovación y eficiencia.

Escrito por Jonathan Cornelissen