Cómo decidir qué proyectos de ciencia de datos perseguir
Así es como la mayoría de las empresas deciden qué proyectos de datos llevar a cabo: la gerencia identifica un conjunto de proyectos que le gustaría que se construyeran y crea el omnipresente diagrama de dispersión de priorización. Un eje representa el valor de un proyecto determinado para la empresa y el otro eje representa su complejidad o coste de desarrollo estimados. La dirección destina los recursos limitados de la empresa a los proyectos que cree que costarán menos y que tendrán un mayor valor empresarial. No está mal, pero es una receta para una estrategia de datos mediocre. Una estrategia de datos excelente, por el contrario, comienza con una inversión en tecnología centralizada y una buena selección y coordinación valores predeterminados para la arquitectura de las aplicaciones de datos. Es específico a corto plazo y flexible a largo plazo. Además, una estrategia de datos excelente tiene en cuenta el hecho de que los proyectos de ciencia de datos no son independientes el uno del otro. Con cada proyecto completado, exitoso o no, se crea una base para construir proyectos posteriores con mayor facilidad y a un coste menor.
••• En 2018, todas las organizaciones tienen una estrategia de datos. Pero, ¿qué hace que uno sea bueno? Todos sabemos lo que es el fracaso. Los recursos se invierten, se forman equipos, pasa el tiempo, pero no sale nada. Nadie puede decir necesariamente por qué; siempre es culpa de otra persona. Es más difícil diferenciar entre un éxito modesto y una excelencia. De hecho, en la ciencia de datos pueden tener un aspecto muy parecido durante quizás un año. Sin embargo, después de varios años, una estrategia excelente arrojará resultados órdenes de magnitud más valiosos. Tanto las estrategias mediocres como las excelentes comienzan con una serie de experimentos e inversiones que conducen a proyectos de datos. Después de unos años, algunos de estos proyectos funcionan y están en camino de ser producidos. En una estrategia mediocre, uno o dos de estos proyectos pueden incluso tener un ROI claro para la empresa. Por lo general, estos proyectos consistirán en algún tipo de automatización para ahorrar costes o en aplicar el aprendizaje automático a un proceso existente para mejorar su eficiencia o rendimiento. Esto se parece mucho al éxito y puede que sea suficiente, pero se está perdiendo las ventajas únicas de una estrategia de datos excelente. En una estrategia excelente, se han llevado a cabo más proyectos de datos y su desarrollo ha sido sorprendentemente rentable. Además, el proceso de creación de los primeros proyectos inspira _nuevo_ ideas de proyectos. Siguiendo una estrategia excelente, los proyectos incluirán mejoras en la automatización y la eficiencia y el rendimiento, pero también incluirán proyectos e ideas para la generación de nuevos ingresos y negocios completamente nuevos impulsados por sus activos de datos únicos. Los equipos de datos trabajan bien juntos, se basan en el trabajo de los demás y colaboran sin problemas con sus socios comerciales. Hay una visión clara de cómo puede ser el futuro de la empresa, impulsado por el aprendizaje automático, y todos trabajan juntos para lograrlo. **Crear una estrategia de datos excelente** La elaboración de una estrategia de datos requiere la participación de muchas partes, incluidos expertos en datos, líderes tecnológicos y expertos en negocios y en la materia. También requiere el apoyo de los líderes que va más allá de querer marcar una casilla de «aprendizaje automático». Así es como la mayoría de las empresas deciden qué proyectos de datos llevar a cabo, lo que por sí solo es una receta para una estrategia de datos mediocre. La dirección identifica un conjunto de proyectos que le gustaría construir y crea el omnipresente diagrama de dispersión de priorización: un eje representa el valor de un proyecto determinado para la empresa y el otro eje representa su complejidad o coste de desarrollo estimados. A cada proyecto se le asigna un puesto en la lista y la dirección destina los recursos limitados de la empresa a los proyectos que, en su opinión, costarán menos y tendrán un mayor valor empresarial. Esto no está mal, pero tampoco es óptimo. Una estrategia de datos excelente va más allá de una evaluación sencilla de cada proyecto de forma aislada y tiene en cuenta algunas dimensiones adicionales. En primer lugar, una estrategia de datos excelente incluye un núcleo organizativo bien coordinado. Se basa en una inversión en tecnología centralizada y está bien seleccionada y coordinada _valores predeterminados_ para la arquitectura de las aplicaciones de datos. Esta centralización de los valores predeterminados permite que cada aplicación tome decisiones diferentes _si es necesario_ manteniendo la máxima compatibilidad en toda la organización y la flexibilidad a lo largo del tiempo de forma predeterminada. Por ejemplo, una empresa de medios global con la que trabajaba creció drásticamente gracias a las adquisiciones. Cada línea de negocio tenía un conjunto tecnológico diferente y un grupo de TI independiente, lo que implicaba desafíos para integrar los datos que ya existían y diferentes arquitecturas para todas las inversiones futuras. Centralizar esta práctica fue la clave de su éxito continuo. En segundo lugar, una estrategia de datos excelente es específica a corto plazo y flexible a largo plazo. Sabemos bastante sobre las capacidades de aprendizaje automático del mañana, pero menos sobre las capacidades del año que viene. Solo podemos adivinar lo que será posible dentro de cinco años. Del mismo modo, el panorama empresarial se está transformando y genera nuevos competidores y nuevas oportunidades. Las organizaciones que participan en ciclos de planificación quinquenales perderán las oportunidades que se presenten mientras tanto. Una estrategia excelente es aquella que se puede adaptar y se considera un documento vivo. Las mejores estrategias son firmes en la convicción direccional, pero flexibles en los detalles. Quiere saber dónde quiere acabar, pero no necesariamente predefinir cada paso que debe dar para llegar allí. Por último, una estrategia de datos excelente tiene en cuenta una información clave: los proyectos de ciencia de datos _no son independientes el uno del otro_. Con cada proyecto completado, exitoso o no, se crea una base para construir proyectos posteriores con mayor facilidad y a un coste menor. **Elegir entre proyectos de ciencia de datos** Así es como se ve la selección de proyectos en una empresa con una estrategia de datos excelente: en primer lugar, la empresa recopila ideas. Este esfuerzo debe difundirse lo más ampliamente posible en toda la organización, en todos los niveles. Si solo ve ideas buenas y obvias en su lista, preocúpese, es una señal de que se está perdiendo el pensamiento creativo. Cuando tenga una lista grande, filtre por la plausibilidad técnica de la idea. A continuación, cree el diagrama de dispersión descrito anteriormente, en el que se evalúe cada proyecto en función de su coste o complejidad relativos y su valor para la empresa. Ahora se pone interesante. En su diagrama de dispersión, dibuje líneas entre proyectos potencialmente relacionados. Estas conexiones existen cuando los proyectos comparten recursos de datos; o cuando un proyecto puede permitir la recopilación de datos útiles para otro proyecto; o cuando el trabajo fundamental en un proyecto también es el trabajo fundamental en otro. Este enfoque reconoce la realidad de trabajar en proyectos de este tipo, como el hecho de que crear un proyecto precursor hace que los proyectos sucesores sean más rápidos y fáciles (incluso si el precursor fracasa). Los costes de recopilar datos y crear componentes compartidos se amortizan en todos los proyectos. Este enfoque hace que los proyectos de mayor valor —aquellos que quizás hubieran parecido demasiado ambiciosos— se parezcan menos a un impulso agresivo y caro. En cambio, revela que estos proyectos pueden ser más eficientes y seguros de llevar a cabo que otros proyectos de menor valor que parecían atractivos en un análisis ingenuo. Dicho de otra manera, una estrategia de datos excelente reconoce que los proyectos se benefician unos de otros y que los costes de los proyectos cambian con el tiempo a la luz de otros proyectos emprendidos (y también de las nuevas tecnologías). Esto permite una planificación más precisa y podría ampliar las capacidades de la organización más de lo esperado. Puede revisar este proceso de planificación trimestralmente, que está en línea con la rapidez con la que cambian las tecnologías de aprendizaje automático. Actualmente estamos en un momento de desarrollo del aprendizaje automático, la IA y los datos en el que la tecnología no está mercantilizada y no es del todo obvio dónde invertir. Las empresas con estrategias de datos excelentes tendrán más probabilidades de elegir bien.