Descomponiendo los silos de datos
Análisis predictivo, ciencia de datos, inteligencia artificial, bots. Las oleadas de avances en la aplicación de datos siguen llegando. No se puede leer las páginas de los medios de comunicación convencionales o empresariales sin sentirse impresionado por la oportunidad. Sin embargo, aunque el poder de la analítica es moneda común, es se habla mucho más a menudo de lo que se practica. El mayor obstáculo para utilizar el análisis avanzado de datos no es la base de habilidades o la tecnología; es el acceso antiguo a los datos.
Cada CIO que encuentro me dice que están entusiasmados con el potencial de la analítica para su negocio. Con una advertencia: no pueden poner sus manos en los datos en primer lugar. Adoptar los datos como una ventaja competitiva es una necesidad para el negocio actual, así que ¿por qué es tan difícil tener acceso a los datos que necesitamos?
El uso de datos tiene un costo. Detrás del glamour de los poderosos conocimientos analíticos hay un retraso en la tediosa preparación de datos. Desde la aparición popular de la ciencia de datos como campo, sus profesionales han afirmado que el 80% del trabajo involucrado es adquisición y preparación de datos. A pesar de los esfuerzos de los proveedores de software para crear herramientas de autoservicio para la preparación de datos, es probable que esta proporción de trabajo permanezca igual en un futuro previsible, por un par de razones.
En primer lugar, no puede separar limpiamente los datos de su uso previsto. Dependiendo de la aplicación deseada, debe formatear, filtrar y manipular los datos en consecuencia. Cada nuevo problema tiene sus aspectos únicos que suelen retornar a la adquisición y preparación de datos. En segundo lugar, los datos confieren conocimientos y ventajas. Una vez que haya cosechado la fruta de bajo colgamiento (los datos fáciles de preparar), entonces se está quedando atrás si no está buscando el siguiente nivel de conocimiento. Así que debes buscar los datos que son más difíciles de encontrar y usar, conduciendo la cantidad de tiempo dedicado a la preparación.
Pero hay un demonio más grande y costoso que acecha en las empresas. Un demonio que puede subir ese 80% y, a menudo, hace que las iniciativas sean imposibles: silos de datos. Estos silos son islas aisladas de datos, y hacen que sea prohibitivamente costoso extraer datos y ponerlos a otros usos. Pueden surgir por múltiples razones.
Estructural. Las aplicaciones de software se escriben en un momento determinado, para un grupo particular de la empresa. En un mundo de recursos limitados, las aplicaciones están optimizadas para su función principal. Es poco probable que los incentivos de los equipos individuales alienten el intercambio de datos como requisito primordial. Este enfoque en la función, por ejemplo, puede dar lugar a que las ventas recientes se almacenen en sistemas diferentes de las ventas históricas, lo que supone una barrera inmediata para impulsar las ventas a través de recomendaciones personales de productos.
Político. El conocimiento es poder, y los grupos dentro de una organización se vuelven sospechosos de que otros quieran usar sus datos. Y a menudo con alguna justificación, ya que el margen para el uso indebido, incluso accidental, es amplio. Los datos no son una entidad neutral; debe interpretarlos con conocimiento de su historia y contexto. Este sentido de propiedad puede actuar en contra de los intereses de la organización en su conjunto.
Crecimiento. Cualquier empresa de larga vida ha crecido a través de múltiples generaciones de líderes, filosofías y adquisiciones, lo que resulta en múltiples sistemas incompatibles. Aunque no haya problemas políticos en la integración de datos, es costoso conciliar e integrar conjuntos de datos que incorporan diferentes enfoques a conceptos empresariales importantes.
Lock-in del proveedor. Los proveedores de software se encuentran entre los primeros en saber que el acceso a los datos es potente, y sus estrategias pueden frustrar el deseo de los usuarios de exportar los datos contenidos en las aplicaciones. Esto es particularmente peligroso con las aplicaciones de software como servicio, donde el proveedor quiere mantenerlo dentro de su plataforma en la nube. Los proveedores también han trabajado duro para crear funciones de trabajo completas y trayectorias profesionales centradas en su software. Cualquier indicio de movimiento de ese mundo podría amenazar el sustento de un profesional de software capacitado y certificado.
El uso de datos cuesta dinero. Para pasar a los usos de mayor valor y mantener una ventaja competitiva, necesitamos reducir el impacto de los silos de datos en nuestros negocios. Para eliminar las barreras de los silos, un enfoque progresivo y pragmático es más efectivo. El objetivo final de adoptar el análisis avanzado de datos es crear una empresa basada en datos, es decir, beneficiarse de los datos de una manera consistente y en toda la organización. Desafortunadamente, pocos tienen el lujo de construir una infraestructura adecuada desde cero, por lo que las empresas deben encontrar una manera de llegar allí de manera gradual.
No se deje deslumbrar por la atracción de otra palabra de moda favorita de la industria, el» lago de datos.» Las cosas no son tan bellamente simples como la imagen de aguas claras y manantiales de montaña podría conjurar. No podemos simplemente verter todos nuestros datos en un solo sistema, esperando que la bondad resulte. Su negocio es único, y no puede comprar una ventaja única de la estantería. Se requiere cuidado, planificación e inversión. De lo contrario, es seguro que terminará con un pantano de datos, hirviendo con responsabilidad, confusión y bits podridos.
En su lugar, busque identificar oportunidades de alto valor. Analice las necesidades de su negocio y elija un problema en el que los datos puedan proporcionar un beneficio tangible, tal vez al mejorar las ventas o la respuesta a incidentes preventivos. Dibuje los datos de toda la organización e invierta primero en estos casos de uso. Esto no es una prueba de concepto, debe hacerlo antes como una forma de identificar oportunidades, sino un proyecto de banner que puede impulsar inversiones posteriores. Ate la integración a su aplicación, para que obtenga valor temprano.
Luego, muévete con el objetivo de la integración en mente. Cada paso progresivo debería desarrollarse también hacia una plataforma integrada para los datos de su empresa. No desea volver a crear un conjunto completamente nuevo de silos, aunque con capacidades avanzadas.
Para hacer esto, necesitarás el apoyo del más alto nivel. La naturaleza interorganizacional de la integración de datos significa que, a menos que esté trabajando con el apoyo del liderazgo ejecutivo y líderes de todo el negocio y de IT, se sentirá frustrado. A medida que avanza en el uso de datos en aplicaciones operacionales y estratégicas, los cambios organizativos serán inevitables.
En la economía digitalizada actual, la capacidad de utilizar datos representa una ventaja competitiva real y esencial. Para llegar a un estado futuro de competencia analítica madura, hay un trabajo real que hacer en la integración de los datos que ya tiene. Este es un objetivo estratégico para toda la empresa y, cuando se aborda correctamente, le llevará a desarrollar experiencia y una infraestructura de datos que desbloquea cada paso siguiente.
Por supuesto, si fuera fácil, no sería importante. Del mismo modo que el 80% del trabajo en cualquier análisis de datos es preparación de datos, espera que el 80% del trabajo para convertirse en un sistema basado en datos integre sus datos y esté disponible para satisfacer las necesidades de su empresa en su conjunto.
— Escrito por Edd Wilder-James