¿Están los datos de su empresa preparados para la IA generativa?
por Thomas H. Davenport, Priyanka Tiwari

Muchas organizaciones están entusiasmadas con la IA generativa y se están movilizando para aprovecharla. Los consejos de administración están organizando talleres educativos y animando a sus empresas a actuar. Los equipos de alta dirección están pensando en qué casos de uso desarrollar. Las personas y los departamentos están experimentando con la forma en que la tecnología puede aumentar su productividad y eficacia.
Sin embargo, el trabajo que realmente importa para el éxito de la IA generativa recae en los directores de datos (CDO), los ingenieros de datos y los curadores del conocimiento. Y lamentablemente, muchos ni siquiera han empezado a hacer el trabajo necesario. UN encuesta en la segunda mitad de 2023, de 334 CDO y líderes de datos en las organizaciones (patrocinados por Amazon Web Services y el simposio sobre directores de datos y calidad de la información del MIT), y una serie de entrevistas con estos ejecutivos, descubrieron que, si bien están entusiasmados con la IA generativa como todos los demás, tienen mucho trabajo por hacer para prepararse para ella. En cuanto a la preparación de los datos, en particular, las empresas aún no han creado nuevas estrategias de datos ni han empezado a gestionar sus datos de la manera necesaria para que la IA generativa funcione para ellas. Describiremos los resultados de la encuesta y lo que sugieren para los próximos pasos con los datos.
Emoción, pero aún poco valor de la IA generativa
2023 fue el año en que muchas organizaciones descubrieron la IA y se maravillaron de su potencial. En cuanto a lo que puede hacer, la IA ha trabajado históricamente con datos estructurados, normalmente números en filas y columnas. Pero la IA generativa utilizó datos no estructurados (texto, imágenes e incluso vídeo) para generar formas nuevas o recombinadas de datos no estructurados. Proporcionó asistencia y competencia para humanos creadores de contenido. Los líderes de CDO y datos compartieron su entusiasmo por la tecnología: el 80% estuvo de acuerdo en que, con el tiempo, transformaría el entorno empresarial de su organización y el 62% dijo que sus organizaciones tenían previsto aumentar el gasto en IA generativa. La tecnología también ha llamado mucho la atención sobre sus funciones; un CDO dijo en una entrevista que GenAI la había convertido en «la reina del baile».
Sin embargo, los encuestados indicaron que la mayoría aún no obtiene un valor económico sustancial de su uso de GenAI. Cuando se le preguntó cómo abordaban sus organizaciones la IA generativa, casi un tercio dijo que estaba «experimentando a nivel individual», en lugar de crear casos de uso para la empresa. Un 21% adicional indicó que estaban experimentando, pero con las normas de uso para los empleados. Un porcentaje un poco menor, el 19%, estaba experimentando a nivel de departamento o unidad de negocio. Lo que es más importante, solo el 6% tenía una aplicación de IA generativa en producción. Un sorprendente 16% señaló que sus organizaciones habían prohibido su uso por parte de los empleados, aunque ese enfoque parece ir disminuyendo con el tiempo, a medida que las empresas gestionan los problemas de privacidad de los datos con las versiones empresariales de los modelos de IA generativa.
Si una empresa tiene la intención de experimentar con GenAI, debería ser en los aspectos fundamentales del negocio. Una empresa que está experimentando agresivamente con la IA generativa para la I+D es Universal Music. El gran interés de la empresa por la tecnología no es sorprendente, ya que la IA generativa puede crear música, escribir letras e imitar las voces de los artistas. Universal está explorando cómo se puede utilizar la IA generativa en la música y en los vídeos orientados a la música de manera que proteja la derechos de propiedad intelectual de artistas. Tiene otro experimento en marcha para crear versiones con IA de canciones con las voces de los artistas de Universal (con su permiso y participación). También ha emprendido acciones legales contra un proveedor de IA para proteger los derechos de autor de sus artistas.
Las políticas y las pruebas de concepto pueden ser útiles, pero no generan valor económico. Para que la IA generativa sea realmente valiosa para las empresas, tienen que personalizar el idioma o los modelos de imagen de los proveedores con sus propios datos, y hacer el trabajo interno para preparar sus datos para esa integración.
Preparando los datos
Los datos relativamente desestructurados que utiliza la IA generativa tienen que estar bien seleccionados para garantizar su precisión, actualidad, singularidad y otros atributos si los modelos de IA generativa que los emplean quieren ser de gran utilidad. Los datos internos de mala calidad producirán respuestas de mala calidad a partir de los modelos GenAI.
Muchos líderes de datos de nuestra encuesta se hicieron eco de este desafío: el 46% identificó la «calidad de los datos» como el mayor desafío para aprovechar el potencial de GenAI en sus organizaciones. Jeff McMillan, director de datos, análisis e innovación de Morgan Stanley Wealth Management, uno de los primeros en adoptar GenAI, describió algunos de los problemas involucrados:
Llevamos unos cinco años comisariando nuestros conocimientos basados en documentos. No fue porque hubiéramos anticipado la GenAI, sino porque la gente no estaba satisfecha con el nivel de calidad del contenido actual de nuestra intranet. Así que, al arreglar esto, sin darnos cuenta estábamos preparados para la GenAI.
Cada contenido de la investigación tiene que ser revisado por una persona registrada en materia de cumplimiento, por lo que sabemos que el contenido de la formación es de muy alta calidad. Incluso en el contenido que no es de investigación, tenemos un equipo que puntúa las presentaciones individuales en función de temas como los requisitos de etiquetado, los enlaces rotos, la presencia de un resumen por adelantado y damos una calificación a cada documento. También tuvimos que dedicar mucho tiempo a pensar en diferentes conjuntos de contenido y a optimizar los resultados… Estos grandes modelos lingüísticos no resuelven el problema de las fuentes de datos dispares. Las empresas tienen que abordar la integración y el dominio de los datos antes de intentar acceder a los datos con la IA generativa.
Sin embargo, la mayoría de los líderes de datos no han empezado a realizar los cambios necesarios en sus estrategias de datos. Si bien el 93% de los encuestados estuvieron de acuerdo en que la estrategia de datos es fundamental para obtener valor de la IA de la generación, el 57% dijo que hasta ahora no había realizado ningún cambio en los datos de su organización. Solo el 37% está de acuerdo —y solo el 11% está totalmente de acuerdo— en que sus organizaciones tienen la base de datos adecuada para la generación de IA. En otras palabras, la mayoría de las organizaciones tienen mucho trabajo por hacer para aplicar GenAI ampliamente en sus negocios.
Los líderes de datos que han empezado a hacer cambios se han centrado en unas cuantas tareas específicas. Una cuarta parte de las organizaciones está llevando a cabo la integración de datos o la limpieza de conjuntos de datos. El dieciocho por ciento de ellos son datos de encuestas que podrían respaldar el uso de GenAI. Y el 17% está seleccionando documentos o textos para prepararlos para los modelos GenAI de un dominio específico. Walid Mehanna, director de datos e IA del grupo Merck, por ejemplo, hizo hincapié en la importancia de varios tipos de preparación de datos:
Si queremos crear IA, tenemos que construirla sobre concreto, no sobre arenas movedizas. Estamos poniendo el proceso y el suministro de datos en buen estado. Estamos trabajando en un inventario y un catálogo de datos, una estructura de datos con una nueva estructura de datos y una capa de metadatos, canalizaciones de datos y una generación de información de autoservicio ad hoc. Creemos que la IA generativa será una forma clave de crear información a partir de los datos en el futuro.
Raj Nimmagadda, director de datos de I+D de Sanofi, también dijo que la empresa está preparando sus datos para GenAI y nos dijo que el éxito de GenAI «depende de datos de alta calidad y «preparados para la empresa», que se guíen por una base de datos, una gobernanza de datos y unos estándares sólidos». Sanofi, dijo, invierte actualmente en desarrollar estas capacidades principales en toda su I+D.
Como ocurre con la transformación de datos en general, para la mayoría de las organizaciones será un esfuerzo enorme conservar, limpiar e integrar todos los datos no estructurados para usarlos en las aplicaciones de GenAI. Por lo tanto, la mayoría de las empresas deberían centrarse en dominios de datos concretos en los que esperan implementar GenAI en un futuro próximo. Puede que las empresas tengan más tiempo para usar GenAI de lo que muchos esperaban, y es probable que tengan una larga fila que esperar antes de poder crear valor.
En la encuesta, las áreas de negocio más comunes en las que los líderes de datos daban prioridad al desarrollo de GenAI eran (por orden) las operaciones con los clientes, como la atención al cliente o los chatbots, la ingeniería de software y la generación de código, las actividades de marketing y ventas, como campañas de marketing u ofertas de venta personalizadas, y el diseño y desarrollo de productos e I+D. Muchas organizaciones también estaban buscando aplicaciones generales de productividad personal de GenAI, pero no es probable que se refieran a un dominio de datos específico.
¿Un motivo válido para esperar?
Si bien creemos que los líderes de datos deberían aumentar el ritmo de preparación de sus datos para la generación de IA, también reconocemos que hay otros proyectos de datos importantes, como mejorar los datos de las transacciones y hacer que los datos estén disponibles para las aplicaciones tradicionales de análisis y aprendizaje automático. De hecho, quizás una de las razones del ritmo un tanto lento sea que el 71% de los CDO estuvieron de acuerdo en que «la IA generativa es interesante, pero nos centramos más en otras iniciativas de datos para ofrecer un valor más tangible».
Dado el nivel de entusiasmo por la IA generativa, el resultado de esta encuesta es un tanto sorprendente. En la encuesta de 2022 descubrimos que los CDO están siendo presionados para ofrecer valor rápidamente, pero también están bajo presión para facilitar la implementación de GenAI. Sospechamos que están pasando un poco despacio de gestionar y mejorar los datos estructurados al contenido no estructurado. Además, se discute quién lidera la IA generativa en sus empresas; los CDO compiten con los CIO, los CTO y los directores digitales por el liderazgo de la nueva tecnología de moda.
Pero si GenAI va a transformar la organización, no tiene sentido esperar para empezar a preparar los datos. Nosotros —y la mayoría de los encuestados— estamos de acuerdo en que GenAI es una capacidad transformadora. La tarea de preparar los datos importantes de una gran organización para la IA podría llevar fácilmente varios años. Ahora es el momento de empezar.
Artículos Relacionados

La IA es genial en las tareas rutinarias. He aquí por qué los consejos de administración deberían resistirse a utilizarla.

Investigación: Cuando el esfuerzo adicional le hace empeorar en su trabajo
A todos nos ha pasado: después de intentar proactivamente agilizar un proceso en el trabajo, se siente mentalmente agotado y menos capaz de realizar bien otras tareas. Pero, ¿tomar la iniciativa para mejorar las tareas de su trabajo le hizo realmente peor en otras actividades al final del día? Un nuevo estudio de trabajadores franceses ha encontrado pruebas contundentes de que cuanto más intentan los trabajadores mejorar las tareas, peor es su rendimiento mental a la hora de cerrar. Esto tiene implicaciones sobre cómo las empresas pueden apoyar mejor a sus equipos para que tengan lo que necesitan para ser proactivos sin fatigarse mentalmente.

En tiempos inciertos, hágase estas preguntas antes de tomar una decisión
En medio de la inestabilidad geopolítica, las conmociones climáticas, la disrupción de la IA, etc., los líderes de hoy en día no navegan por las crisis ocasionales, sino que operan en un estado de perma-crisis.