Para pasar del Big Data al Big Insight, comience con una imagen
por Sinan Aral. Visualization by Nikolaos Hanselmann
Aunque la visualización de datos ha producido algunas de las exhibiciones artísticas más cautivadoras de los últimos tiempos, algunas de las cuales se han presentado en exposiciones en el Museo de Arte Moderno de Nueva York y en innumerables instalaciones de arte de todo el mundo, los líderes empresariales se preguntan: ¿es procesable la visualización de datos?
Creo que sí. En mi papel de becario residente en El New York Times Laboratorio de I+D, colaboro con uno de los equipos de I+D digital más avanzados del mundo para averiguar cómo podemos extraer información útil a partir de los macrodatos.
¿Qué tamaño? Masivo: estamos documentando todos los tuits, retuits y clics de cada URL abreviada de Twitter y Facebook que apuntan a New York Times contenido y, luego, combinarlo con los registros de navegación de lo que hacen esos usuarios cuando llegan al Veces. Este proyecto es pariente del conocido proyecto Cascade. Piense en ello como Cascade 2.0.
Lo hacemos para entender y predecir cuándo una cascada o conversación en línea provocará una oleada de consumo de contenido en el Veces y también cuándo no lo hará. Lo que es más importante, nos interesa cómo la conversación boca a boca impulsa el número de lectores, las suscripciones y los ingresos por publicidad; cómo Veces puede mejorar su propia participación en la conversación para impulsar la participación; cómo podemos identificar a los lectores realmente influyentes que a su vez impulsan la participación; y cómo Veces puede entonces atraer a estos usuarios influyentes de una manera que complemente las propias necesidades e intereses de los usuarios. Hágalo y convertiremos ese análisis estadístico, como verá más abajo, en flujos de datos elegantes y artísticos en tiempo real.
Gestionar las transmisiones, archivar las sesiones y almacenar y manipular la información son en sí mismas tareas hercúleas. Pero el desafío aún mayor es transformar los hermosos macrodatos en conocimientos útiles, significativos y relevantes para la toma de decisiones. Hemos descubierto que la visualización es una de las guías más importantes en esta búsqueda de conocimiento, esencial para entender dónde debemos buscar y qué debemos buscar en nuestros análisis estadísticos.
Por ejemplo, estas son tres visualizaciones que nos han ayudado a adquirir conocimientos. Muestran cascadas de tuits y retuits en forma de líneas y puntos, aproximadamente tres tipos diferentes Veces artículos a lo largo del tiempo, combinado con el volumen de clics de cada artículo sincronizado en el tiempo y mostrado como un gráfico negro debajo de cada cascada. Cada panel cuenta una historia diferente sobre la interacción con el contenido.
Para el primer artículo, hay una conversación considerable en Twitter y varios picos importantes de tráfico. Pero el volumen de clics parece independiente de la conversación en Twitter: el mayor aumento de tráfico, resaltado en azul, se produce cuando hay muy poca actividad en Twitter. En este caso, un enlace destacado en un blog o una noticia que haga referencia a la noticia, en lugar de la propia conversación de Twitter, probablemente esté generando tráfico.
En el segundo artículo, la conversación en Twitter es intensa. Hay muchos tuits y retuits del artículo, pero el artículo en sí recibe muy poco tráfico. La gente habla del artículo en Twitter, pero no lo lee. Esto ocurre a veces cuando el mensaje principal de un artículo desencadena un debate o una conversación que puede tener lugar sin que el contenido del artículo sea tan importante, por ejemplo, cuando una noticia puntual contiene pocos análisis o contenido editorial, o cuando la conversación o el debate se aleja del artículo y desarrolla su propio contenido independiente.
En el tercer y último artículo, una intensa conversación en Twitter va de la mano con la participación. A medida que la gente tuitea y retuitea el artículo, sus seguidores hacen clic e interactúan con el contenido en sí. Esta estrecha relación entre la conversación en línea y el tráfico del sitio web se hace más pronunciada cuando las tres «personas influyentes» etiquetadas en la figura inspiran los dos picos de tráfico más importantes a lo largo del ciclo de participación del artículo.
Con solo estas tres visualizaciones de datos, hemos aprendido algunos matices importantes sobre la llamada viralidad. La relación entre las conversaciones de boca en boca en Internet y la participación no es tan simple como que algo simplemente «se haga viral». Surgen diferentes patrones con los diferentes tipos de contenido.
Aun así, las imágenes no pueden contar toda la historia. Aquí vemos algunas correlaciones claras, pero las complejas dependencias condicionales y la autocorrelación temporal y de red hacen que sea necesario crear modelos estadísticos causales más sofisticados que generen información verdadera y confiable sobre la influencia del boca a boca.
Lo que sí ayudan estas imágenes es a saber dónde buscar y qué preguntas hacer a los datos. Es decir, no podemos construir los modelos más complejos hasta que no conozcamos los lugares más adecuados para construirlos. Estas imágenes nos dan parte de esa visión.
Cascade 2.0 se basará en análisis sofisticados y requerirá visualización de datos. Hacer preguntas importantes y evitar las innecesarias es esencial para avanzar de forma eficaz y eficiente con el big data. Sin visualización, somos mucho menos eficientes a la hora de responder a las preguntas cuyas respuestas nos enseñan algo. Por eso, la visualización de los datos debe ser una de las herramientas más importantes para los científicos de datos. Es nuestra antorcha en un bosque espeso y oscuro.
Artículos Relacionados

La IA es genial en las tareas rutinarias. He aquí por qué los consejos de administración deberían resistirse a utilizarla.

Investigación: Cuando el esfuerzo adicional le hace empeorar en su trabajo
A todos nos ha pasado: después de intentar proactivamente agilizar un proceso en el trabajo, se siente mentalmente agotado y menos capaz de realizar bien otras tareas. Pero, ¿tomar la iniciativa para mejorar las tareas de su trabajo le hizo realmente peor en otras actividades al final del día? Un nuevo estudio de trabajadores franceses ha encontrado pruebas contundentes de que cuanto más intentan los trabajadores mejorar las tareas, peor es su rendimiento mental a la hora de cerrar. Esto tiene implicaciones sobre cómo las empresas pueden apoyar mejor a sus equipos para que tengan lo que necesitan para ser proactivos sin fatigarse mentalmente.

En tiempos inciertos, hágase estas preguntas antes de tomar una decisión
En medio de la inestabilidad geopolítica, las conmociones climáticas, la disrupción de la IA, etc., los líderes de hoy en día no navegan por las crisis ocasionales, sino que operan en un estado de perma-crisis.