PathMBA Vault

Social media

Cuatro formas de ver Twitter

por Scott Berinato

La visualización de datos mola. También se está volviendo cada vez más útil, a medida que la vibrante comunidad online de visualizadores de datos (programadores, diseñadores, artistas y estadísticos, a veces todos en una sola persona) crece y las herramientas para ejecutar sus visiones mejoran.

Jeff Clark forma parte de esta comunidad. Él, como muchos entusiastas de la visualización de datos, se enamoró después de inspirarse en un pionero Martín Wattenberg es mapa de árboles emblemáticos que visualizaba el mercado de valores.

El último trabajo de Clark es muy prometedor. Ha creado cuatro motores que visualizan esa enorme pila de datos conocida como Twitter. Básicamente, las cuatro palabras de búsqueda utilizadas en los tuits y, a continuación, buscan relaciones con otras palabras o con otros tuiteros. Funcionan casi en tiempo real.

«Twitter es una fuente de datos obvia para obtener mucha información textual», afirma Clark. «De hecho, ha demostrado ser un gran patio de recreo para poner a prueba ideas de visualización de datos». Clark admite fácilmente que no todas las visualizaciones son producto de su genialidad en el diseño. Son sus habilidades de programación las que le permiten crear motores que impulsen las visualizaciones. «Dedico bastante tiempo a analizar lo que hay ahí fuera. Tomaré lo que alguien hizo visualmente y usaré una fuente de datos diferente. Twitter Spectrum se basaba en las cosas que la gente buscaba en Google. Chris Harrison hizo un trabajo interesante que se ve muy bien y pensé: puedo hacer algo así basado en datos en tiempo real. Así que lo llevé a Twitter».

Sus herramientas están definitivamente en las primeras etapas, pero incluso ahora, es fácil imaginarse adónde podrían llevarse.

Tome Twitter Venn. Introduce tres términos de búsqueda y la aplicación muestra un diagrama de Venn que muestra la frecuencia de uso de cada término y la frecuencia de superposición de los términos en un solo tuit. Como ventaja adicional, muestra un pequeño mapa de palabras con los términos más comunes relacionados con cada término de búsqueda; tuits por día para cada término por sí solo y cada combinación de términos; y un tuit reciente. Escribí «Apple, Google, Microsoft». Esto es lo que tiene:

twittervenn.jpg

Enseguida veo que los tuits de Apple están dominando, no es sorprendente. Pero observe la alta frecuencia de palabras inesperadas como «ganar», «gratis» y «capacitivo» que se utilizan con el término «manzana». Eso sugiere marketing (¿spam?) de productos Apple a través de Twitter, es decir, «Gane un iPad gratis…».

Me sorprendió la relativa poca frecuencia de los tuits de «Google». De hecho, había de media más tuits que incluían «Microsoft» y «Google» que otros que solo mencionaban «Google».

Entonces fui a Espectro de Twitter, una herramienta similar que compara dos términos de búsqueda y muestra qué palabras se asocian más a cada término y qué palabras se utilizan con más frecuencia en los tuits con ambos términos. Este es el espectro de Twitter de «Google, Microsoft»:

twitterspectrum.jpg

Me encanta que la palabra «uf» esté en un punto muerto entre Google y Microsoft. Pero el protagonismo de los términos de las redes sociales en el lado azul frente a los términos de búsqueda en el lado rojo es fascinante. Parece que dos ejércitos marchan uno contra el otro listos para librar guerras diferentes.

Clark también creó TwitArcs. Creo que este es un trabajo en progreso y Clark dice: «Visualmente me gusta, pero puede que sea lo menos útil hasta ahora». En este caso, escribe el identificador de un tuitero y devuelve una secuencia de los tuits de esa persona con arcos que unen palabras comunes entre los tuits (a la derecha) y los que retuitean comunes (a la izquierda). Al pasar el ratón por encima, se resalta el último tuit del arco. He aquí un TwitArc de @timoreilly:

twitarc.jpg

Por último, el gráfico de flujo. Introduzca un término de búsqueda y el motor de Clark devolverá la frecuencia de las palabras más comunes encontradas en su término de búsqueda en los últimos 1000 tuits. Ve un flujo literal de conversación. También puede resaltar un término para ver cómo ha cambiado su frecuencia a lo largo del tiempo y verá los tuits más recientes que incluyen tanto su término de búsqueda como el término destacado.

A veces, 1000 tuits con su término pueden durar semanas. Para mi término de búsqueda, «Tiger Woods», que introduje ayer por la tarde justo después de que se conociera la noticia de que hablaría en público, 1000 tuits cubiertos unos 20 minutos. Este es el gráfico de flujo de «Tiger Woods» con la palabra «silencio» resaltada:

streamgraph.jpg

No es difícil imaginar cómo se puede aplicar esto a las empresas. Ya me imagino a los vendedores ansiosos viendo pasar la transmisión en su debut comercial en la Super Bowl del año que viene.

Clark, como muchos visualizadores de datos, cree que estamos al frente de una revolución en la presentación de la información. «Hay mucho trabajo por hacer llamado visualización científica o gráficos de inteligencia empresarial», afirma. «Y es pragmático, tratar de resolver problemas prácticos. Todo es estándar, gráfico de barras o circular. Pero esas formas estándar no son adecuadas cuando se intenta explotar un espacio de datos más rico. El mundo está lleno de datos complejos y acabamos de empezar a tener las herramientas para darles sentido. Estamos buscando nuevas formas de presentar los datos».