Alexa, ¿debería mi empresa invertir en tecnología de voz?
por Navid Bahmani, , Amit Bhatnagar,
Resumen.
Las nuevas tecnologías pueden crear nuevas oportunidades para interactuar con los clientes, pero ¿siempre vale la pena que las empresas desarrollen una presencia en estas plataformas? Cuando se trata de lanzar un asistente de voz en Amazon Echo o Google Nest, investigaciones recientes sugieren que la inversión no necesariamente dará sus frutos. Los autores analizaron los datos de cotización de las acciones de casi 100 empresas antes y después de lanzar las funciones del asistente de voz, y descubrieron que, si bien algunas empresas experimentaron un repunte positivo de valoración tras lanzar su asistente de voz, otras no experimentaron ningún aumento o incluso una disminución notable del valor de mercado. Concretamente, las empresas que lanzaron funciones informativas experimentaron un aumento medio del 1% en la valoración, las empresas que lanzaron funciones de control de objetos no experimentaron cambios en el precio de las acciones y las empresas que lanzaron funciones transaccionales experimentaron una disminución media del 1,2% en su valor de mercado. Como tal, los autores sostienen que las empresas deben pensarlo detenidamente antes de invertir en un asistente de voz para asegurarse de que el valor añadido merezca los sustanciales costes de desarrollo.
• • •
Según un Informe 2021, casi la mitad de los usuarios de Internet de EE. UU. tienen un altavoz inteligente. Los altavoces inteligentes, como los líderes del mercado Amazon Echo y Google Nest, permiten a los consumidores utilizar el lenguaje natural para hacer cualquier cosa, desde hacer un pedido en línea hasta buscar una receta, todo con un simple «Ok, Google» o «Hola, Alexa». Pero más allá de las funcionalidades proporcionadas directamente por el fabricante, estos altavoces también sirven como plataforma en la que los clientes pueden conectarse con cualquier empresa de terceros que ofrezca una aplicación (conocida como Skill on the Echo y Action on the Nest) en ese sistema. Por ejemplo, los clientes pueden preguntar a la Skill de Chipotle: «Hola Alexa, vuelve a pedir mi pedido de Chipotle más reciente»; pueden decirle a la Skill Whirlpool: «Hola Alexa, inicia el ciclo de colada»; y pueden preguntar a CNN Action: «Hola Google, ¿cuál es mi informe flash?»
La sabiduría convencional sugiere que desarrollar este tipo de capacidades podría ser una excelente manera para que las empresas interactúen con sus clientes en una nueva plataforma y, de este modo, fortalezcan su posición en el mercado. Sin embargo, nuestro investigaciones recientes descubrió que los importantes costes asociados con el desarrollo de una función de asistente de voz pueden no siempre valer la pena.
Para explorar el valor añadido de estas aplicaciones, recopilamos datos sobre los precios de las acciones de las 112 empresas que lanzaron una función de asistente de voz en Amazon Echo o Google Nest entre 2016 y 2020. A continuación, excluimos los datos de las empresas cuyo lanzamiento de una función de asistente de voz coincidiera con una publicación de resultados (para aislar el efecto de anunciar únicamente el asistente de voz), lo que nos dejaba con un conjunto de datos de 96 empresas. Al comparar los precios de las acciones de estas empresas inmediatamente antes y después de que anunciaran la nueva función, pudimos cuantificar cómo respondieron los inversores al lanzamiento de cada empresa y, para nuestra sorpresa, descubrimos que, si bien algunas empresas experimentaron un repunte positivo en la valoración tras lanzar su asistente de voz, otras no experimentó ningún aumento o incluso una disminución notable en el valor de mercado.
¿Qué impulsó estas reacciones divergentes? Tras un análisis más detallado, descubrimos que la respuesta del mercado estaba influenciada tanto por el tipo de función del asistente de voz como por el tipo de negocio en el que estaba la empresa.
Cuando se utilizan para funciones informativas, los asistentes de voz aumentan el valor de la empresa.
Tras introducir una función de asistente de voz informativo, los precios de las acciones de las empresas subieron una media del 1%, o casi 925 millones de dólares en capitalización bursátil media. Estas funciones hacen referencia a aplicaciones que permiten a los clientes acceder a la información solicitando contenido que se ha seleccionado automáticamente o mediante una interacción conversacional de pregunta y respuesta. Por ejemplo, Action de CNN ofrece boletines de prensa personalizados, Action de WebMD ofrece consejos de salud y Skill de Allrecipes puede responder preguntas culinarias y leer en voz alta las instrucciones paso a paso de las recetas.
Es importante destacar que estas funciones no solo se aplican a las empresas cuya oferta principal de productos es algún tipo de contenido. Incluso las empresas que venden productos físicos pueden beneficiarse de las funciones de voz informativas: por ejemplo, una fabricante de cortadoras de césped desarrolló una habilidad que proporciona información de mantenimiento y guía a los clientes a través del proceso de cambio de aceite.
Cuando se utilizan para funciones de control de objetos, los asistentes de voz tienen un impacto mínimo en el valor de la empresa.
A diferencia de las características informativas, descubrimos que cuando una empresa introdujo una función de control de objetos, no había un impacto significativo en el precio de las acciones. Las funciones de control de objetos permiten a los clientes controlar objetos físicos en sus hogares, por ejemplo, pidiéndole a Alexa que empiece a lavar la ropa o que ajuste el termostato. Si bien estas funciones pueden resultar útiles en algunos casos, varias limitaciones inherentes tienen obstaculizado su adopción generalizada.
En primer lugar, estas herramientas generalmente solo permiten a los usuarios controlar un conjunto limitado de funciones, lo que significa que los clientes aún tienen que interactuar físicamente con el objeto para acceder a toda la gama de funcionalidades disponibles. Por ejemplo, el asistente de voz de Whirlpool puede iniciar una nueva carga, pero para cambiar ajustes como el tipo de ciclo de colada, los clientes tienen que utilizar la interfaz física de la máquina.
En segundo lugar, como la tecnología de procesamiento del lenguaje natural aún está lejos de ser perfecta, es bastante común que los comandos de voz se malinterpreten y, para las funciones de control de objetos, esto puede provocar situaciones peligrosas, como poner el horno a 600 grados.
Por último, muchos dispositivos requieren interacciones mucho más complejas de lo que sería posible mediante comandos de voz. Una estufa activada por voz, por ejemplo, todavía no puede avisarle de forma proactiva cuando el agua está hirviendo o se quema la comida, lo que reduce su utilidad.
Además, en contextos en los que el software de voz sí añade valor, a menudo lo hace a costa de canibalizar o reducir la demanda de productos y funciones existentes que generan ingresos. Por ejemplo, cuando TiVo lanzó una Skill que permitía a los usuarios controlar sus televisores inteligentes, algunos observadores comentó que la función parecía hacer obsoleto el mando con voz existente de TiVo, lo que podría provocar que los propietarios de Amazon Echo tuvieran menos probabilidades de comprar un mando TiVo. Entre estos factores y los importantes costes asociados con el desarrollo de un asistente de voz, descubrimos que cualquier posible reacción positiva del mercado al lanzamiento de una función de control de objetos se anulaba funcionalmente por sus efectos secundarios negativos.
Cuando se utilizan para funciones transaccionales, los asistentes de voz disminuyen el valor de la empresa.
Lo más sorprendente es que descubrimos que cuando una empresa introdujo una función de asistente de voz transaccional, el precio de sus acciones cayó una media del 1,2%, o más de 1000 millones de dólares en valor medio de mercado. Dado que estas funciones permiten a los consumidores utilizar comandos de voz para realizar transacciones como pagar una factura o realizar una compra, cabría esperar que impulsaran el flujo de caja y, por lo tanto, la valoración del mercado. Sin embargo, nuestros datos sugieren que, al igual que las funciones de control de objetos, las funciones transaccionales pueden ser contraproducentes porque no deje los consumidores hacen casi todo lo que se podría pensar.
Por ejemplo, las Habilidades de Starbucks y Chipotle solo permiten a los consumidores volver a pedir artículos que han comprado en el pasado; no permiten a los consumidores pedir artículos nuevos. Además, las funciones transaccionales generalmente requieren que los consumidores ya tengan una cuenta en la empresa (que debe estar configurada en otro dispositivo), lo que impide que los nuevos clientes interactúen de manera efectiva con estas herramientas. Imprecisiones debidas a deficiencias tecnológicas también tienen más en juego cualquier función que pueda cobrar dinero a los clientes, y almacenar datos financieros confidenciales en la nube en lugar de en los dispositivos aumenta el riesgo de seguridad, las preocupaciones sobre la privacidad y los requisitos reglamentarios. Debido a estas deficiencias, vimos que el mercado reaccionaba negativamente a las funciones transaccionales en casi todos los casos.
Los asistentes de voz añaden más valor a las empresas de productos que a las empresas de servicios.
Por último, descubrimos que, independientemente de si sus asistentes de voz eran informativos, de control de objetos o transaccionales, las empresas impulsadas por productos experimentaron un aumento medio del 0,4% (o 300 millones de dólares) en el valor de mercado tras el lanzamiento de la función que experimentaron las empresas impulsadas por los servicios. En general, esto se debe a que la capacidad de interactuar verbalmente a menudo añade nuevas funciones sustanciales a un producto físico, como el acceso a asesoramiento en tiempo real sobre el montaje, el uso o el mantenimiento. Por el contrario, para las empresas de servicios cuyas ofertas son inherentemente intangibles, hay menos necesidad de este tipo de capacidades, por lo que los asistentes de voz tienden a replicar en gran medida las funcionalidades que ya están disponibles a través de los canales tradicionales, lo que añade un valor incremental menor para el cliente.
Por ejemplo, cuando compra tinte para el cabello, normalmente viene con un paquete de instrucciones en letra pequeña, difícil de leer. Pero con el asistente de voz de Clairol, los clientes pueden escuchar las instrucciones en tiempo real mientras se tiñen el pelo en el baño e incluso pueden acceder a recomendaciones personalizadas en función de su tipo de cabello. Del mismo modo, Quaker ofrece un asistente de voz que guía a los clientes a través del proceso de cocción de muchos de sus productos, lo que permite una experiencia mucho más sencilla que leer las instrucciones de la caja o buscar una receta mientras tiene una olla en la estufa.
Por otro lado, empresas impulsadas por los servicios como American Express y United Airlines también ofrecen asistentes de voz informativos (sus herramientas dan a los clientes acceso a información como los cargos de cuenta recientes y los servicios de los próximos vuelos), pero, en su mayor parte, es igual de fácil obtener esta información. en línea o llamando a la empresa para preguntarle a Alexa. Como resultado, estas empresas incurrieron en los costes de desarrollo asociados con la creación de un asistente de voz, pero sus funciones no proporcionaron un valor incremental suficiente como para ser recompensadas significativamente por el mercado.
. . .
Es natural entusiasmarse con el potencial de una nueva plataforma para ayudar a interactuar mejor con los clientes. Y, de hecho, las empresas pueden ganar mucho invirtiendo en nuevas tecnologías, como los asistentes de voz, pero solo en ciertos casos. Para las funciones informativas y para las empresas de productos en general, nuestras investigaciones muestran que crear una aplicación de asistente de voz puede dar sus frutos. Pero cuando se trata de empresas de servicios y herramientas que ofrecen principalmente funciones de control de objetos o transaccionales, las reacciones del mercado sugieren que es poco probable que los asistentes de voz creen suficiente valor para justificar los costes de desarrollo.