Cómo ganar con el aprendizaje automático
Muchas empresas pueden mejorar drásticamente sus productos y servicios mediante el aprendizaje automático, una aplicación de inteligencia artificial que implica generar predicciones a partir de las entradas de datos. Amazon, Google y otros gigantes de la tecnología ya son expertos en aprovechar esta tecnología. Sin embargo, las empresas más pequeñas y las que entran tarde pueden no estar seguras de cómo hacer lo mismo para hacerse con cuota de mercado.
Este artículo sugiere que los primeros en moverse tendrán éxito si tienen suficientes datos de entrenamiento para hacer predicciones precisas y si pueden mejorar sus algoritmos incorporando rápidamente los comentarios derivados del comportamiento de los clientes. Los que lleguen tarde necesitarán un enfoque diferente para ser competitivos: el secreto para ellos es encontrar fuentes sin explotar de datos de formación o comentarios, o diferenciarse adaptando las predicciones a un nicho especial.
•••
Resumen de la idea
El desafío
A medida que más empresas utilizan el aprendizaje automático en productos y servicios compatibles con la IA, se enfrentan al desafío de forjarse una posición de mercado defendible, especialmente si llegan tarde.
Cómo salir adelante
Los usuarios de IA más exitosos capturan una buena reserva de datos de entrenamiento desde el principio y, después, aprovechan los datos de los comentarios para abrir una brecha de valor (en términos de calidad de predicción) entre ellos y los que se mueven más adelante.
Cómo ponerse al día
Los que lleguen tarde aún pueden asegurarse un punto de apoyo si pueden encontrar fuentes de datos de entrenamiento o comentarios superiores, o si adaptan sus predicciones a un nicho específico.
La última década ha supuesto enormes avances en una emocionante dimensión de la inteligencia artificial: el aprendizaje automático. Esta técnica para tomar las entradas de datos y convertirlas en predicciones ha permitido a gigantes tecnológicos como Amazon, Apple, Facebook y Google mejorar drásticamente sus productos. También ha impulsado a las empresas emergentes a lanzar nuevos productos y plataformas, a veces incluso en competencia con las grandes tecnologías. Pensemos en BenchSCI, una empresa con sede en Toronto que busca acelerar el proceso de desarrollo de fármacos. Su objetivo es facilitar a los científicos la búsqueda de agujas en los pajares, para centrarse en la información más crucial que se encuentra en las bases de datos internas de las empresas farmacéuticas y en la enorme cantidad de investigaciones científicas publicadas. Para incluir un nuevo fármaco candidato en los ensayos clínicos, los científicos deben realizar experimentos costosos y que requieren mucho tiempo. BenchSCI se dio cuenta de que los científicos podían realizar menos de esos experimentos y lograr un mayor éxito si aplicaban mejores conocimientos a partir de la enorme cantidad de experimentos que ya se habían realizado. De hecho, BenchSCI descubrió que si los científicos aprovecharan el aprendizaje automático que leía, clasificaba y luego presentaba los conocimientos de la investigación científica, podrían reducir a la mitad el número de experimentos que normalmente se requieren para llevar un fármaco a los ensayos clínicos. Más específicamente, podrían utilizar la tecnología para encontrar los reactivos biológicos adecuados, sustancias esenciales para influir en la expresión de las proteínas y medirla. Identificarlos consultando la literatura publicada en lugar de redescubrirlos desde cero ayuda a reducir significativamente el tiempo que se tarda en producir nuevos fármacos candidatos. Eso se suma a un ahorro potencial de más de 17 000 millones de dólares al año, lo que, en un sector en el que los retornos de la I+D se han reducido como navajas, podría transformar el mercado. Además, se podrían salvar muchas vidas si se lanzaran nuevos medicamentos al mercado más rápidamente. Lo que destaca aquí es que BenchSCI, en su dominio especializado, está haciendo algo parecido a lo que Google ha estado haciendo en todo Internet: utilizar el aprendizaje automático para liderar en las búsquedas. Del mismo modo que Google puede ayudarlo a averiguar cómo arreglar su lavavajillas y ahorrarse un viaje largo a la biblioteca o un costoso servicio de reparación, BenchSCI ayuda a los científicos a identificar un reactivo adecuado sin incurrir en los problemas o gastos de investigación y experimentación excesivos. Anteriormente, los científicos utilizaban Google o PubMed para buscar en la literatura (un proceso que llevaba días), luego leían la literatura (volvían a tardar días) y, después, pedían y probaban de tres a seis reactivos antes de elegir uno (durante un período de semanas). Ahora buscan en BenchSCI en cuestión de minutos y, a continuación, piden y prueban de uno a tres reactivos antes de elegir uno (realizan menos pruebas en menos semanas). Muchas empresas ya trabajan con la IA y conocen las medidas prácticas para integrarla en sus operaciones y aprovechar su potencia. Pero a medida que ese dominio aumente, las empresas tendrán que plantearse una cuestión más amplia: ¿Cómo se aprovecha el aprendizaje automático para crear un foso defendible en torno a la empresa, a fin de crear algo que la competencia no pueda imitar fácilmente? En el caso de BenchSCI, por ejemplo, ¿su éxito inicial atraerá la competencia de Google y, de ser así, cómo mantiene BenchSCI su liderazgo? En las páginas siguientes, explicamos cómo las empresas que entran en los sectores con un producto o servicio compatible con la IA pueden crear una ventaja competitiva sostenible y aumentar las barreras de entrada a los que llegan tarde. Observamos que mudarse pronto suele ser una gran ventaja, pero no es toda la historia. Como hemos dicho, los que adoptan tardíamente la nueva tecnología aún pueden avanzar —o al menos recuperar parte del terreno perdido— si encuentran un nicho. ## Hacer predicciones con la IA Las empresas utilizan el aprendizaje automático para reconocer patrones y, a continuación, hacer predicciones sobre lo que atraerá a los clientes, mejorará las operaciones o ayudará a mejorar un producto. Sin embargo, antes de poder crear una estrategia en torno a esas predicciones, debe entender las entradas necesarias para el proceso de predicción, los desafíos que implica obtener esas entradas y la función de los comentarios a la hora de permitir que un algoritmo haga mejores predicciones con el tiempo. Una predicción, en el contexto del aprendizaje automático, es una salida de información que se obtiene al introducir algunos datos y ejecutar un algoritmo. Por ejemplo, cuando la aplicación de navegación móvil muestra una predicción sobre la mejor ruta entre dos puntos, utiliza datos de entrada sobre las condiciones del tráfico, los límites de velocidad, el tamaño de la carretera y otros factores. A continuación, se emplea un algoritmo para predecir el camino más rápido y el tiempo que tardará. El principal desafío de cualquier proceso de predicción es que los datos de entrenamiento (los insumos que se necesitan para empezar a obtener resultados razonables) tienen que crearse (por ejemplo, contratando expertos para clasificar las cosas) o obtenerse de las fuentes existentes (por ejemplo, los registros médicos). Algunos tipos de datos son fáciles de adquirir de fuentes públicas (piense en la información meteorológica y cartográfica). Los consumidores también pueden proporcionar voluntariamente datos personales si perciben algún beneficio al hacerlo. Los usuarios de Fitbit y Apple Watch, por ejemplo, permiten a las empresas recopilar estadísticas sobre su nivel de ejercicio, ingesta de calorías, etc., a través de dispositivos que los usuarios usan para gestionar su salud y estado físico. Mudarse pronto suele ser una gran ventaja, pero no es toda la historia. Sin embargo, obtener datos de entrenamiento para permitir las predicciones puede resultar difícil si requiere la cooperación de un gran número de personas que no se benefician directamente de proporcionarlos. Por ejemplo, una aplicación de navegación puede recopilar datos sobre las condiciones del tráfico mediante el seguimiento de los usuarios y la obtención de informes de ellos. Esto permite a la aplicación identificar las ubicaciones probables de atascos y alertar a los demás conductores que se dirijan hacia ellos. Pero los conductores que ya están atrapados en los gruñidos reciben pocos payoffs directos por la participación, y puede que les preocupe la idea de que la aplicación sepa dónde se encuentran en cualquier momento (y es posible que grabe sus movimientos). Si las personas en atascos de tráfico se niegan a compartir sus datos o, de hecho, apagan sus geolocalizadores, la capacidad de la aplicación de advertir a los usuarios de los problemas de tráfico se verá comprometida. Otro desafío puede ser la necesidad de actualizar periódicamente los datos de entrenamiento. Esto no siempre es un problema; no se aplicará si el contexto básico en el que se hizo la predicción se mantiene constante. La radiología, por ejemplo, analiza la fisiología humana, que generalmente es coherente de una persona a otra y a lo largo del tiempo. Por lo tanto, después de cierto punto, el valor marginal de un registro adicional en la base de datos de entrenamiento es casi cero. Sin embargo, en otros casos, es posible que los algoritmos tengan que actualizarse con frecuencia con datos completamente nuevos que reflejen los cambios en el entorno subyacente. Con las aplicaciones de navegación, por ejemplo, las nuevas carreteras o rotondas, los nombres de las calles y cambios similares harán que las predicciones de la aplicación sean menos precisas con el tiempo, a menos que se actualicen los mapas que forman parte de los datos de entrenamiento inicial. En muchas situaciones, los algoritmos se pueden mejorar continuamente mediante el uso de datos de retroalimentación, que se obtienen al mapear los resultados reales con los datos de entrada que generaron las predicciones de esos resultados. Esta herramienta es especialmente útil en situaciones en las que puede haber variaciones considerables dentro de límites claramente definidos. Por ejemplo, cuando su teléfono utilice una imagen suya por motivos de seguridad, inicialmente habrá entrenado el teléfono para que lo reconozca. Pero su rostro puede cambiar significativamente. Puede que lleve gafas o no. Puede que se haya hecho un peinado nuevo, se haya maquillado o haya subido o perdido peso. Por lo tanto, la predicción de que es usted puede resultar menos fiable si el teléfono se basa únicamente en los datos de entrenamiento inicial. Pero lo que realmente ocurre es que el teléfono actualiza su algoritmo con todas las imágenes que usted proporciona cada vez que lo desbloquea. Crear este tipo de circuitos de retroalimentación no es nada sencillo en contextos dinámicos y en los que los comentarios no se pueden clasificar ni obtener fácilmente. Los datos de comentarios de la aplicación de reconocimiento facial para teléfonos inteligentes, por ejemplo, solo crean mejores predicciones si la única persona que introduce los datos faciales es el propietario del teléfono. Si otras personas se parecen lo suficiente como para entrar en el teléfono y seguir usándolo, la predicción del teléfono de que el usuario es el propietario deja de ser fiable. También puede resultar peligrosamente fácil introducir sesgos en el aprendizaje automático, especialmente si hay varios factores en juego. Supongamos que un prestamista utiliza un proceso basado en la IA para evaluar el riesgo crediticio de los solicitantes de préstamos, teniendo en cuenta su nivel de ingresos, historial laboral, características demográficas, etc. Si los datos de entrenamiento del algoritmo discriminan a un grupo determinado (por ejemplo, personas de color), el ciclo de retroalimentación perpetuará o incluso acentuará ese sesgo, por lo que cada vez es más probable que se rechace a los candidatos de color. Es casi imposible incorporar los comentarios de forma segura a un algoritmo sin parámetros cuidadosamente definidos y fuentes fiables e imparciales. ## Crear una ventaja competitiva en la predicción En muchos sentidos, crear un negocio sostenible con el aprendizaje automático es muy parecido a crear un negocio sostenible en cualquier sector. Tiene que venir con un producto vendible, conseguir una posición temprana defendible y hacer que sea más difícil para cualquiera que entre detrás de usted. Que pueda hacerlo depende de sus respuestas a tres preguntas: ### 1. ¿Tiene suficientes datos de entrenamiento? Desde el principio, una máquina de predicción necesita generar predicciones que sean lo suficientemente buenas como para ser viables desde el punto de vista comercial. La definición de «lo suficientemente bueno» podría establecerla la normativa (por ejemplo, una IA para hacer diagnósticos médicos debe cumplir con las normas gubernamentales), la usabilidad (un chatbot tiene que funcionar con la suficiente fluidez como para que las personas que llaman respondan a la máquina en lugar de esperar a hablar con una persona en el centro de llamadas) o la competencia (una empresa que quiere entrar en el mercado de las búsquedas en Internet necesita cierto nivel de precisión predictiva para competir con Google). Por lo tanto, una barrera de entrada es la cantidad de tiempo y esfuerzo que implica crear o acceder a suficientes datos de entrenamiento como para hacer predicciones lo suficientemente buenas. Esta barrera puede ser alta. Tomemos el caso de la radiología, en el que una máquina de predicción tiene que ser considerablemente mejor que los humanos altamente cualificados para que se le confíe la vida de las personas. Eso sugiere que la primera empresa en crear una IA de radiología de aplicación general (una que pueda leer cualquier imagen escaneada) tendrá poca competencia al principio porque se necesitan muchos datos para tener éxito. Pero la ventaja inicial puede ser efímera si el mercado crece rápidamente, ya que en un mercado en rápido crecimiento, el payoff de tener acceso a los datos de formación probablemente sea lo suficientemente grande como para atraer a varias grandes empresas con mucho dinero. Esto, por supuesto, significa que los requisitos de entrada de datos de formación están sujetos a la economía de escala, como muchas otras cosas. Los mercados de alto crecimiento atraen inversiones y, con el tiempo, esto eleva el umbral para el próximo nuevo participante (y obliga a todos los que ya están en el sector a gastar más en desarrollar o comercializar sus productos). Por lo tanto, cuantos más datos pueda entrenar a sus máquinas, mayor será el obstáculo para que cualquiera lo persiga, lo que nos lleva a la segunda pregunta. ### 2. ¿Qué tan rápidos son sus bucles de retroalimentación? Las máquinas de predicción aprovechan lo que tradicionalmente ha sido una ventaja para los humanos: aprenden. Si pueden incorporar los datos de los comentarios, pueden aprender de los resultados y mejorar la calidad de la próxima predicción. Sin embargo, el alcance de esta ventaja depende del tiempo que se tarde en recibir comentarios. Con una radiografía, si se necesita una autopsia para evaluar si un algoritmo de aprendizaje automático predijo correctamente el cáncer, los comentarios serán lentos y, aunque una empresa pueda tener una ventaja temprana en la recopilación y lectura de las tomografías, tendrá una capacidad limitada de aprender y, por lo tanto, mantener su ventaja. Por el contrario, si los datos de comentarios se pueden generar rápidamente después de obtener la predicción, una ventaja temprana se traducirá en una ventaja competitiva sostenida, ya que la báscula mínima eficiente pronto estará fuera del alcance incluso de las empresas más grandes. Cuando Microsoft lanzó el motor de búsqueda Bing en 2009, contó con el pleno respaldo de la empresa. Microsoft invirtió miles de millones de dólares en ello. Sin embargo, más de una década después, la cuota de mercado de Bing sigue muy por debajo de la de Google, tanto en volumen de búsquedas como en ingresos por publicidad en búsquedas. Una de las razones por las que a Bing le costó ponerse al día fue el ciclo de retroalimentación. En la búsqueda, el tiempo entre la predicción (que ofrece una página con varios enlaces sugeridos en respuesta a una consulta) y los comentarios (el usuario hace clic en uno de los enlaces) es corto, normalmente segundos. En otras palabras, el circuito de retroalimentación es rápido y potente.  Peter Greenwood Cuando Bing entró en el mercado, Google ya llevaba una década o más operando un motor de búsqueda basado en la IA, lo que ayudaba a millones de usuarios y realizaba miles de millones de búsquedas a diario. Cada vez que un usuario hacía una consulta, Google predecía los enlaces más relevantes y, a continuación, el usuario seleccionaba los mejores enlaces, lo que permitía a Google actualizar su modelo de predicción. Eso permitía un aprendizaje constante a la luz de un espacio de búsqueda en constante expansión. Con tantos datos de entrenamiento basados en tantos usuarios, Google podría identificar nuevos eventos y nuevas tendencias más rápido que Bing. Al final, el rápido ciclo de retroalimentación, combinado con otros factores (la continua inversión de Google en enormes instalaciones de procesamiento de datos y los costes reales o percibidos para los clientes de cambiarse a otro motor), hicieron que Bing siempre quedara a la zaga. Otros motores de búsqueda que intentaron competir con Google y Bing ni siquiera empezaron. ### 3. ¿Qué tan buenas son sus predicciones? El éxito de cualquier producto depende, en última instancia, de lo que reciba por lo que pague. Si a los consumidores se les ofrecen dos productos similares al mismo precio, normalmente elegirán el que consideren de mayor calidad. La calidad de las predicciones, como ya hemos dicho, suele ser fácil de evaluar. En radiología, búsquedas, publicidad y muchos otros contextos, las empresas pueden diseñar la IA con una métrica única y clara de calidad: la precisión. Como en otros sectores, los productos de mayor calidad se benefician de una mayor demanda. Sin embargo, los productos basados en la IA son diferentes de los demás porque, para la mayoría de los demás productos, una mejor calidad cuesta más y los vendedores de productos de calidad inferior sobreviven utilizando materiales más baratos o procesos de fabricación menos costosos y, por lo tanto, cobrando precios más bajos. Esta estrategia no es tan factible en el contexto de la IA. Como la IA se basa en software, una predicción de baja calidad es tan cara de producir como una de alta calidad, lo que hace que los precios con descuento no sean realistas. Y si la mejor predicción es que tiene el mismo precio que la peor, no hay motivo para comprar la de menor calidad. Para Google, este es otro factor que explica por qué su ventaja en las búsquedas puede ser irrefutable. Las predicciones de la competencia suelen tener un aspecto bastante similar a las de Google. Introduzca la palabra «tiempo» en Google o Bing y los resultados serán prácticamente los mismos: las previsiones aparecerán primero. Pero si introduce un término menos común, pueden surgir diferencias. Si escribe, por ejemplo, «disrupción», la primera página de Bing normalmente mostrará las definiciones del diccionario, mientras que Google proporciona definiciones y enlaces a artículos de investigación sobre el tema de la innovación disruptiva. Aunque Bing puede funcionar tan bien como Google para algunas consultas de texto, para otras es menos preciso a la hora de predecir lo que buscan los consumidores. Y hay pocas categorías de búsqueda, si es que hay alguna, en las que Bing sea considerado superior. ## Ponerse al día La conclusión es que en la IA, quien se mueve desde el principio puede crear una ventaja competitiva basada en la escala si los ciclos de retroalimentación son rápidos y la calidad del rendimiento es clara. Entonces, ¿qué significa esto para los que se mudan tarde? Entre las tres preguntas hay pistas sobre dos formas en las que un participante tardío puede hacerse su propio espacio en el mercado. Los aspirantes a contendientes no necesitan elegir entre estos enfoques; pueden probar ambos. ### Identifique y proteja las fuentes de datos alternativas. En algunos mercados de herramientas de predicción, puede que haya reservas de posibles datos de formación que las empresas tradicionales no hayan capturado aún. Volviendo al ejemplo de la radiología, decenas de miles de médicos leen miles de escaneos cada uno al año, lo que significa que hay cientos de millones (o incluso miles de millones) de nuevos puntos de datos disponibles. Los primeros participantes recibirán datos de entrenamiento de unos cientos de radiólogos. Por supuesto, una vez que su software se ejecute sobre el terreno, el número de escaneos y la cantidad de comentarios en su base de datos aumentarán sustancialmente, pero los miles de millones de escaneos analizados y verificados anteriormente representan una oportunidad para que los rezagados se pongan al día, suponiendo que sean capaces de agrupar los escaneos y analizarlos en conjunto. Si ese es el caso, tal vez puedan desarrollar una IA que haga predicciones lo suficientemente buenas como para salir al mercado, tras lo cual también puedan beneficiarse de los comentarios. Los que lleguen tarde también podrían considerar la posibilidad de entrenar a una IA con datos de patología o autopsia en lugar de diagnósticos humanos. Esa estrategia les permitiría alcanzar el umbral de calidad antes (ya que las biopsias y las autopsias son más definitivas que las gammagrafías corporales), aunque el posterior ciclo de retroalimentación sería más lento. Como alternativa, en lugar de intentar encontrar fuentes de datos de formación sin explotar, los que lleguen tarde podrían buscar nuevas fuentes de datos de comentarios que les permitan aprender más rápido que las que utilizan los titulares. (BenchSCI es un ejemplo de empresa que ha tenido éxito en ello.) Al ser el primero en contar con un nuevo suministro de datos de comentarios más rápidos, el recién llegado puede aprender de las acciones y decisiones de sus usuarios para mejorar su producto. Sin embargo, en los mercados en los que los ciclos de retroalimentación ya son bastante rápidos y en los que las empresas tradicionales operan a gran escala, las oportunidades de aplicar este enfoque serán relativamente limitadas. Y una retroalimentación significativamente más rápida probablemente provocaría una disrupción en las prácticas actuales, lo que significaría que los nuevos participantes no competirían realmente con las empresas establecidas, sino que las desplazarían. ### Diferenciar la predicción. Otra táctica que puede ayudar a los que entran tarde a ser competitivos es redefinir qué hace que una predicción sea «mejor», aunque solo sea para algunos clientes. En radiología, por ejemplo, esa estrategia podría ser posible si el mercado demandara diferentes tipos de predicciones. Lo más probable es que los primeros en entrar hayan entrenado sus algoritmos con datos de un sistema hospitalario, un tipo de hardware o un país. Con los datos de entrenamiento (y luego los datos de los comentarios) de otro sistema u otro país, el recién llegado podría personalizar su IA para ese segmento de usuarios si es lo suficientemente distinta. Si, por ejemplo, los estadounidenses de las zonas urbanas y las personas de las zonas rurales de China tienden a tener diferentes problemas de salud, una máquina de predicción creada para diagnosticar uno de esos grupos podría no ser tan precisa para diagnosticar a los pacientes del otro grupo. Los que lleguen tarde podrían buscar nuevas fuentes de datos de comentarios que les permitan aprender más rápido. Crear predicciones que se basen en los datos procedentes de un tipo de hardware determinado también podría ofrecer una oportunidad de mercado, si ese modelo de negocio se traduce en una reducción de los costes o en un aumento de la accesibilidad para los clientes. Muchas de las IA actuales para radiología se basan en datos de las máquinas de rayos X, escáneres y dispositivos de ultrasonido más utilizados fabricados por GE, Siemens y otros fabricantes establecidos. Sin embargo, si los algoritmos se aplican a los datos de otras máquinas, las predicciones resultantes pueden ser menos precisas. Por lo tanto, un participante tardío podría encontrar un nicho ofreciendo un producto adaptado a ese otro equipo, lo que podría resultar atractivo para los centros médicos si es más barato de comprar u operar o si está especializado para satisfacer las necesidades de determinados clientes. ### CONCLUSIÓN El potencial de las máquinas de predicción es inmenso y no cabe duda de que los gigantes de la tecnología tienen una ventaja inicial. Pero vale la pena recordar que las predicciones son como productos diseñados con precisión, altamente adaptados a propósitos y contextos específicos. Si puede diferenciar un poco los propósitos y los contextos, puede crear un espacio defendible para su propio producto. Aunque el diablo está en los detalles de la forma en que recopila y utiliza los datos, su salvación también está ahí. Sin embargo, la verdadera clave para competir con éxito con las grandes tecnologías en las industrias impulsadas por máquinas inteligentes reside en una pregunta que solo un humano puede responder: ¿qué es lo que quiere predecir? Por supuesto, averiguar la respuesta no es fácil. Para ello se necesita un conocimiento profundo de la dinámica del mercado y un análisis cuidadoso del valor potencial de las predicciones específicas y de los productos y servicios en los que están integradas. Por lo tanto, quizás no sorprenda que el principal inversor en la financiación de la serie A2 de BenchSCI no fuera uno de los muchos inversores tecnológicos canadienses locales, sino una firma de capital riesgo centrada en la IA llamada Gradient Ventures, propiedad de Google. Read more on [**Strategy**](/topic/subject/strategy?ab=articlepage-topic) or related topics [**Joint ventures**](/topic/subject/joint-ventures?ab=articlepage-topic), [**Technology and analytics**](/topic/subject/technology-and-analytics?ab=articlepage-topic) and [**Information technology and telecom sector**](/topic/industry/information-technology-and-telecom-sector?ab=articlepage-topic)