El futuro de la IA será menos datos, no más
![El futuro de la IA será menos datos, no más](/content/images/size/w1200/2024/12/Jan19_14_763527085-3.jpg)
Resumen.
Las empresas que estén considerando cómo invertir en capacidades de IA deben entender en primer lugar que en los próximos cinco años las aplicaciones y las máquinas se volverán menos artificiales y más inteligentes. Dependerán menos del big data de abajo hacia arriba y más en un razonamiento de arriba hacia abajo que se asemeja más a la forma en que los seres humanos abordan los problemas y las tareas. Esta capacidad de razonamiento general permitirá que la IA se aplique de forma más amplia que nunca, creando oportunidades para los primeros usuarios, incluso en empresas y actividades para las que antes no parecía adecuada. La IA actual tiene muchas limitaciones. Especialmente tiene problemas para manejar casos «extremos», situaciones en las que existen pocos datos para la formación. Un automóvil sin conductor que puede manejar cruces peatonales, peatones y tráfico tiene problemas para procesar anomalías como niños vestidos con trajes inusuales de Halloween, que cruzan la calle después del anochecer. Muchos sistemas también se confunden fácilmente. El sistema de reconocimiento facial del iPhone X no reconoce las «caras matutinas»: la mirada hinchada y demacrada del usuario al despertar por primera vez. Sin embargo, en los próximos años, los sistemas que aprenden «de arriba hacia abajo» a partir de datos limitados suplantarán a estas aplicaciones ascendentes que consumen muchos datos. Tendrán un razonamiento más eficiente, experiencia y sentido común. Las empresas inteligentes apostarán por estos sistemas más «humanos».
Las empresas que estén considerando cómo invertir en capacidades de IA deben entender en primer lugar que en los próximos cinco años las aplicaciones y las máquinas se volverán menos artificiales y más inteligentes. Dependerán menos del big data de abajo hacia arriba y más en un razonamiento de arriba hacia abajo que se asemeja más a la forma en que los seres humanos abordan los problemas y las tareas. Esta capacidad de razonamiento general permitirá que la IA se aplique de forma más amplia que nunca, creando oportunidades para los primeros usuarios, incluso en empresas y actividades para las que antes no parecía adecuada.
En el pasado reciente, la IA avanzó a través del aprendizaje profundo y el aprendizaje automático, construyendo sistemas desde abajo entrenándolos con montañas de datos. Por ejemplo, los vehículos autónomos están entrenados en tantas situaciones de tráfico como sea posible. Pero estas redes neuronales que consumen muchos datos, como se les llama, tienen serias limitaciones. Especialmente tienen problemas para manejar casos «extremos», situaciones en las que existen pocos datos. Un automóvil sin conductor que puede manejar cruces peatonales, peatones y tráfico tiene problemas para procesar anomalías como niños vestidos con trajes inusuales de Halloween, que cruzan la calle después del anochecer.
Muchos sistemas también se confunden fácilmente. El sistema de reconocimiento facial del iPhone X no reconoce las «caras matutinas»—la mirada hinchada y demacrada de un usuario al despertar por primera vez. Las redes neuronales han vencido a los campeones de ajedrez y han triunfado en el antiguo juego japonés de Go, pero ponen una imagen patas arriba o la alteran ligeramente y la red puede identificarla erróneamente. O puede proporcionar identificaciones de «alta confianza» de objetos irreconocibles.
Los sistemas que consumen muchos datos también enfrentan limitaciones éticas y empresariales. No todas las empresas tienen el volumen de datos necesario para crear capacidades únicas mediante redes neuronales. El uso de grandes cantidades de datos de los ciudadanos también plantea problemas de privacidad que probablemente lleven a más medidas gubernamentales, como el Reglamento General de Protección de Datos (RGPD) de la Unión Europea, que impone requisitos estrictos al uso de los datos personales de las personas. Además, estos sistemas son cajas negras; no está claro cómo utilizan los datos de entrada para obtener resultados como acciones o decisiones. Esto los deja expuestos a la manipulación por parte de malos actores (como los rusos en las elecciones presidenciales estadounidenses de 2016), y cuando algo va vergonzosamente mal, las organizaciones tienen dificultades para explicar por qué.
En el futuro, sin embargo, tendremos sistemas descendentes que no requieren tantos datos y que son más rápidos, flexibles y, al igual que los humanos, más inteligentes de forma innata. Varias empresas y organizaciones ya están poniendo en marcha estos sistemas más naturales. Para elaborar una visión de hacia dónde se dirige la IA en los próximos años y, a continuación, planificar las inversiones y las pruebas en consecuencia, las empresas deben buscar desarrollos en cuatro áreas:
Más eficiente razonamiento robot. Cuando los robots tienen una comprensión conceptual del mundo, como lo hacen los humanos, es más fácil enseñarles cosas, utilizando muchos menos datos. Vicarious, una startup de Union City, CA, cuyos inversores incluyen Mark Zuckerberg, Jeff Bezos y Marc Benioff, está trabajando para desarrollar inteligencia general para robots, lo que les permite generalizar a partir de unos pocos ejemplos.
Piensa en esos líos de letras y números que usan los sitios web para determinar si eres un humano o un robot. Llamado CAPTCHA (Pruebas públicas de Turing completamente automatizadas para diferenciar a Computers and Humans), son fáciles de resolver para los humanos y difíciles para las computadoras. Basándose en la neurociencia computacional, los investigadores de Vicarious han desarrollado un modelo que romper CAPTCHAs a un ritmo mucho mayor que las redes neuronales profundas y con una eficiencia de datos 300 veces mayor. Para analizar los CAPTCHA con una precisión de casi un 67%, el modelo Vicarious solo necesitaba cinco ejemplos de entrenamiento por personaje, mientras que una red neuronal profunda de última generación requería un conjunto de cadenas CAPTCHA 50.000 veces mayor. Estos modelos, con su capacidad de entrenar más rápido y generalizarse de manera más amplia que los enfoques de IA que se usan comúnmente en la actualidad, nos están poniendo en camino hacia robots que tienen una comprensión conceptual del mundo similar a la humana.
Experiencia preparada. Al modelar lo que haría un experto humano frente a la alta incertidumbre y la escasa información, la inteligencia artificial de arriba hacia abajo puede superar los enfoques que consumen muchos datos para diseñar y controlar muchas variedades de equipos de fábrica. Siemens utiliza IA de arriba hacia abajo para controlar el complejo proceso de combustión de las turbinas de gas, donde el aire y el gas fluyen hacia una cámara, se encienden y se queman a temperaturas de hasta 1.600 grados centígrados. El volumen de emisiones generadas y, en última instancia, el tiempo que seguirá funcionando la turbina depende de la interacción de numerosos factores, desde la calidad del gas hasta el flujo de aire y la temperatura interna y externa.
Utilizando métodos de aprendizaje automático de abajo hacia arriba, la turbina de gas tendría que funcionar durante un siglo antes de producir suficientes datos para comenzar a entrenar. En cambio, Investigadores de Siemens Volar Sterzing y Steffen Udluft utilizaron métodos que requerían pocos datos en la fase de aprendizaje de las máquinas. El sistema de monitoreo resultante realiza ajustes precisos que optimizan el funcionamiento de las turbinas en términos de emisiones y desgaste, buscando continuamente la mejor solución en tiempo real, al igual que un experto que hace girar varias perillas con conocimiento de causa.
Sentido común. Varias organizaciones trabajan para enseñar a las máquinas a navegar por el mundo con el sentido común: para comprender los objetos y las acciones cotidianas, comunicarse de forma natural, manejar situaciones imprevistas y aprender de las experiencias. Pero lo que resulta natural para los seres humanos, sin formación ni datos explícitos, es diabálicamente difícil para las máquinas. Según Oren Etzioni, CEO del Instituto Allen de Inteligencia Artificial ( AI2), «Ningún sistema de IA implementado actualmente puede responder de forma fiable a una amplia gama de preguntas sencillas, como: «Si pongo mis calcetines en un cajón, ¿seguirán ahí mañana?» o '¿Cómo saber si un envase de leche está lleno?'»
Para ayudar a definir lo que significa que las máquinas tengan sentido común, AI2 está desarrollando un cartera de tareas respecto de los cuales se puede medir el progreso. DARPA está invirtiendo 2.000 millones de dólares en investigación de IA. En su Programa Machine Common Sense (MCS), los investigadores crearán modelos que imitan los dominios centrales de la cognición humana, entre ellos «los dominios de objetos (física intuitiva), lugares (navegación espacial) y agentes (actores intencionales)». Investigadores de Microsoft y la Universidad McGill han desarrollado conjuntamente un sistema que ha demostrado ser muy prometedor para desenredar ambigüedades en el lenguaje natural, un problema que requiere diversas formas de inferencia y conocimiento.
Hacer mejores apuestas. Los seres humanos de forma rutinaria, y a menudo sin esfuerzo, clasifican las probabilidades y actúan según lo más probable, incluso con relativamente poca experiencia previa. Ahora se enseña a las máquinas a imitar este razonamiento mediante la aplicación de Procesos gaussianos—modelos probabilísticos que pueden hacer frente a una gran incertidumbre, actuar sobre datos dispersos y aprender de la experiencia. Lanzamiento de Alphabet, la compañía madre de Google Proyecto Loon, diseñado para proporcionar servicio de Internet a regiones desatendidas del mundo a través de un sistema de globos gigantes que flotan en la estratosfera. Sus sistemas de navegación emplean procesos gaussianos para predecir en qué parte de los vientos estratificados y altamente variables deben ir los globos. Cada globo se mueve hacia una capa de viento que sopla en la dirección correcta, organizándose para formar una gran red de comunicación. Los globos no solo pueden hacer predicciones razonablemente precisas mediante el análisis de datos de vuelos anteriores, sino que también pueden analizar los datos durante un vuelo y ajustar sus predicciones en consecuencia.
Estos procesos gaussianos son muy prometedores. No requieren cantidades masivas de datos para reconocer patrones; los cálculos necesarios para la inferencia y el aprendizaje son fáciles de relatividad y, si algo sale mal, se puede rastrear su causa, a diferencia de las cajas negras de las redes neuronales.
Aunque todos estos avances son relativamente recientes, se remontan a los inicios de la IA en la década de 1950, cuando varios investigadores comenzaron a buscar modelos descendentes para imitar la inteligencia humana. Pero cuando el progreso resultó difícil de alcanzar y el rico potencial de los métodos de aprendizaje automático de abajo hacia arriba se hizo evidente, el enfoque descendente se abandonó en gran medida. Hoy, sin embargo, a través de nuevas y poderosas técnicas computacionales y de investigación, la IA de arriba hacia abajo ha renacido. A medida que su gran promesa comienza a cumplirse, las empresas inteligentes pondrán su dinero donde está la mente.
— Escrito por H. James Wilson, Chase Davenport H. James Wilson,