Añadir más datos no es la única forma de mejorar la IA

Añadir más datos no es la única forma de mejorar la IA

por Pushkar P. Apte y Costas J. Spanos

Resumen Sin embargo, en muchos de estos casos, esta deficiencia se puede abordar utilizando cuatro técnicas para ayudar a la IA a comprender mejor el mundo físico: sinergizar la IA con las leyes científicas, aumentar los datos con conocimientos humanos expertos, emplear dispositivos para explicar cómo la IA toma decisiones y utilizar otros modelos para predecir el comportamiento. • • • La inteligencia artificial (IA) obtiene su «inteligencia» analizando un conjunto de datos determinado y detectando patrones. No tiene ningún concepto del mundo más allá de este conjunto de datos, lo que crea una variedad de peligros. Un píxel cambiado podría confundir al sistema de IA para pensar que un caballo es una rana o, aún más aterrador, errar en un diagnóstico médico o en una operación de una máquina. Su dependencia exclusiva de los conjuntos de datos también introduce una grave vulnerabilidad de seguridad: los agentes malintencionados pueden suplantar el algoritmo de IA introduciendo cambios menores y casi indetectables en los datos. Por último, el sistema de IA no sabe lo que no sabe, y puede hacer predicciones incorrectas con un alto grado de confianza. Añadir más datos no siempre puede superar estos problemas, porque las limitaciones técnicas y empresariales prácticas siempre limitan la cantidad de datos. Y el procesamiento de grandes conjuntos de datos requiere modelos de IA cada vez más grandes que superen al hardware disponible y aumentar la huella de carbono de la IA de manera insostenible. Hemos identificado una solución alternativa: conectar la IA basada en datos con otras aportaciones científicas o humanas sobre el dominio de la aplicación. Se basa en nuestras dos décadas de experiencia en la Universidad de California, Centro de Investigación en Tecnología de la Información en Interés de la Sociedad y el Instituto Banatao (CITRIS) en el trabajo con académicos y ejecutivos de negocios para implementar la IA en muchas aplicaciones. Hay cuatro maneras en que se puede hacer.

1. Sinergia de la IA con las leyes científicas

Podemos combinar los datos disponibles con las leyes pertinentes de la física, la química y la biología para aprovechar las fortalezas y superar las debilidades de cada una. Un ejemplo es un proyecto en curso con Komatsu donde estamos explorando cómo utilizar la IA para guiar el funcionamiento autónomo y eficiente de los equipos de excavación pesados. A la IA le va bien en el funcionamiento de la máquina, pero no tan bien en la comprensión del entorno circundante. Por lo tanto, para enseñar al algoritmo de IA las diferencias entre suelo blando, grava y roca dura en el terreno que se está excavando, utilizamos modelos basados en la física que describen el tamaño, la distribución, la dureza y el contenido de agua de las partículas. Equipada con este conocimiento, la máquina impulsada por IA puede aplicar la cantidad justa de fuerza para agarrar un balde lleno de tierra de manera eficiente y segura. Del mismo modo, utilizamos la IA para operar un brazo quirúrgico robótico y, luego, lo combinamos con un modelo basado en la física que predice cómo se deformarán la piel y el tejido bajo presión. En ambos casos, ya sea terrestre o tisular, la combinación de modelos basados en datos y basados en la física hace que la operación sea más segura, rápida y eficiente.

2. Aumente los datos con conocimientos humanos de expertos

Cuando los datos disponibles son limitados, la intuición humana se puede utilizar para aumentar y mejorar la «inteligencia» de la IA. Por ejemplo, en el campo de la fabricación avanzada, es extremadamente caro y desafiante desarrollar «recetas de proceso» novedosas necesarias para crear un nuevo producto. Los datos sobre procesos nuevos son limitados o simplemente no existen, y generarlos requeriría muchos intentos de ensayo y error que pueden llevar muchos meses y costar millones de dólares. Una forma más eficaz es que los humanos y la IA se aumenten y se apoyen mutuamente, según Investigación Lam, un fabricante líder de equipos semiconductores que suministra instalaciones de fabricación de microelectrónica de última generación. Empezando desde cero, a los ingenieros con mucha experiencia les suele ir bien llegar a una receta aproximadamente correcta, mientras que la IA recopila datos continuamente y aprende de esos esfuerzos. Una vez que la receta esté en el estadio, los ingenieros pueden solicitar a la IA que les ayude a perfeccionarla hasta un óptimo preciso. Estas técnicas pueden proporcionar una mejora de la eficiencia de hasta un orden de magnitud.

3. Emplee dispositivos para explicar cómo la IA toma las decisiones

En la novela de ciencia ficción La Guía del autoestopista galáctico el ordenador más inteligente dio 42 como respuesta a «la vida, el universo y todo», lo que provocó que muchos lectores se rieran entre dientes. Sin embargo, no es motivo de risa para las empresas, porque la IA suele funcionar como una caja negra que hace recomendaciones seguras sin explicar por qué. Si la forma en que la IA toma las decisiones no es explicable, normalmente no se puede actuar. Un médico no debería hacer un diagnóstico médico y un ingeniero de servicios no debería cerrar una parte crítica de la infraestructura basándose en una recomendación de IA que no puedan explicar de forma intuitiva. Por ejemplo, estamos trabajando en una aplicación de infraestructura inteligente en la que los sensores supervisan la integridad de miles de aerogeneradores. El algoritmo de IA que analiza estos datos puede arrojar una bandera roja cuando detecta un patrón de aumento de la temperatura o la intensidad de la vibración. Pero, ¿qué significa esto? ¿Es solo un día caluroso o una ráfaga perdida de viento fuerte? ¿O es necesario que un equipo de servicios públicos se apresure (una operación costosa) de inmediato? Nuestra solución: añadir sensores de fibra óptica para medir la deformación física real en el material de la turbina. Luego, cuando los ingenieros de servicios públicos cotejen la bandera roja de la IA con la cepa real en la pala de la turbina, pueden determinar la verdadera urgencia del problema y elegir la acción correctiva más segura.

4. Utilice otros modelos para predecir el comportamiento

La IA basada en datos funciona bien dentro de los límites del conjunto de datos que ha procesado, analizando el comportamiento entreobservaciones reales, o interpolación. Sin embargo, para extrapolar — es decir, para predecir el comportamiento en los modos de funcionamiento fuera de los datos disponibles, tenemos que incorporar el conocimiento del dominio en cuestión. De hecho, este es a menudo el enfoque adoptado por muchas aplicaciones que emplean» gemelos digitales» para reflejar el funcionamiento de un sistema complejo, como un motor a reacción. Un gemelo digital es un modelo dinámico que refleja el estado exacto de un sistema real en todo momento y utiliza sensores para mantener el modelo actualizado en tiempo real. Lo usamos de manera efectiva en nuestro proyecto con Tecnología Siemens en gemelos digitales para edificios inteligentes. Empleamos IA basada en datos para modelar y controlar el funcionamiento normal del edificio y para diagnosticar problemas. Luego, mezclamos juiciosamente ecuaciones basadas en la física, como ecuaciones termodinámicas básicas que rastrean el flujo de calor hacia el sistema de aire acondicionado y los espacios habitables, para predecir el comportamiento del edificio en un entorno novedoso. Con este enfoque, podríamos predecir el comportamiento del edificio con diferentes equipos de calefacción o refrigeración o mientras funcionaba en condiciones meteorológicas inusuales. Esto nos permitió probar modos operativos alternativos sin poner en peligro la infraestructura crítica ni a sus usuarios. Descubrimos que este enfoque también funciona bien en otras aplicaciones, como la fabricación inteligente, la construcción y los vehículos autónomos que van desde automóviles hasta naves espaciales. Como humanos, entendemos el mundo que nos rodea utilizando nuestros sentidos en tándem. Dada una taza humeante, determinamos al instante que se trata de té por su color, olor y sabor. Los conocedores pueden ir un paso más allá e identificarlo como un té de «primera descarga de Darjeeling». Los algoritmos de IA están entrenados, y están limitados, por un conjunto de datos concreto y no tienen acceso a todos los «sentidos» como nosotros. Un algoritmo de IA entrenado únicamente en imágenes de tazas de café puede «ver» esta misma humeante taza de té y concluir que es café. Peor aún, ¡puede hacerlo con un alto grado de confianza! Cualquier conjunto de datos disponible siempre estará incompleto y procesar conjuntos de datos cada vez mayores no suele ser práctico ni sostenible para el medio ambiente. En cambio, añadir otras formas de comprensión del dominio en cuestión puede ayudar a que la IA basada en datos sea más segura y eficiente y permitirle abordar desafíos que de otro modo no podría.