Cómo la IA cambiará la forma en que tomamos decisiones

Resumen.
Los avances recientes en IA se consideran mejor como una disminución en el costo de la predicción. La predicción es útil porque ayuda a mejorar las decisiones. Pero no es la única entrada en la toma de decisiones; la otra aportación clave es el juicio. El juicio es el proceso de determinar cuál es la recompensa a una acción en particular en un entorno particular. En muchos casos, especialmente en el corto plazo, los seres humanos tendrán que ejercer este tipo de juicio. Se especializarán en sopesar los costos y beneficios de diferentes decisiones, y luego ese juicio se combinará con predicciones generadas por máquina para tomar decisiones. Pero, ¿no podría la IA calcular costos y beneficios por sí misma? Sí, pero alguien habría tenido que programar la IA en cuanto a cuál es la medida de ganancia apropiada. Esto pone de relieve una forma particular de juicio humano que creemos será a la vez más común y más valiosa.

Con la reciente explosión de la IA, ha habido una preocupación comprensible acerca de su posible impacto en el trabajo humano. Mucha gente ha intentado predecir qué industrias y puestos de trabajo se verán más afectados, y qué habilidades serán las más demandadas. (¿Debería aprender a codificar? ¿O la IA reemplazará también a los codificadores?)
En lugar de tratar de predecir detalles, sugerimos un enfoque alternativo. La teoría económica sugiere que la IA aumentará sustancialmente el valor del juicio humano. Las personas que muestren buen juicio se volverán más valiosas, no menos. Pero para entender lo que implica el buen juicio y por qué será más valioso, tenemos que ser precisos sobre lo que queremos decir.
Qué hace la IA y por qué es útil
Los avances recientes en IA se consideran mejor como una caída en el costo de la predicción. Por predicción, no nos referimos solo al futuro: la predicción consiste en usar datos que usted tiene que generar datos que no tiene, a menudo traduciendo grandes cantidades de datos en cantidades pequeñas y manejables. Por ejemplo, el uso de imágenes divididas en partes para detectar si la imagen contiene o no un rostro humano es un problema clásico de predicción. La teoría económica nos dice que a medida que disminuye el costo de la predicción de la máquina, las máquinas harán más y más predicción.
La predicción es útil porque ayuda a mejorar las decisiones. Pero no es la única entrada en la toma de decisiones; la otra aportación clave es el juicio. Considere el ejemplo de una red de tarjetas de crédito que decide si aprueba o no cada transacción intentada. Quieren permitir transacciones legítimas y rechazar el fraude. Utilizan IA para predecir si cada intento de transacción es fraudulenta. Si tales predicciones fueran perfectas, el proceso de decisión de la red es fácil. Rechazar si existe fraude y sólo si existe.
Sin embargo, incluso las mejores AI cometen errores, y es poco probable que cambie pronto. Las personas que han manejado las redes de tarjetas de crédito saben por experiencia que existe una compensación entre detectar cada caso de fraude y molestias al usuario. (¿Alguna vez has tenido una tarjeta rechazada cuando intentaste usarla mientras viajabas?) Y como la conveniencia es todo el negocio de las tarjetas de crédito, esa compensación no es algo a ignorar.
Esto significa que para decidir si aprueba una transacción, la red de tarjetas de crédito debe conocer el costo de los errores. ¿Qué tan malo sería rechazar una transacción legítima? ¿Qué tan malo sería permitir una transacción fraudulenta?
Alguien de la asociación de tarjetas de crédito debe evaluar cómo se ve afectada toda la organización cuando se deniega una transacción legítima. Tienen que contrarrestar eso con los efectos de permitir una transacción fraudulenta. Y esa compensación puede ser diferente para individuos de alto valor neto que para usuarios ocasionales de tarjetas. Ninguna IA puede hacer esa llamada. Los humanos tienen que hacerlo. Esta decisión es lo que llamamos juicio.
Qué conlleva el juicio
El juicio es el proceso de determinar cuál es la recompensa a una acción en particular en un entorno particular. El juicio es cómo calculamos los beneficios y costos de diferentes decisiones en diferentes situaciones.
El fraude con tarjetas de crédito es una decisión fácil de explicar a este respecto. El juicio implica determinar cuánto dinero se pierde en una transacción fraudulenta, cuán infeliz será un cliente legítimo cuando se rechaza una transacción, así como la recompensa por hacer lo correcto y permitir transacciones buenas y declinar las malas. En muchas otras situaciones, las compensaciones son más complejas, y los beneficios no son sencillos. Los humanos aprenden los beneficios a diferentes resultados por experiencia, tomando decisiones y observando sus errores.
Conseguir los pagos correctos es difícil. Requiere comprender lo que más le importa a su organización, de qué se beneficia y de lo que podría salir mal.
En muchos casos, especialmente en el corto plazo, los seres humanos tendrán que ejercer este tipo de juicio. Se especializarán en sopesar los costos y beneficios de diferentes decisiones, y luego ese juicio se combinará con predicciones generadas por máquina para tomar decisiones.
Pero, ¿no podría la IA calcular costos y beneficios por sí misma? En el ejemplo de la tarjeta de crédito, ¿no podría AI usar los datos de los clientes para considerar la compensación y optimizar con fines de lucro? Sí, pero alguien habría tenido que programar la IA en cuanto a cuál es la medida de ganancia apropiada. Esto pone de relieve una forma particular de juicio humano que creemos será a la vez más común y más valiosa.
Establecer las recompensas correctas
Al igual que las personas, las AI también pueden aprender de la experiencia. Una técnica importante en IA es el aprendizaje de refuerzo mediante el cual una computadora está entrenada para tomar acciones que maximicen una determinada función de recompensa. Por ejemplo, AlpHago de DeepMind fue entrenado de esta manera para maximizar sus posibilidades de ganar el juego de Go. Los juegos a menudo son fáciles de aplicar este método de aprendizaje porque la recompensa puede ser fácilmente descrita y programada — cerrar a un humano del bucle.
Pero los juegos pueden ser engañados. Como Alámbrico informes, cuando los investigadores de IA entrenaron una IA para jugar el juego de carreras de barcos, CoaStrunners, la IA descubrió cómo maximizar su puntuación dando vueltas en círculos en lugar de completar el curso como se pretendía. Uno podría considerar este ingenio de un tipo, pero cuando se trata de aplicaciones más allá de los juegos este tipo de ingenio puede conducir a resultados perversos.
El punto clave del ejemplo de CoaStrunners es que en la mayoría de las aplicaciones, el objetivo dado a la IA difiere del objetivo verdadero y difícil de medir de la organización. Mientras ese sea el caso, los seres humanos jugarán un papel central en el juicio y, por lo tanto, en la toma de decisiones organizativas.
De hecho, incluso si una organización está permitiendo que la IA tome ciertas decisiones, obtener los beneficios adecuados para la organización en su conjunto requiere una comprensión de cómo las máquinas toman esas decisiones. ¿Qué tipos de errores de predicción son probables? ¿Cómo podría una máquina aprender el mensaje equivocado?
Introduzca Ingeniería de funciones de recompensa. A medida que las AI sirven predicciones mejores y más baratas, es necesario pensar claramente y encontrar la mejor manera de utilizar esas predicciones. La ingeniería de funciones de recompensa es el trabajo de determinar las recompensas de varias acciones, dadas las predicciones hechas por la IA. Ser excelente en esto requiere tener una comprensión de las necesidades de la organización y las capacidades de la máquina. (Y es no lo mismo que poner a un humano en el bucle para ayudar a entrenar la IA).
A veces, la ingeniería de funciones de recompensa implica programar las recompensas antes de las predicciones para que las acciones puedan ser automatizadas. Los vehículos autónomos son un ejemplo de este tipo de recompensas codificadas. Una vez que se hace la predicción, la acción es instantánea. Pero como ilustra el ejemplo de CoaStrunners, obtener la recompensa correcta no es trivial. La ingeniería de funciones de recompensa tiene que considerar la posibilidad de que la IA se optimice en exceso en una métrica del éxito y, al hacerlo, actúe de una manera que sea incompatible con los objetivos más amplios de la organización.
En otras ocasiones, tal codificación dura de las recompensas es demasiado difícil. Puede haber tantas predicciones posibles que es demasiado costoso para cualquiera juzgar todas las posibles recompensa por adelantado. En cambio, algunos humanos necesitan esperar a que llegue la predicción, y luego evaluar la payoff. Esto está más cerca de cómo funciona la mayoría de la toma de decisiones en la actualidad, ya sea que incluya o no predicciones generadas por máquina. La mayoría de nosotros ya hacemos algo de ingeniería de funciones de recompensa, pero para los humanos, no para máquinas. Los padres enseñan a sus hijos valores. Los mentores enseñan a los nuevos trabajadores cómo funciona el sistema. Los gerentes dan objetivos a su personal y luego los ajustan para obtener un mejor rendimiento. Todos los días tomamos decisiones y juzgamos las recompensas. Pero cuando hacemos esto por los humanos, la predicción y el juicio se agrupan, y el papel distintivo de la Ingeniería de Funciones de Recompensa no ha tenido que estar explícitamente separado.
A medida que las máquinas mejoran en la predicción, el valor distintivo de la Ingeniería de Funciones de Recompensa aumentará a medida que la aplicación del juicio humano se vuelve central.
En general, ¿la predicción de la máquina disminuirá o aumentará la cantidad de trabajo disponible para los humanos en la toma de decisiones? Es demasiado pronto para decirlo. Por un lado, la predicción de máquinas sustituirá a la predicción humana en la toma de decisiones. Por otro lado, la predicción de la máquina es un complemento del juicio humano. Y una predicción más barata generará más demanda de toma de decisiones, por lo que habrá más oportunidades para ejercer el juicio humano. Por lo tanto, aunque es demasiado pronto para especular sobre el impacto general en los puestos de trabajo, no cabe duda de que pronto seremos testigos de un gran florecimiento de la demanda de juicio humano en forma de Ingeniería de Funciones de Recompensa.
— Escrito por Ajay Agrawal, Avi Goldfarb Ajay Agrawal,