Ruido: cómo superar el alto costo oculto de la toma de decisiones incoherente
Resumen.
Las organizaciones esperan ver coherencia en las decisiones de sus empleados, pero los humanos no son fiables. Los juicios pueden variar mucho de un individuo a otro, incluso cuando las personas desempeñan el mismo papel y supuestamente siguen las mismas pautas. Y los factores irrelevantes, como el estado de ánimo y el clima, pueden cambiar las decisiones de una persona de vez en cuando. Esta variabilidad casual de las decisiones se denomina ruido, y resulta sorprendentemente costoso para las empresas, que por lo general no lo saben por completo.
El premio Nobel Daniel Kahneman, profesor de psicología en Princeton, y Andrew M. Rosenfield, Linnea Gandhi y Tom Blaser de TGG Group explican cómo las organizaciones pueden realizar una auditoría de ruido haciendo que los miembros de una unidad profesional evalúen un conjunto común de casos. El grado en que varían sus evaluaciones proporciona la medida del ruido. Si el problema es grave, las empresas pueden recurrir a una serie de soluciones. Lo más radical es sustituir el juicio humano por algoritmos. A diferencia de las personas, los algoritmos siempre devuelven el mismo resultado para cualquier entrada dada, y las investigaciones muestran que sus predicciones y decisiones suelen ser más precisas que las de los expertos.
Aunque puede parecer desalentador construir algoritmos, los autores describen cómo construirlos con datos de entrada en un pequeño número de casos y algunas reglas simples de sentido común. Pero si aplicar fórmulas es inviable desde el punto de vista político u operativo, las empresas pueden seguir estableciendo procedimientos y prácticas que guíen a los empleados a tomar decisiones más coherentes.
Idea en resumen
El problema
Muchas organizaciones esperan consistencia de sus empleados profesionales. Sin embargo, el juicio humano suele estar influenciado por factores tan irrelevantes como el clima y el último caso visto. Lo que es más importante, las decisiones a menudo varían de un empleado a otro. La variabilidad casual de los juicios se denomina ruido, y resulta sorprendentemente costoso para las empresas.
El punto de partida
Los gerentes deben realizar una auditoría de ruido en la que los miembros de una unidad, trabajando de forma independiente, evalúen un conjunto común de casos. El grado en que varían sus decisiones es la medida del ruido. A menudo será mucho más alto de lo que anticipan los ejecutivos.
La solución
La solución más radical a un grave problema de ruido es sustituir el juicio humano por algoritmos. Los algoritmos no son difíciles de construir, pero a menudo son inviables desde el punto de vista político u operacional. En tales casos, las empresas deben establecer procedimientos para ayudar a los profesionales a lograr una mayor coherencia.
En una empresa global de servicios financieros con la que trabajamos, un cliente desde hace mucho tiempo envió accidentalmente el mismo archivo de solicitud a dos oficinas. Aunque los empleados que revisaron el expediente debían seguir las mismas pautas y, por lo tanto, llegar a resultados similares, las oficinas separadas devolvieron cotizaciones muy diferentes. El cliente, sorprendido, entregó el negocio a un competidor. Desde el punto de vista de la empresa, los empleados en el mismo puesto deberían haber sido intercambiables, pero en este caso no lo eran. Por desgracia, este es un problema común.
Los profesionales de muchas organizaciones son asignados arbitrariamente a casos: tasadores en agencias de calificación crediticia, médicos en salas de emergencia, aseguradores de préstamos y seguros, y otros. Las organizaciones esperan coherencia de estos profesionales: los casos idénticos deben tratarse de manera similar, si no idéntica. El problema es que los humanos son tomadores de decisiones poco fiables; sus juicios están fuertemente influenciados por factores irrelevantes, como su estado de ánimo actual, el tiempo transcurrido desde su última comida y el clima. Llamamos a la variabilidad casual de los juicios ruido. Es un impuesto invisible en el balance de muchas empresas.
Algunos trabajos están libres de ruidos. Los empleados de un banco o de una oficina de correos realizan tareas complejas, pero deben seguir reglas estrictas que limiten el juicio subjetivo y garanticen, por diseño, que los casos idénticos se tratarán de forma idéntica. Por el contrario, los profesionales médicos, los oficiales de préstamos, los gerentes de proyectos, los jueces y los ejecutivos hacen decisiones, que se guían por la experiencia informal y los principios generales en lugar de por reglas rígidas. Y si no llegan exactamente a la misma respuesta que cualquier otra persona en su función, es aceptable; esto es lo que queremos decir cuando decimos que una decisión es «una cuestión de juicio». Una empresa cuyos empleados ejercen su criterio no espera que las decisiones estén totalmente libres de ruido. Pero a menudo el ruido es muy por encima el nivel que los ejecutivos considerarían tolerable, y lo desconocen por completo.
La prevalencia del ruido se ha demostrado en varios estudios. Los investigadores académicos han confirmado en repetidas ocasiones que los profesionales a menudo contradicen sus propios juicios anteriores cuando se les dan los mismos datos en diferentes ocasiones. Por ejemplo, cuando a los desarrolladores de software se les pidió en dos días distintos que estimaran el tiempo de finalización de una tarea determinada, las horas que proyectaron difirieron en un 71%, en promedio. Cuando los patólogos realizaron dos evaluaciones de la gravedad de los resultados de la biopsia, la correlación entre sus calificaciones fue de solo 0,61 (de un 1,0 perfecto), lo que indica que fueron inconsistentes diagnostica con bastante frecuencia. Es aún más probable que los juicios emitidos por personas diferentes diverjan. Las investigaciones han confirmado que, en muchas tareas, las decisiones de los expertos son muy variables: valoración de acciones, tasar bienes raíces, condenar a criminales, evaluar el desempeño laboral, auditoría de estados financieros, y mucho más. La conclusión inevitable es que los profesionales suelen tomar decisiones que se desvían significativamente de las de sus pares, de sus propias decisiones anteriores y de las reglas que ellos mismos dicen seguir.
El ruido suele ser insidioso: hace que incluso las empresas exitosas pierdan cantidades sustanciales de dinero sin darse cuenta. ¿Qué tan sustancial? Para obtener una estimación, pedimos a los ejecutivos de una de las organizaciones que estudiamos lo siguiente: «Supongamos que la evaluación óptima de un caso es de 100.000 dólares. ¿Cuál sería el costo para la organización si el profesional a cargo del caso tasara un valor de 115.000 dólares? ¿Cuál sería el costo de evaluarlo en 85.000 dólares?» Las estimaciones de costos fueron elevadas. En conjunto a lo largo de las evaluaciones realizadas cada año, el costo del ruido se midió en miles de millones, cifra inaceptable incluso para una gran empresa global. El valor de reducir el ruido incluso en unos pocos puntos porcentuales sería de decenas de millones. Sorprendentemente, la organización había ignorado por completo la cuestión de la coherencia hasta entonces.
Desde hace tiempo se sabe que las predicciones y decisiones generadas por algoritmos estadísticos simples suelen ser más precisas que las realizadas por expertos, incluso cuando los expertos tienen acceso a más información que la que utilizan las fórmulas. Es menos conocido que la ventaja clave de los algoritmos es que están libres de ruido: a diferencia de los humanos, una fórmula siempre devolverá el mismo resultado para cualquier entrada dada. La consistencia superior permite que incluso los algoritmos simples e imperfectos logren una mayor precisión que los profesionales humanos. (Por supuesto, hay ocasiones en que los algoritmos serán inviables desde el punto de vista operativo o político, como discutiremos).
En este artículo explicamos la diferencia entre ruido y sesgo y analizamos cómo los ejecutivos pueden auditar el nivel y el impacto del ruido en sus organizaciones. A continuación, describimos un método barato y poco utilizado para crear algoritmos que corrigen el ruido, y esbozamos procedimientos que pueden promover la coherencia cuando los algoritmos no son una opción.
Ruido vs. sesgo
Cuando las personas consideran errores en el juicio y en la toma de decisiones, lo más probable es que piensen en sesgos sociales como los estereotipos de las minorías o en sesgos cognitivos como el exceso de confianza y el optimismo infundado. La variabilidad inútil que llamamos ruido es un tipo de error diferente. Para apreciar la distinción, piensa en tu báscula de baño. Diríamos que la escala es tendencioso si sus lecturas son generalmente demasiado altas o demasiado bajas. Si su peso parece depender de dónde coloque los pies, la báscula es ruidoso. Una báscula que subestima constantemente el peso real en exactamente cuatro libras está seriamente sesgada pero libre de ruido. Una báscula que da dos lecturas diferentes cuando la pisas dos veces es ruidosa. Muchos errores de medición surgen de una combinación de sesgo y ruido. La mayoría de las básculas de baño económicas son algo sesgadas y bastante ruidosas.

Para obtener una ilustración visual de la distinción, considere los objetivos de la exposición «Cómo afectan el ruido y el sesgo a la precisión». Estos muestran los resultados de la práctica de tiro para equipos de cuatro personas en los que cada individuo dispara una sola vez.
- El equipo A es preciso: Los disparos de los compañeros de equipo están en el blanco y cerca uno del otro.
Los otros tres equipos son inexactos pero de formas distintivas:
- El equipo B es ruidoso: Las tomas de sus miembros se centran alrededor de la diana pero están muy dispersas.
- El equipo C es sesgado: Todos los disparos fallaron en el blanco, pero se juntaron.
- El equipo D es ambos ruidoso y sesgado.
Como muestra una comparación de los equipos A y B, un aumento del ruido siempre perjudica la precisión cuando no hay sesgo. Cuando hay sesgo, el aumento del ruido puede causar un golpe de suerte, como sucedió con el equipo D. Por supuesto, ninguna organización pondría su confianza en la suerte. El ruido siempre es indeseable y, a veces, desastroso.
Obviamente, es útil para una organización conocer los sesgos y el ruido en las decisiones de sus empleados, pero recopilar esa información no es sencillo. En la medición de estos errores surgen distintos problemas. Un problema importante es que los resultados de las decisiones a menudo no se conocen hasta muy lejano en el futuro, si es que se conocen. Los agentes de préstamos, por ejemplo, con frecuencia deben esperar varios años para ver cómo funcionan los préstamos que aprobaron y casi nunca saben qué sucede con un solicitante al que rechazan.
Donde hay juicio, hay ruido y, por lo general, más de lo que piensas.
A diferencia del sesgo, el ruido se puede medir sin saber cuál sería una respuesta precisa. Para ilustrar, imagina que los objetivos a los que apuntaban los tiradores fueron borrados de la exhibición. No sabrías nada sobre la precisión general de los equipos, pero podías estar seguro de que algo andaba mal con los disparos dispersos de los equipos B y D: Dondequiera que estuviera el blanco, no todos estuvieron cerca de darle. Todo lo que se necesita para medir el ruido en los juicios es un experimento sencillo en el que varios profesionales evalúan de forma independiente algunos casos realistas. Una vez más, la dispersión de los juicios se puede observar sin saber la respuesta correcta. A estos experimentos los llamamos auditorías de ruido.
Realización de una auditoría de ruido
El objetivo de una auditoría de ruido no es producir un informe. El objetivo final es mejorar la calidad de las decisiones, y una auditoría solo puede tener éxito si los líderes de la unidad están preparados para aceptar resultados desagradables y actuar en consecuencia. Esta aceptación es más fácil de lograr si los ejecutivos ven el estudio como una creación propia. Para ello, los casos deben ser compilados por miembros respetados del equipo y deben cubrir la gama de problemas que suelen surgir. Para que los resultados sean relevantes para todos, todos los miembros de la unidad deben participar en la auditoría. Un científico social con experiencia en la realización de rigurosos experimentos conductuales debe supervisar los aspectos técnicos de la auditoría, pero la unidad profesional debe ser la dueña del proceso.
Recientemente, ayudamos a dos organizaciones de servicios financieros a realizar auditorías de ruido. Los deberes y la experiencia de los dos grupos que estudiamos eran muy diferentes, pero ambos requerían la evaluación de materiales moderadamente complejos y a menudo implicaban decisiones de cientos de miles de dólares. Seguimos el mismo protocolo en ambas organizaciones. En primer lugar, pedimos a los gerentes de los equipos profesionales involucrados que construyeran varios expedientes de casos realistas para su evaluación. Para evitar que se filtre información sobre el experimento, todo el ejercicio se realizó el mismo día. Se pidió a los empleados que dedicaran aproximadamente la mitad del día a analizar de dos a cuatro casos. Deben decidir una cantidad en dólares para cada uno, como en su rutina normal. Para evitar la colusión, no se les dijo a los participantes que el estudio estaba preocupado por la fiabilidad. En una organización, por ejemplo, los objetivos se describieron como comprender el pensamiento profesional de los empleados, aumentar la utilidad de sus herramientas y mejorar la comunicación entre colegas. Participaron unos 70 profesionales de la organización A y unos 50 de la organización B.
Tipos de ruido y sesgo
El sesgo y el ruido son distintos tipos de error. Cada uno viene en variantes diferentes y requiere diferentes acciones correctivas. | ||
TIPO DE SESGO | EJEMPLOS | ACCIONES CORRECTIVAS |
GENERAL El juicio promedio es erróneo. |
Falacia de planificación: las previsiones de resultados son en su mayoría optimistas Aversión excesiva al riesgo: una empresa de capital riesgo rechaza demasiadas inversiones prometedoras pero arriesgadas |
Supervisión continua de las decisiones Directrices y objetivos para la frecuencia de determinados resultados (como las aprobaciones de préstamos) Eliminar los incentivos que favorecen los sesgos |
SOCIAL La discriminación se produce contra o para ciertas categorías de casos. |
Denegación frecuente de crédito a solicitantes calificados de ciertos grupos étnicos Sesgo de género en las evaluaciones del desempeño laboral |
Estadísticas de seguimiento para diferentes grupos Cegamiento de aplicaciones Métricas objetivas y cuantificables Canales abiertos para quejas Directrices y formación |
COGNITIVO Las decisiones están fuertemente influenciadas por factores irrelevantes o insensibles a los relevantes. |
Efectos excesivos de las primeras impresiones Efectos de los presentadores (como una oferta de apertura en negociación) Desatención miope de las consecuencias futuras |
Capacitar a los empleados para detectar situaciones en las que es probable que se produzcan sesgos Críticas a decisiones importantes, centradas en sesgos probables |
TIPO DE RUIDO | EJEMPLOS | ACCIONES CORRECTIVAS |
VARIABILIDAD EN TODAS LAS OCASIONES Las decisiones varían cuando el mismo caso se presenta más de una vez a la misma persona. |
Los juicios de un oficial de contratación sobre un expediente están influenciados por su estado de ánimo o la calidad del solicitante anterior |
Algoritmos para sustituir el juicio humano Listas de comprobación que fomentan un enfoque coherente de las decisiones |
VARIABILIDAD ENTRE INDIVIDUOS Los profesionales del mismo rol toman decisiones diferentes. |
Algunas personas son generalmente más indulgentes que otras Algunas personas son más cautelosas que otras |
Algoritmos para sustituir el juicio humano Seguimiento frecuente de las decisiones de las personas Mesas redondas en las que se exploran y resuelven las diferencias Listas de comprobación que fomentan un enfoque coherente de las decisiones |
Desde «NOISE», OCTUBRE 2016 | © HBR.ORG |
Construimos un índice de ruido para cada caso, que respondió a la siguiente pregunta: «¿En qué medida difieren los juicios de dos empleados elegidos aleatoriamente?» Expresamos esta cantidad como porcentaje de su promedio. Supongamos que las evaluaciones de un caso por dos empleados son de 600 y 1.000 dólares. El promedio de sus evaluaciones es de 800 dólares y la diferencia entre ellos es de 400 dólares, por lo que el índice de ruido es del 50% para este par. Realizamos el mismo cálculo para todos los pares de empleados y luego calculamos un índice de ruido promedio general para cada caso.
Las entrevistas previas a la auditoría con ejecutivos de las dos organizaciones indicaron que esperaban que las diferencias entre las decisiones de sus profesionales oscile entre el 5% y el 10%, un nivel que consideraban aceptable para «cuestiones de juicio». Los resultados fueron impactantes. El índice de ruido osciló entre el 34% y el 62% para los seis casos de la organización A, y el promedio general fue del 48%. En los cuatro casos de la organización B, el índice de ruido osciló entre el 46% y el 70%, con una media del 60%. Tal vez lo más decepcionante, la experiencia en el trabajo no pareció reducir el ruido. Entre los profesionales con cinco o más años de trabajo, el desacuerdo promedio fue del 46% en la organización A y del 62% en la organización B.
Nadie lo había visto venir. Pero debido a que eran dueños del estudio, los ejecutivos de ambas organizaciones aceptaron la conclusión de que los juicios de sus profesionales no eran fiables hasta un punto que no podía tolerarse. Todos acordaron rápidamente que había que hacer algo para controlar el problema.
Debido a que los hallazgos eran coherentes con investigaciones anteriores sobre la baja fiabilidad del juicio profesional, no nos sorprendieron. El mayor rompecabezas para nosotros era el hecho de que ninguna organización había considerado que la fiabilidad fuera un problema.
El problema del ruido es prácticamente invisible en el mundo de los negocios; hemos observado que el público se sorprende bastante cuando se menciona como un problema la fiabilidad del juicio profesional. ¿Qué impide a las empresas reconocer que los juicios de sus empleados son ruidosos? La respuesta radica en dos fenómenos familiares: los profesionales experimentados tienden a tener una gran confianza en la exactitud de sus propios juicios y también tienen un gran aprecio por la inteligencia de sus colegas. Esta combinación conduce inevitablemente a una sobreestimación del acuerdo. Cuando se les pregunta qué dirían sus colegas, los profesionales esperan que los juicios de los demás sean mucho más cercanos a los suyos de lo que realmente son. La mayoría de las veces, por supuesto, los profesionales experimentados no se preocupan por lo que otros puedan pensar y simplemente asumen que la suya es la mejor respuesta. Una razón por la que el problema del ruido es invisible es que la gente no pasa por la vida imaginando alternativas plausibles a cada juicio que emite.
La expectativa de que los demás estén de acuerdo contigo a veces está justificada, sobre todo cuando los juicios son tan hábiles que son intuitivos. El ajedrez y la conducción de alto nivel son ejemplos estándar de tareas que se han practicado casi a la perfección. Los jugadores maestros que observen una situación en un tablero de ajedrez tendrán valoraciones muy similares del estado del juego, digamos si la reina blanca está en peligro o si la defensa del lado rey de las negras es débil. Lo mismo ocurre con los conductores. Negociar el tráfico sería increíblemente peligroso si no pudiéramos suponer que los conductores que nos rodean comparten nuestra comprensión de las prioridades en las intersecciones y rotondas. Hay poco o ningún ruido en los niveles altos de habilidad.
La alta habilidad se desarrolla en el ajedrez y la conducción a través de años de práctica en un entorno predecible, en el que las acciones van seguidas de una retroalimentación inmediata y clara. Desafortunadamente, pocos profesionales operan en un mundo así. En la mayoría de los trabajos, las personas aprenden a emitir juicios por parte de los auditores y colegas que explican y critican, una fuente de conocimiento mucho menos fiable que aprender de los propios errores. La larga experiencia en un trabajo siempre aumenta la confianza de las personas en sus juicios, pero en ausencia de una retroalimentación rápida, la confianza no garantiza la precisión ni el consenso.
Ofrecemos este aforismo en resumen: Donde hay juicio, hay ruido y, por lo general, más de lo que piensas. Por regla general, creemos que ni los profesionales ni sus gerentes pueden hacer una buena conjetura sobre la fiabilidad de sus juicios. La única forma de obtener una evaluación precisa es realizar una auditoría del ruido. Y al menos en algunos casos, el problema será lo suficientemente grave como para requerir acción.
Reducción del ruido
La solución más radical al problema del ruido es reemplazar el juicio humano por reglas formales, conocidas como algoritmos, que utilizan los datos sobre un caso para producir una predicción o una decisión. Las personas han competido contra algoritmos en varios cientos de concursos de precisión durante los últimos 60 años, en tareas que van desde predecir la esperanza de vida de pacientes con cáncer para predecir el éxito de estudiantes de posgrado. Los algoritmos fueron más precisos que los profesionales humanos en aproximadamente la mitad de los estudios, y se relacionaron aproximadamente con el humanos en los demás. Los empates también deberían contar como victorias para los algoritmos, que son más rentables.
En muchas situaciones, por supuesto, los algoritmos no serán prácticos. La aplicación de una regla puede no ser factible cuando las entradas son idiosincrásicas o difíciles de codificar en un formato coherente. También es menos probable que los algoritmos sean útiles para sentencias o decisiones que implican múltiples dimensiones o dependen de la negociación con otra parte. Incluso cuando una solución algorítmica está disponible en principio, las consideraciones organizativas a veces impiden la implementación. La sustitución de los empleados existentes por software es un proceso doloroso que encontrará resistencia a menos que libera a esos empleados para tareas más agradables.
Pero si las condiciones son las adecuadas, desarrollar e implementar algoritmos puede ser sorprendentemente fácil. La suposición común es que los algoritmos requieren un análisis estadístico de grandes cantidades de datos. Por ejemplo, la mayoría de las personas con las que hablamos creen que los datos sobre miles de solicitudes de préstamos y sus resultados son necesarios para desarrollar una ecuación que prediga los incumplimientos de los préstamos comerciales. Muy pocos saben que se pueden desarrollar algoritmos adecuados sin ningún dato de resultados y con información de entrada solo en un pequeño número de casos. Las fórmulas predictivas que se crean sin datos de resultados las denominamos «reglas razonadas» porque se basan en un razonamiento de sentido común.
La construcción de una regla razonada comienza con la selección de unas pocas variables (quizás de seis a ocho) que están indiscutiblemente relacionadas con el resultado que se predice. Si el resultado es el impago del préstamo, por ejemplo, los activos y pasivos seguramente se incluirán en la lista. El siguiente paso es asignar a estas variables el mismo peso en la fórmula de predicción, poniendo su signo en la dirección obvia (positiva para los activos, negativa para los pasivos). La regla se puede construir con unos cuantos cálculos sencillos.
Cómo crear una regla razonada
No necesitas datos de resultados para crear algoritmos predictivos útiles. Por ejemplo, puede crear una regla razonada que prediga los incumplimientos de los préstamos con bastante eficacia sin saber qué pasó con los préstamos anteriores; todo lo que necesita es un pequeño conjunto de solicitudes de préstamo recientes. Estos son los siguientes pasos:
1. Seleccione de seis a ocho variables distintas y obviamente relacionadas con el resultado previsto. Los activos e ingresos (ponderados positivamente) y los pasivos (ponderados negativamente) seguramente se incluirían, junto con algunas otras características de las solicitudes de préstamo.
2. Toma los datos de tu conjunto de casos (todas las solicitudes de préstamo del año pasado) y calcula la media y la desviación estándar de cada variable de ese conjunto.
3. Para cada caso del conjunto, calcule una «puntuación estándar» para cada variable: la diferencia entre el valor del caso y la media de todo el conjunto, dividida por la desviación estándar. Con las puntuaciones estándar, todas las variables se expresan en la misma escala y se pueden comparar y promediar.
4. Calcule una «puntuación de resumen» para cada caso: el promedio de las puntuaciones estándar de sus variables. Este es el resultado de la regla razonada. La misma fórmula se utilizará para los casos nuevos, utilizando la media y la desviación estándar del conjunto original y actualizándose periódicamente.
5. Ordene los casos del conjunto de puntuaciones de resumen altas a bajas y determine las acciones apropiadas para diferentes rangos de puntuaciones. Con las solicitudes de préstamos, por ejemplo, las acciones podrían ser «el 10% superior de los solicitantes recibirán un descuento» y «el 30% inferior será rechazado».
Ahora estás listo para aplicar la regla a nuevos casos. El algoritmo calculará una puntuación resumida para cada nuevo caso y generará una decisión.
El resultado sorprendente de muchas investigaciones es que, en muchos contextos, las reglas razonadas son tan precisas como los modelos estadísticos construidos con datos de resultados. Los modelos estadísticos estándar combinan un conjunto de variables predictivas, a las que se les asignan ponderaciones en función de su relación con los resultados previstos y entre sí. Sin embargo, en muchas situaciones, estos pesos son estadísticamente inestables y prácticamente no tienen importancia. Es probable que una regla sencilla que asigne ponderaciones iguales a las variables seleccionadas sea igual de válida. Los algoritmos que ponderan las variables por igual y no dependen de los datos de resultados han demostrado tener éxito en selección de personal, previsión electoral, predicciones sobre partidos de fútbol, y otras aplicaciones.
La conclusión aquí es que si planeas usar un algoritmo para reducir el ruido, no necesitas esperar los datos de resultados. Puede aprovechar la mayoría de los beneficios si utiliza el sentido común para seleccionar variables y la regla más sencilla posible para combinarlas.
Los estudios demuestran que los algoritmos funcionan mejor que los humanos en el papel de tomadores de decisiones.
Por supuesto, independientemente del tipo de algoritmo que se emplee, las personas deben mantener el control final. Los algoritmos deben monitorizarse y ajustarse para detectar cambios ocasionales en la población de casos. Los gerentes también deben vigilar las decisiones individuales y tener la autoridad para anular el algoritmo en casos claros. Por ejemplo, la decisión de aprobar un préstamo debe anularse provisionalmente si la empresa descubre que el solicitante ha sido detenido. Lo más importante es que los ejecutivos deben determinar cómo traducir la salida del algoritmo en acción. El algoritmo puede indicarle qué préstamos potenciales están en el 5% superior o en el 10% inferior de todas las solicitudes, pero alguien debe decidir qué hacer con esa información.
Los algoritmos se utilizan a veces como fuente intermedia de información para los profesionales que toman las decisiones finales. Un ejemplo es la Evaluación de la Seguridad Pública, una fórmula que se desarrolló para ayudar a los jueces estadounidenses a decidir si un acusado puede ser puesto en libertad en condiciones de seguridad en espera de juicio. En sus primeros seis meses de uso en Kentucky, la delincuencia entre los acusados en libertad preventiva disminuyó aproximadamente un 15%, mientras que el porcentaje de personas liberadas aumento previo al juicio. Es obvio en este caso que los jueces humanos deben conservar la autoridad final para las decisiones: el público se sorprendería al ver que se imparte justicia mediante una fórmula.
Por incómoda que la gente pueda estar con la idea, los estudios han demostrado que, si bien los humanos pueden proporcionar información útil a las fórmulas, los algoritmos funcionan mejor en el papel de decisor final. Si el único criterio es evitar errores, se debe recomendar encarecidamente a los administradores que anulen el algoritmo solo en circunstancias excepcionales.
Llevar la disciplina al juicio
Se debe considerar sustituir las decisiones humanas por un algoritmo siempre que los juicios profesionales sean ruidosos, pero en la mayoría de los casos esta solución será demasiado radical o simplemente poco práctica. Una alternativa es adoptar procedimientos que promuevan la coherencia asegurando que los empleados que desempeñan el mismo cargo utilicen métodos similares para buscar información, integrarla en una visión del caso y traducir esa visión en una decisión. Un examen exhaustivo de todo lo que se requiere para hacer eso está fuera del alcance de este artículo, pero podemos ofrecer algunos consejos básicos, con la importante salvedad de que inculcar disciplina en el juicio no es nada fácil.
La formación es crucial, por supuesto, pero incluso los profesionales formados juntos tienden a desviarse hacia su propia forma de hacer las cosas. Las empresas a veces combaten la deriva organizando mesas redondas en las que los tomadores de decisiones se reúnen para revisar Desafortunadamente, la mayoría de las mesas redondas se organizan de manera que sea demasiado fácil llegar a un acuerdo, porque los participantes convergen rápidamente en las opiniones expresadas primero o con mayor confianza. Para evitar un acuerdo tan fúrico, los participantes individuales en una mesa redonda deben estudiar el caso de forma independiente, formarse opiniones que estén dispuestos a defender y enviarlas al líder del grupo antes de la reunión. Estas mesas redondas proporcionarán efectivamente una auditoría del ruido, con el paso añadido de una discusión grupal en la que se exploran las diferencias de opinión.
Como alternativa o adición a las mesas redondas, se les deben ofrecer a los profesionales herramientas fáciles de usar, como listas de verificación y preguntas cuidadosamente formuladas, para guiarlos a medida que recopilan información sobre un caso, dictan juicios intermedios y formulan una decisión final. La variabilidad no deseada se produce en cada una de esas etapas, y las empresas pueden y deben probar cuánto la reducen esas herramientas. Lo ideal es que las personas que utilicen estas herramientas las vean como ayudas que les ayudan a hacer su trabajo de manera eficaz y económica. Desafortunadamente, nuestra experiencia sugiere que la tarea de construir herramientas de juicio que sean efectivas y fáciles de usar es más difícil de lo que muchos ejecutivos piensan. Controlar el ruido es difícil, pero esperamos que una organización que realice una auditoría y evalúe el costo del ruido en dólares concluya que vale la pena reducir la variabilidad aleatoria.
Nuestro objetivo principal en este artículo es introducir a los directivos en el concepto de ruido como fuente de errores y explicar cómo se diferencia del sesgo. El término «sesgo» ha entrado en la conciencia pública en la medida en que las palabras «error» y «sesgo» a menudo se usan indistintamente. De hecho, las mejores decisiones no se logran simplemente reduciendo los sesgos generales (como el optimismo) o los sesgos sociales y cognitivos específicos (como la discriminación contra las mujeres o los efectos de anclaje). Los ejecutivos preocupados por la exactitud también deben enfrentar la prevalencia de la inconsistencia en los juicios profesionales. El ruido es más difícil de apreciar que el sesgo, pero no es menos real ni menos costoso.
— Escrito por Daniel Kahneman, Linnea Gandhi, Tom Blaser Linnea Gandhi,