Una forma de reducir el sesgo de género en las evaluaciones de desempeño
Las ame o las odie, las evaluaciones del desempeño son elementos básicos del lugar de trabajo moderno. Sin embargo, las investigaciones muestran que las calificaciones cuantitativas del desempeño están lejos de ser objetivas; si bien pueden facilitar la tarea de comparar a los trabajadores a los gerentes, están plagadas de sesgos de género. Una solución podría ser simplemente cambiar la escala de valoración que utiliza para evaluar a los empleados. En un experimento en el que se comparó una escala de valoración de 10 puntos con una de 6 puntos, los investigadores descubrieron que las personas tenían la misma probabilidad de dar calificaciones altas a hombres y mujeres utilizando la escala de 6 puntos. Sin embargo, cuando se les presentaba una escala de 10 puntos, era mucho más probable que solo dieran 10 a los hombres. ¿Por qué? Las connotaciones culturales que tiene el número «10» y la forma en que su «excelencia» se codificó por género a lo largo del tiempo.
••• Las ame o las odie, las evaluaciones del desempeño son elementos básicos del lugar de trabajo moderno. Las calificaciones cuantitativas tienen[se promociona desde hace mucho](/2016/10/the-performance-management-revolution) como herramientas imparciales para medir la calidad de los trabajadores y garantizar la imparcialidad de las decisiones de ascenso y compensación. Sin embargo, investigaciones más recientes muestran que las calificaciones cuantitativas del desempeño están lejos de ser objetivas; si bien pueden facilitar la tarea de comparar a los trabajadores a los gerentes, están plagadas de prejuicios de género. Las investigaciones muestran constantemente que las personas dan a los hombres calificaciones de desempeño más altas que a las mujeres, incluso cuando sus calificaciones y comportamientos son[idéntico](http://www.oxfordscholarship.com/view/10.1093/acprof:oso/9780199755776.001.0001/acprof-9780199755776). Incluso los algoritmos de inteligencia artificial [prefiero a los hombres](https://www.reuters.com/article/us-amazon-com-jobs-automation-insight/amazon-scraps-secret-ai-recruiting-tool-that-showed-bias-against-women-idUSKCN1MK08G). Con el tiempo, estos sesgos perjudican las perspectivas profesionales de las mujeres y contribuyen a las brechas de género en[ganancias](https://www.journals.uchicago.edu/doi/10.1086/588738?mobileUi=0&) y la infrarrepresentación de las mujeres[en puestos de primer nivel](https://www.ncbi.nlm.nih.gov/pubmed/16834505). Si bien las pruebas de las desigualdades de género en las evaluaciones del desempeño siguen aumentando, se sabe mucho menos sobre las soluciones. En[un nuevo estudio](https://journals.sagepub.com/stoken/default+domain/10.1177%2F0003122419833601-free/full) en el _Revista sociológica estadounidense_, identificamos una posible forma de reducir las brechas de género en las evaluaciones cuantitativas del desempeño que sea rentable y rentable: cambiar la escala de calificación. Estudiamos una escuela de una gran universidad norteamericana que, por motivos no relacionados con el género, cambió su sistema de evaluación docente del profesorado de una escala del 1 al 10 a una del 1 al 6. En total, analizamos las valoraciones de 105 034 alumnos de 369 profesores en 235 cursos. Un aspecto único de nuestros datos era que podíamos comparar los resultados de los mismos profesores que impartían exactamente los mismos cursos en los diferentes sistemas de clasificación. Como era de esperar, según el sistema de 10 puntos, los hombres recibieron calificaciones significativamente más altas que las mujeres en los campos más dominados por los hombres. Pero lo que descubrimos después fue sorprendente: cambiar a una escala de 6 puntos eliminó por completo esta brecha de género. Para averiguar por qué, realizamos un experimento en el que dimos a 400 estudiantes transcripciones idénticas de una conferencia, que les dijeron que las daba un profesor o una profesora, el profesor John Anderson o la profesora Julie Anderson. Luego asignamos aleatoriamente si calificarían al profesor en una escala de 10 o 6 puntos. También pedimos a los alumnos que escribieran las palabras que se les ocurrieran por primera vez al pensar en el desempeño docente del profesor. Al igual que en nuestro estudio de campo, descubrimos una gran brecha de género en las puntuaciones según el sistema de 10 puntos, que volvió a desaparecer con el sistema de 6 puntos. Pero esta vez nos dimos una idea de por qué importaba la balanza. Al utilizar la escala de 10 puntos, los estudiantes asignaban fácilmente 10 a John Anderson, pero se mostraban reacios a hacerlo con Julie Anderson, sino que le daban 8 y 9. Al analizar las palabras que los alumnos utilizaban para describir la actuación del profesor, descubrimos que la puntuación más alta en la escala de 10 puntos evocaba imágenes de una actuación brillante y extraordinaria. También descubrimos que los evaluadores tendían a asociar ese tipo de actuación con John más que con Julie. Este resultado concuerda con la[asociación cultural de larga data](https://www.britannica.com/topic/number-symbolism#ref248167) del número 10 a la perfección, así como investigaciones anteriores que muestran que los evaluadores[analizar más detenidamente el desempeño femenino en busca de errores](https://psycnet.apa.org/record/1996-35750-001) y[reserve etiquetas como «estrella», «superestrella» y «genio» para hombres](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2572075/). Dado el [estereotipo de la brillantez masculina](http://science.sciencemag.org/content/355/6323/389), la perfección que connota un 10/10 es un listón de rendimiento esquivo para las mujeres. La máxima puntuación en la escala de 6 puntos, por el contrario, no tenía expectativas de rendimiento tan altas. Para recibir un 6/6, bastaba con que los profesores fueran percibidos como muy buenos; no necesitaban que los vieran como brillantes o extraordinarios. Como resultado, aunque los estudiantes que utilizaban la escala de 6 puntos tenían aún más probabilidades de utilizar superlativos para describir el desempeño docente de John, estaban tan dispuestos a asignar 6/6 puntos a Julie como a John. El estereotipo subyacente de la brillantez masculina seguía presente, pero una valoración de 6/6 no generaba imágenes culturales de perfección y brillantez tan fuertes como una puntuación de 10/10, por lo que la escala de 6 puntos limitó la expresión de prejuicios y la brecha de género desapareció. Los escépticos podrían discutir el papel del sesgo en estos resultados. Podrían argumentar, por ejemplo, que los profesores extraordinarios[tienen más probabilidades de ser hombres](https://web.archive.org/web/20190125140733/https:/www.harvard.edu/president/speeches/summers_2005/nber.php), y que la escala de 6 puntos simplemente lleva a los evaluadores a agrupar una actuación realmente brillante con lo que, objetivamente, es simplemente buena. Desde este punto de vista, la escala de 6 puntos no limita la expresión del sesgo de género; es simplemente un instrumento contundente que, a diferencia de la escala de 10 puntos, no diferencia entre grandes profesores varones y simplemente buenos profesores femeninos. Sin embargo, nuestro experimento aborda este problema. Lo único que variaba entre los profesores era si los estudiantes _creyó_ que fueran hombres o mujeres; las transcripciones de sus clases eran idénticas. Estos resultados tienen implicaciones que van mucho más allá del entorno universitario. Las calificaciones numéricas de rendimiento están en todas partes y en una era[obsesionado con los datos y las métricas](https://press.princeton.edu/titles/11218.html), a menudo actuamos como si nuestras herramientas de medición y evaluación fueran instrumentos neutrales. No lo son. Incluso factores tan aparentemente pequeños como el número de categorías de una escala de valoración pueden tener un efecto significativo en la desigualdad. La ventaja es que no estamos impotentes en lo que respecta a la desigualdad de género. Es difícil superar nuestros sesgos individuales, pero una vez que reconozcamos que los sesgos también son[integrado en nuestros sistemas de evaluación](http://www.rotman.utoronto.ca/Connect/Rotman-MAG/Back-Issues/2017/Back-Issues---2017/Fall2017-Inequality/Fall2017-FreeFeatureArticle-Kaplan), podemos cambiar esos sistemas. Al igual que en la universidad que estudiamos, las organizaciones de todo tipo pueden experimentar con sus métricas y herramientas de evaluación y descubrir nuevas formas de hacer crecer la aguja. Podemos avanzar hacia la igualdad un experimento a la vez. Esto no quiere decir que estas intervenciones vayan a eliminar los estereotipos de género, que según las investigaciones están profundamente arraigados y son muy resistentes al cambio. Más bien, pueden, [en palabras de la socióloga Joan William](/2014/10/hacking-techs-diversity-problem), _interrumpir_ su efecto en las calificaciones y empezar a cerrar las brechas de género en las carreras.