Cómo eliminar los prejuicios de las entrevistas
por Iris Bohnet

PERSONAL DE HBR
Si es usted director de contratación, probablemente sea más feliz haciéndose una idea de un candidato a través de entrevistas no estructuradas, que le permiten explorar al azar detalles que le parecen interesantes y relevantes. (¿Qué piensa la candidata de su anterior empleador? ¿Le gusta Chicago? ¿Qué hace en su tiempo libre?) Después de todo, ¿no es su trabajo conocer al candidato? Pero aunque las entrevistas no estructuradas reciben sistemáticamente las calificaciones más altas en cuanto a eficacia percibida por parte de los directores de contratación, docenas de estudios han descubierto que se encuentran entre los peores predictores del rendimiento real en el puesto de trabajo, mucho menos fiables que las pruebas generales de capacidad mental, las pruebas de aptitud o los tests de personalidad.
¿Por qué nos aferramos a un método que tan claramente no funciona, cuando las ayudas para la toma de decisiones, incluidos los tests, las entrevistas estructuradas y una combinación de predictores mecánicos, reducen sustancialmente el error en la predicción del rendimiento de los empleados? El psicólogo organizacional Scott Highhouse llamó a esta resistencia “el mayor fracaso de la psicología I-O [industrial y organizacional]”.
La renuencia a renunciar a un enfoque de evaluación muy querido parece estar impulsada por dos factores: Los directivos confían demasiado en su propia pericia y experiencia, y les disgusta diferir a enfoques más estructurados que podrían externalizar el juicio humano a una máquina.
Cuando la socióloga Lauren Rivera entrevistó a banqueros, abogados y consultores, éstos informaron de que solían buscar a alguien como ellos mismos en las entrevistas. Replicarnos a nosotros mismos en la contratación contribuye a la segregación de género predominante en los puestos de trabajo, en los que, por ejemplo, los banqueros varones contratan a más banqueros varones y las maestras a más maestras.
A veces tenemos que aprender por las malas. Hace unos años, los legisladores de Texas se dieron cuenta de que en el estado faltaban médicos. Para solucionar el problema, la legislatura exigió a la Facultad de Medicina de la Universidad de Texas en Houston que aumentara de 150 a 200 el tamaño de las clases de los estudiantes de nuevo ingreso, después de que el comité de admisiones ya hubiera elegido a sus 150 estudiantes preferidos. Como la mayoría de los estudiantes solicitan plaza en varias facultades de medicina simultáneamente, para entonces ya se había hablado de todos los candidatos mejor clasificados. Esto significaba que el grupo de estudiantes aún disponibles estaba formado por candidatos que previamente habían recibido una calificación baja por parte del comité de admisiones. De los 50 estudiantes finalmente seleccionados, sólo siete habían recibido una oferta de otra facultad de medicina.
Este requisito dictado por el gobierno se convirtió en un revelador estudio de campo, que permitió a los investigadores de la Universidad de Texas examinar si la clasificación inicial importaba para el rendimiento de los estudiantes en la facultad de medicina y después de ella. He aquí el impactante resultado: El rendimiento de los estudiantes inicialmente aceptados e inicialmente rechazados resultó ser el mismo. Profundizando más, los investigadores descubrieron que cerca de tres cuartas partes de la diferencia en las calificaciones entre los estudiantes inicialmente aceptados y los inicialmente rechazados no se debía a medidas más objetivas, como las notas, sino a las percepciones que los entrevistadores tenían de los candidatos en entrevistas no estructuradas. Ante este hallazgo, los investigadores se preguntan si, tras una evaluación inicial de las medidas académicas y otras medidas de rendimiento, las entrevistas tradicionales deberían sustituirse por una lotería entre los solicitantes viables.
No espero que las loterías sustituyan a las entrevistas en la mayoría de las situaciones, pero las pruebas en contra de las entrevistas no estructuradas deberían hacer reflexionar a cualquier responsable de contratación. Estas entrevistas no deberían ser su herramienta de evaluación preferida; están plagadas de sesgos y de información irrelevante. En su lugar, los directivos deberían invertir en herramientas que hayan demostrado predecir el rendimiento futuro. En lo alto de su lista deben figurar las pruebas de muestras de trabajo relacionadas con las tareas que tendrá que realizar el candidato al puesto. Por ejemplo, Compose, una empresa de almacenamiento en la nube, decidió prescindir por completo de los currículos y, en su lugar, evaluar a los candidatos a un puesto de trabajo en función de lo bien que resolvían un problema relacionado con el trabajo. Empresas como Applied, Blendoor, Edge, GapJumpers, Interviewing.io, Paradigm y Unitive proporcionan las herramientas analíticas y el software que pueden aportar más estructura a los procedimientos de contratación.
Aun así, la mayoría de las empresas querrán “ver” a los candidatos después de la prueba de la muestra de trabajo. Las empresas deberían confiar en una entrevista estructurada que estandarice el proceso entre los candidatos, eliminando gran parte de la subjetividad. Estas entrevistas plantean el mismo conjunto de preguntas en el mismo orden a todos los candidatos, lo que permite comparaciones más claras entre ellos. Esto puede parecer un enfoque obvio, pero, increíblemente, sigue estando infrautilizado. Por supuesto, el flujo de la conversación durante la entrevista será ligeramente más incómodo de lo que ya es, pero el payoff merece la pena.
El protocolo también debe exigir al entrevistador que puntúe cada respuesta inmediatamente después de darla. Esto neutraliza una serie de sesgos: Es más probable que recordemos las respuestas con ejemplos vívidos, por ejemplo, y las respuestas más recientes. Los evaluadores que esperan hasta el final de la entrevista para puntuar las respuestas corren el riesgo de olvidar una respuesta temprana o menos vívida pero de gran calidad, o de favorecer a los candidatos cuyo estilo de hablar favorece la narración.
También es mejor comparar las respuestas de los candidatos horizontalmente. Es decir, si entrevista a cinco candidatos, compare cada una de sus respuestas en la pregunta uno, luego cada respuesta en la pregunta dos, y así sucesivamente. Muchos académicos, entre los que me incluyo, hacen esto cuando califican exámenes. En el mejor de los casos, los evaluadores se ocultan a sí mismos su valoración de la pregunta uno -literalmente la ocultan- para reducir la posibilidad de que la respuesta influya en las puntuaciones de las preguntas siguientes. Esto puede resultar incómodo porque los entrevistadores a menudo descubren que un candidato da respuestas magníficas a algunas preguntas pero profundamente decepcionantes a otras. Aunque complica la evaluación, identificar esta incoherencia interna merece la pena, sobre todo si hay preguntas que reciben más peso.
Las evaluaciones comparativas no sólo nos ayudan a calibrar a los distintos candidatos, sino que también disminuyen el reflejo de confiar en los estereotipos para guiar nuestras impresiones. En una investigación conjunta con Max Bazerman, de la Harvard Business School, y Alexandra van Geen, de la Universidad Erasmus de Rotterdam, hemos demostrado que los sesgos que nos llevan a esperar que las mujeres sean mejores en trabajos estereotipadamente femeninos, como la enfermería, y los hombres en trabajos estereotipadamente masculinos, como la ingeniería, tienden a activarse cuando nos centramos y evaluamos verticalmente a un candidato cada vez. Por el contrario, es menos probable que las personas se basen en si un candidato “aparenta” cuando evalúan a varios candidatos simultáneamente y los comparan de forma sistemática.
Las entrevistas estructuradas no se limitan a la disciplina a la hora de formular preguntas: algunas empresas, entre ellas Google, estructuran el contenido de sus entrevistas utilizando datos. Sus departamentos de análisis de personal crujen los datos para averiguar qué preguntas de la entrevista están más correlacionadas con el éxito en el puesto de trabajo. La excelente respuesta de un candidato a esas preguntas puede dar al evaluador una pista sobre su rendimiento futuro, así que tiene sentido que las respuestas a esas preguntas reciban un peso adicional.
Sustituir las entrevistas no estructuradas por entrevistas estructuradas es sólo una parte de la batalla; los directivos también deberían abandonar por completo las entrevistas de panel, o de grupo. No conozco ninguna prueba de que proporcionen un indicador superior del rendimiento futuro de un candidato. Y lo mejor es mantener a los entrevistadores tan independientes entre sí como sea posible. Por decir algo obvio, si tiene cuatro entrevistadores, cuatro puntos de datos de cuatro entrevistas individuales triunfan sobre un punto de datos de una entrevista colectiva.
Una vez que todos hayan evaluado a todos los candidatos, los evaluadores deberían presentar sus valoraciones antes de una reunión para hablar de un candidato. Esto permitiría a una organización agregar las respuestas, es decir, esas puntuaciones ponderadas de uno a diez sobre preguntas formuladas exactamente en el mismo orden. Las evaluaciones con candidatos por encima de un determinado umbral deberían avanzar para su consideración posterior. Ni siquiera debería preguntarse si el candidato es aficionado a los Red Sox, y por supuesto no es relevante.
Aplicar estos ajustes es sólo el principio. Una vez aceptado el hecho de que los enfoques no estructurados son inferiores, asegúrese de seguir experimentando para afinar lo que funciona mejor en su contexto. Por ejemplo, mis colegas y yo estamos trabajando con el gobierno de un gran país para mejorar su gestión del talento. Hemos realizado una serie de pruebas A/B para medir el poder de diagnóstico de pruebas específicas de muestras de trabajo y preguntas de entrevista para funcionarios públicos. El análisis de datos y las innovaciones en el diseño, como las evaluaciones comparativas, pueden ayudar a las organizaciones a nivelar el campo de juego y beneficiarse del 100% de la reserva de talento.
Al igual que las personas en la mayoría de las demás empresas humanas, los responsables de contratación están poderosamente influidos, y a menudo sin saberlo, por sus prejuicios. Aunque es extremadamente difícil eliminar los prejuicios de un individuo, es posible diseñar las organizaciones de forma que sea más difícil que las mentes sesgadas sesguen el juicio. Deberíamos dejar de malgastar recursos intentando eliminar los prejuicios de las mentalidades y, en su lugar, empezar a eliminar los prejuicios de nuestros procedimientos de contratación. Las pruebas de muestras de trabajo, las entrevistas estructuradas y la evaluación comparativa son lo inteligente y lo correcto, ya que nos permiten contratar a los mejores talentos en lugar de a los que aparentan serlo. Un diseño más inteligente de nuestras prácticas y procedimientos de contratación puede que no libere nuestras mentes de nuestros defectos, pero puede hacer que nuestros prejuicios se vuelvan impotentes, rompiendo el vínculo entre las creencias sesgadas y las acciones discriminatorias - y a menudo simplemente estúpidas.
Artículos Relacionados

Investigación: La IA generativa hace que la gente sea más productiva y esté menos motivada

Arreglar los chatbots requiere psicología, no tecnología
Los chatbots dotados de IA se están convirtiendo en el nuevo estándar para la gestión de consultas, reclamaciones y devoluciones de productos, pero los clientes se alejan de las interacciones con los chatbots sintiéndose decepcionados. La mayoría de las empresas intentan solucionar este problema diseñando mejores modelos de IA en sus chatbots, pensando que si los modelos suenan lo suficientemente humanos, el problema acabará desapareciendo. Pero esta suposición es errónea. Esto se debe a que el problema de fondo no es tecnológico. Es psicológico: Hay que engatusar a la gente para que vea a los chatbots como un medio positivo de interacción. Los autores han analizado recientemente las últimas investigaciones sobre chatbots e interacciones IA-humanos, y en este artículo presentan seis acciones probadas que puede llevar a cabo al desplegar su chatbot de IA para impulsar la satisfacción, la percepción positiva de la marca y las ventas.

Investigación: ¿Está penalizando a sus mejores empleados por desconectar?
Para combatir el creciente desgaste del personal, muchas empresas han defendido programas de bienestar y han fomentado un enfoque renovado en el equilibrio entre la vida laboral y personal. Pero un nuevo estudio descubrió que incluso cuando los líderes reconocían que desvincularse del trabajo aumenta el bienestar de los empleados y mejora su rendimiento laboral, los directivos seguían penalizando a los empleados que adoptaban estos comportamientos cuando optaban a un ascenso o estaban siendo considerados para un nuevo puesto. Basándose en sus conclusiones, los investigadores ofrecen sugerencias para ayudar a las empresas a crear políticas y construir una cultura que proteja los límites de los trabajadores, evite el agotamiento y recompense el trabajo fuerte.