Cómo aprenden las máquinas (y ganas)

Cómo aprenden las máquinas (y ganas)


«Aprendizaje automático». Has oído el término y probablemente asientes de acuerdo cuando alguien te dice lo importante que es. Pero, en secreto, puede que no esté seguro de qué es o cómo funciona. Pídale a sus científicos de datos que lo expliquen, y es posible que se pierda en un mar de charlas especializadas sobre bifurcaciones, nodos foliares, puntos divididos y recursiones. Olvídate de todo eso. Lo único que necesita saber es que el aprendizaje automático aplica modelos estadísticos a los datos que tiene para hacer predicciones inteligentes sobre los datos que no tiene.

Estas predicciones pueden ayudarte a encontrar señales en el ruido y extraer valor de todos los datos que estás recopilando. La ventaja de, de hecho, el imperativo para el uso del aprendizaje automático es su velocidad y fuerza bruta. Puede extraer vastas extensiones de datos en segundos o minutos, encontrar patrones y hacer predicciones de formas que ningún analista humano podría empezar a emular. El aprendizaje automático ayuda, entre otras cosas, a las empresas a detectar que los pacientes tendrán convulsiones mucho antes de que ocurran realmente.

Lo mejor de todo es que no importa cuánto trabajo le hagas, el estudiante nunca se agota ni se aburre. He aquí un vistazo a cómo funciona.

Ejemplo: Cómo aprende una empresa de cable qué clientes podrían cancelar el servicio

Los desertores de una compañía de cable han empezado a superar en número a los nuevos clientes. La compañía quiere lanzar ofertas de descuento para evitar más cancelaciones, pero no quiere ofrecer descuentos a clientes satisfechos que estén dispuestos a pagar su tarifa actual. La compañía no tiene datos explícitos sobre «cortadores de cables potenciales», por lo que utilizará su base de datos de clientes y el aprendizaje automático para detectar defectores probables y dirigirse solo a ellos con sus ofertas de descuento. Seguiremos el proceso de aprendizaje automático mientras trata de ordenar a dos clientes, Karl y Cathy, utilizando un ejercicio de ML típico: un árbol de decisiones.

1. Proceso: Decida lo que quiere saber

Una máquina no puede elegir aprender algo por sí sola (todavía). En cambio, los científicos de datos le dicen lo que quieren que aprenda.

2. Crear un modelo

Para obtener información, la máquina debe acceder a datos enriquecidos de los clientes: datos demográficos, comportamiento de compra, otros servicios que los clientes pagan, ya sea que hayan llamado para reclamar o cancelar un servicio, y mucho más. Con estas variables, los científicos de datos crean un modelo estadístico que determina cuán predictiva es cada variable en términos de la respuesta que intenta aprender la máquina.

3. Acumular respuestas

Para cada pregunta, la probabilidad se perfecciona en una dirección u otra sobre la base de respuestas hasta ese momento. La máquina busca combinaciones de atributos que crean un alto nivel de certeza sobre la respuesta que busca.

R1511Z_VISION_A


R1511Z_VISION_B


R1511Z_VISION_C


R1511Z_VISION_D


R1511Z_VISION_E

4. Tomar una decisión

Eventualmente, la probabilidad se ponderará mucho de una forma u otra. Esto puede ocurrir después de unas cuantas preguntas o decenas de ellas. Los científicos de datos deciden cuán confiados quieren que la máquina tenga su respuesta. Pueden decir que una vez que tiene un 95% de confianza, puede detenerse.

R1511Z_VISION_F

5. Iterar

Ahora el ordenador puede llevar a cabo la misma evaluación miles o incluso millones de veces en otras entradas de su conjunto de datos, clasificando con confianza cada entrada en el grupo A o grupo B. Ha aprendido.

Creado en colaboración con Randal S. Olson y R2D3

Escrito por