Dirigida por
Greg KohsAño
2017Relación con las Telecomunicaciones
Situación: Por primera vez no estamos ante una potente pero simple calculadora sino ante una inteligencia artificial construida con redes complejas que imitan la red de neuronas de nuestro cerebro y para la que aprender es la clave.Personaje: BRIN, Sergey.
Personaje: PAGE, Larry.
AlphaGo: Queríamos que fuese como el proyecto Apolo de la IA
El 9 de marzo de 2016 Lee Sedol, 18 veces campeón del mundo en el Go, el juego de mesa considerado más difícil del mundo, llegaba al Four Seasons Hotel de Seúl para jugar contra AlphaGo, el primer ordenador o inteligencia artificial que presumía de ganar a un humano. Sedol llegaba confiado y declarando a la prensa que no había de qué preocuparse, las cinco partidas que iba a disputar contra AlphaGo pensaba ganarlas y así demostrar que las máquinas no tienen nada que hacer contra un humano en el Go.
AlphaGo ganó cuatro de las cinco partidas que jugó contra Lee Sedol. El duelo fue seguido por unos 80 millones de espectadores y en Corea acaparó portadas. Lee Sedol aprendió a ver el juego de su vida de otra forma y acabó confesando que lo que más le había sorprendido es que las jugadas que los humanos creen que son creativas acaban siendo convencionales.
El documental de Greg Kohs trata de plasmar cómo la inteligencia artificial de DeepMind consiguió ganar al mejor jugador de la historia del Go.
AlphaGo surge de DeepMind, una startup de aprendizaje automático con sede en Londres, comprada por Google en 2014 por cerca de 500 millones de dólares, y con Demis Hassabis al mando. Que DeepMind ponga a prueba a su inteligencia artificial con juegos de mesa no es casualidad ya que, aunque el documental no lo cuente, Demis Hassabis es un jugador polivalente y único que ha ganado 27 medallas de oro, 13 de plata y 9 de bronce en las Olimpiadas de Juegos Mentales. En ajedrez solo ha ganado cuatro medallas. Abandondó este juego a los 14 años, cuando estaba entre los mejores del mundo de su edad, posiblemente porque las máquinas ya eran mejores que los humanos en ajedrez, así que buscó otro juego más complicado como es el Go.
En una de sus conferencias, Hassabis explica que uno de los primeros retos que le plantearon a su creación fue el clásico juego del muro de ladrillos y la pelotita (Breakout: videojuego desarrollado por Atari Inc. y lanzado al mercado el 13 de mayo de 1976). Al principio le ponen a jugar sin explicarle siquiera las reglas, pero éstas son tan sencillas que las va entendiendo. Después de cien partidas todavía es un paquete, pero al menos comprende qué debe hacer. Después de 300 ya tiene un nivel humano y después de 500 descubre un método óptimo que ninguno de los programadores conocía. Así, en unas horas la máquina pasó de no saber nada en absoluto a permitirse el lujo de dar lecciones en una materia en la que nunca tuvo profesor.
El proceso es simple, en teoría. AlphaGo (y luego AlphaZero, a finales de ese año, en ajedrez) 'fagocita' bases de datos con cientos de miles de partidas magistrales y, una vez asimilado lo que da de sí la inteligencia humana, juega luego contra sí mismo incontables veces, para depurar su estilo. En algún momento, sin embargo, los programadores detectan un punto débil y trabajan contra el reloj para minimizar el inesperado talón de Aquiles. Ahora el problema es que ninguno de ellos juega tan bien como para evaluar con corrección el juego de su 'criatura'.
El miedo también es palpable. AlphaGo realiza movimientos que no entienden ni los mejores jugadores del mundo. Los expertos consideran a veces que se hallan ante un error, que la máquina se ha vuelto loca. Poco a poco, un manto de humildad cubre la sala. En su magnanimidad autoaprendida, o por algún otro motivo aún inexplicable, AlphaGo prefiere ganar por la mínima a ensañarse con el contario.
Otro dato esencial para comprender el desarrollo de DeepMind y sus programas de juego es que el código lleva veinte años de rodaje; no ha florecido de forma espontánea. En el documental se ve el ingente trabajo que hay detrás. El talento solo se intuye, pero es evidente. Y el genio detrás de la máquina es Demis Hassabis.
El documental habla entonces del Go, el juego de tablero más antiguo. Se practica sobre un tablero en el que se pueden dar más posiciones posibles que en el ajedrez y que a su vez ofrece más combinaciones que átomos el universo. El juego tiene además un componente místico: practicarlo es como situarse "ante un espejo".
El objetivo primero de DeepMind es entender la inteligencia y recrearla artificialmente. Necesita imitar la intuición humana y para ello elige una actividad tan compleja que, como ocurrió con el ajedrez en los años ochenta, los mejores programas no puedan competir contra los jugadores expertos. De hecho, la primera reacción de los profesionales del Go cuando se les ofrece jugar contra AlphaGo es de un sentimiento de superioridad: están convencidos de ganar a la máquina porque la ven como un progama más. Una posible explicación de este sentimiento es que, al contrario de lo que suele ocurrir en ajedrez, un buen jugador de go no siempre sabe explicar sus movimientos, tan solo los intuye y los justifica con un "me pareció la jugada correcta".
Fan Hui, campeón de Europa, es el primer conejillo de indias. Llega a las oficinas de DeepMind dispuesto a echar una mano al progreso y sale de allí hundido tras haber perdido las cinco partidas. No obstante, lo supera y sigue colaborando con el equipo de desarrollo. La suya es la primera derrota de un jugador profesional de go contra un programa.
Es interesante resaltar la diferencia entre Deep Blue, la máquina que derrotó a Kasparov, y AlphaGo. La primera fue programada paso a paso, explicándole a través de miles de patrones las ventajas y desventajas. A la segunda le muestran 100.000 partidas de grandes jugadores, descargadas de internet, para que aprenda de ellas y a continuación se entrene jugando contra distintas versiones de sí misma millones de veces.
Dado que aprende de sus propios errores, no siempre responde igual ante el mismo problema. Por primera vez no estamos ante una potente pero simple calculadora sino ante una inteligencia artificial construida con redes complejas que imitan la red de neuronas de nuestro cerebro y para la que aprender es la clave.
AlphaGo es capaz de combinar estudio, probabilidad y cálculo. En ese sentido es como un buen jugador de póker, juega lo que cree que maximiza sus probabilidades, sin necesidad de calcularlo todo hasta el final. Incluso para las máquinas sería una labor todavía excesiva.
La prueba definitiva es un duelo a cinco partidas contra el multicampeón mundial, el coreano Lee Sedol, quien pese a conocer lo que le ocurrió a Fan Hui llega confiado y afirma que espera ganar 5-0 o 4-1.
Vídeos
El Go es relativamente sencillo de jugar, pero realizar el movimiento correcto no es tan simple. Si en el ajedrez hay unos 20 movimientos posibles en cada jugada, en el Go pueden ser fácilmente unos 200 movimientos. En el documental se explica muy bien esta idea: hay tantas opciones posibles que ningún ordenador puede calcularlas todas para encontrar la mejor. ¿La solución? Hacer lo mismo que el humano mediante inteligencia artificial: intuir cuál puede ser la mejor jugada.
AlphaGo ganó cuatro de las cinco partidas que jugó contra Lee Sedol y el documental busca reflejar lo que eso supuso para los participantes, para los jugadores de Go y para el progreso de la tecnología. Para ello, no se centra en los detalles técnicos sino en las cinco partidas que Lee Sedol y AlphaGo jugaron pero con pequeñas pinceladas sobre el funcionamiento de la IA de DeepMind, cómo lo vivieron los asistentes y cómo el equipo de DeepMind tuvo que ingeniárselas para que AlphaGo jugase como un humano más en ese torneo. Lo más interesante es que fue filmado durante el torneo por lo que todas las imágenes son reales, sin recreaciones, y con el valor añadido de las declaraciones de sus creadores.