EL OTRO LADO DEL GO

27 de diciembre de 2020: Lee Sedol se retira de la escena. AlphaGo ya no existe más.

Escribí esta nota hace un par de años, pero vi este documental hace solo un par de días. Siento que en un momento de pandemia, en un momento de caos mundial, en un momento en donde las redes sociales, las cuentas de Facebook, de Twitter, de Instagram, de Tik-Tok, de Snapchat, etc., etc., tienen un costado perverso y nocivo, también el hombre ha seguido avanzando en silencio y produciendo mejoras que serán sustanciales para curar enfermedades, prevenir desastres, y prolongar la vida de todos igualando hacia arriba, para que no solo haya un grupo de privilegiados como yo, pero que solo pertenecemos a menos del uno por ciento de la población mundial. Y estoy convencido que entre otras múltiples cosas que tienen que juntarse, el avance de este tipo de tecnología, la Inteligencia Artificial (por ejemplo), serán esenciales. Para terminar: Lee Sedol acaba de anunciar que se retira de la escena. AlphaGo ya no existe más. Ahora se llama AlphaZero, y este programa nuevo, compitiendo contra AlphaGo, le jugó 500 partidas (quinientas) y ¡se las ganó todas!

La historia que quiero contar acá es verdaderamente fascinante. A principios del año 2016 (para ser más precisos en marzo), pasó algo que no fue tapa de los diarios y no solo en nuestro país sino virtualmente en ningún lugar del mundo occidental. Es que lo que sucede en una buena parte del Este asiático nos queda tan lejano no solo geográficamente sino en términos culturales, que es como si lo ignoráramos. Peor aún: no es como si lo ignoráramos, sino que lo ignoramos, lisa y llanamente. Es por eso que le propongo que lea la historia que sigue como una forma de introducirse en el tema y eventualmente, bucear usted, por su propia cuenta para decidir hasta dónde quiere estar informada/o. Yo solamente voy a ser un mero intermediario, alguien que le va a contar una historia que no es ficción, sino real. Acá voy.

Seúl, capital de Corea del Sur. En el hotel Four Seasons, entre el 9 y 15 de marzo, se jugaron cinco partidas de GO. ¿De qué? (estoy casi seguro que está pensando usted). De GO. ¿Qué es GO? El Go se juega hace más de 2.500 años. La leyenda indica que fue inventado por el mítico primer emperador chino con el objetivo de educar e instruir a su hijo. Se juega sobre un tablero, como el que se usa para jugar al ajedrez o las damas, solo que en lugar de que haya 64 casillas (un tablero de 8 x 8), al GO se juega en un tablero de 361 casillas, de 19 filas por 19 columnas. Es uno de los juegos más populares en China, India, Japón, ambas Coreas, Indonesia, Pakistán... lugares que nos quedan muy lejos. Se juega también con fichas blancas y negras, que los dos participantes se turnan en ubicar en las intersecciones de la grilla y no en las casillas como sucede en el ajedrez o las damas. Las piezas (que son todas iguales salvo en el color, como en las damas), una vez que son ubicadas no se mueven más. El objetivo es tratar de rodear las del rival. Una vez que se logra ese objetivo, se consideran capturadas y se sacan del tablero. De esta forma, se generan batallas entre los armadas Blancas y Negras que se disputan en distintas partes del tablero, y que se suelen propagar desde las cuatro esquinas hacia el centro.

Parece un juego ingenuo y sus reglas tan sencillas así lo sugieren. Sin embargo, es muchísimo más difícil que el ajedrez, por poner un ejemplo fácilmente comprensible para nosotros, aunque más no sea porque la cantidad de posiciones que pueden suceder durante una partida (1).

Pero... ¿qué fue lo que pasó? El hombre ha intentado siempre diseñar programas que pudieran jugar no solo al GO, sino también al ajedrez o a las damas, o al ta-te-tí. Las damas sucumbieron en el año 1994, pero el ajedrez ofreció un poco más de resistencia. En el año 1996, Garry Kasparov (el campeón mundial indiscutido en ese momento) jugó seis partidas contra Deep Blue, un programa producido por ingenieros de IBM. Kasparov ganó tres partidas, empataron dos y perdió una. Pero al año siguiente, en la revancha, todo cambió... y para siempre. El jugador ruso no sólo perdió 3 ½ a 2 ½ sino que Kasparov advirtió como muy pocos que no solo esa batalla estaba perdida, sino que el hombre ya no podría nunca más contra las máquinas. Y así fue. Ningún hombre hoy, gran maestro o aficionado, puede jugar contra un programa con esperanzas de ganar en forma consistente, aún enfrentándose a programas que no requieren de tanta sofisticación. Las computadoras usan su velocidad para revisar sus bases de datos sobre millones de partidas jugadas y su capacidad de memoria para analizar potenciales movidas y evaluar cuál de ellas es la que tiene mayor probabilidad de ganar. A un humano eso le llevaría cientos de miles de siglos. Listo. Asunto concluido. Juguemos entre nosotros porque contra ellas ya no vamos a poder. Sin embargo, a los humanos nos quedaba una posibilidad más, una vida más: ¡el GO! El GO presenta un grado de complejidad tan grande, que los analistas del momento sospechaban que estábamos todavía a un siglo -sí, un siglo (2)- antes de poder afrontar con posibilidades un enfrentamiento entre máquina vs. hombre.

Y aquí es donde entra en escena Demis Hassabis. Hassabis es un joven inglés, que nació y vive en Londres y que en ese momento estaba a punto de cumplir 40 años. Es neurocientífico, investigador en inteligencia artificial, programador de video juegos y además, un muy buen ajedrecista. El GO se transformó en una suerte de obsesión, no por el juego en sí mismo, sino porque siendo un apasionado por producir avances en inteligencia artificial, tomó al GO como un desafío personal. Era algo así como el “nuevo mundo a conquistar”, el nuevo Everest por dominar. En el año 2010, juntó a varios de los más importantes científicos del área y cofundó una empresa que llamó Deep Mind (3) y con la compañía, apareció AlphaGo, un programa especialmente diseñado para jugar al GO. Pero Hassabis y su equipo supieron desde el principio que lo que había hecho Deep Blue con Kasparov no sería el camino a seguir. Por más fuerza bruta que se usara, capacidad de memoria, almacenamiento de enormes bases de datos, rapidez de búsqueda, etc… eso no sería suficiente. Sería necesario buscar por otro lado, crear un programa que.... ¡aprendiera! Sí, una computadora que pudiera aprender ella sola, como si sacara conclusiones a medida que va incorporando nuevas experiencias. Si me permite, es como decir que se parece más a un comportamiento humano. Pero hay más.

Enterados de lo que estaba sucediendo con Deep Mind y los progresos que producían con su programa, aparecieron dos personas que se interesaron... y mucho: Larry Page y Sergey Brin. Por las dudas, son ambos los creadores y fundadores de Google. Viajaron a Londres en el año 2014 y le hicieron una oferta a Hassabis y su grupo: le comprarían la compañía con ellos adentro, haciéndolos socios y por esa sociedad los compensarían con 650 millones de dólares. La respuesta fue afirmativa, pero no solo por el dinero en juego (no despreciable, obviamente) pero porque a partir de ese momento, todo lo que pudiera hacer AlphaGo tendría el respaldo de Google. En realidad, AlphaGo es de Google ahora y toda la potencia, todas las computadoras, toda la capacidad de almacenamiento, todo... en fin, todo lo que se le ocurra, está a disposición de Hassabis y su grupo. Cuando AlphaGo tenía sus primeras versiones listas, empezó a jugarle a los otros programas de GO disponibles. De hecho, les jugaron 500 partidas, a todos los otros; AlphaGo ganó 499. Y llegó octubre del año 2015.

La idea fue contratar a Fan Hui, el campeón europeo de GO. Hui nació en China, pero se naturalizó francés y hoy, a los 38 años, es el director técnico del equipo profesional de Go que representa a Francia en las competencias internacionales. Hui no es ni era el mejor jugador en actividad, pero sí es un jugador profesional y en ese momento se ubicaba entre los mejores 650 jugadores del mundo (4). Teniendo en cuenta que más de una tercera parte del mundo juega al GO, es un logro no menor. Lo contrataron para que jugara cinco partidas contra AlphaGo y sucedió algo inesperado: por primera vez en la historia, AlphaGo (una computadora) le ganó una partida a un humano. En realidad, no solo le ganó una partida sino que le ganó las cinco. El resultado fue tremendo: 5-0. Todo esto tuvo un impacto muy fuerte en China, Corea, Japón... Sucederían dos cosas más todavía.

La primera tuvo lugar en enero del año 2016. La revista Nature, una de las más importantes del mundo por prestigio y penetración en el mundo de la ciencia, publica una serie de artículos (5) hablando de AlphaGo y termina ubicándolo en el mapa, al menos en nuestro mapa, que ciertamente es bien reducido, pero es “el” mapa en donde vivimos nosotros que estamos en este lado del mundo. Pero faltaría algo más.

Lee Sedol

Para usted, como lo era para mí hasta hace muy poquito tiempo, ese nombre no dice nada. Sedol es un joven que hoy tiene 37 años, nacido en Corea del Sur. En otras partes del mundo, Sedol es como Maradona o Messi o Federer o Tiger Woods. Es el campeón mundial de GO, pero no solo es el campeón ahora, sino que lo viene siendo desde hace ¡22 años! Todos los que trabajan en DeepMind y produjeron AlphaGo necesitaban jugarle al equivalente de Kasparov hace 25 años. ¿Cómo hacer? Justamente, la gente de Google le hace una oferta. Lo desafían a jugar cinco partidas, en donde él elija (eligió Seúl, de donde es oriundo). Si él ganaba tres de las cinco, le pagarían un millón de dólares. En cambio, si perdía, podrá elegir una obra de beneficencia cualquiera y Google depositaría/donaría ese millón de dólares allí. Lee no contestó inmediatamente. Primero, según declaró, quería ver cómo y por qué había perdido Hui en octubre del año anterior. De todas formas, en el momento que aceptó el desafío, y cuando se firmó el contrato dijo públicamente que él creía que podía jugar mucho mejor que el campeón europeo, y que su duda estaba en si ganaría 5 a 0 o 4 a 1 (6). En realidad, al ver el reciente documental, Sedol aparece como arrogante, como estableciendo que las partidas que había perdido el campeón europeo, él (Sedol) no las hubiera perdido. Pero me apresuré.

Las cinco partidas se jugaron en el Four Seasons Hotel en Seúl. En un salón especialmente acondicionado, los enfrentamientos tuvieron lugar el 9-10-12-13 y 15 de marzo del año 2016. A diferencia de lo que sucede con el ajedrez, en donde en promedio cada jugador hace 40 movimientos, al jugar al GO las partidas son mucho más largas. En promedio superan las 200 movidas. Pero había algo más: hasta principios de ese año, AlphaGo había jugado solamente una vez contra un humano que hubiera sido un jugador profesional. ¿Cómo les iría contra Sedol? Había llegado el momento de la verdad no solo para Hassabis sino también para el grupo de 20 investigadores que habían sumado sus esfuerzos para intentar dar el salto de calidad y entrar en la historia. En el sudeste asiático los diarios y los jugadores profesionales se manifestaban con muestras de sarcasmo y sugiriendo el ridículo que habría de hacer AlphaGo al enfrentarse con Lee. De hecho, la convicción era que sería la manera más fácil para Sedol de ganar un millón de dólares... Pero... no tan rápido muchachos... De las cinco partidas, los organizadores le ofrecieron a Lee que jugara tres veces con piezas negras, y de esa forma, a diferencia del ajedrez, poder hacer la primera movida.

Y así fue. Ni bien empezó la primera partida, cuando se habían producido los primeros movimientos, Lee dijo que advirtió que estaba jugando contra un animal diferente que el que había enfrentado Hui hacía algunos meses. Es que AlphaGo tiene la capacidad de dividirse en dos y jugar contra ella misma, y lo hace millones de veces por día e incorpora esos datos una y otra vez. Desde octubre del 2015 hasta marzo del 2016 habían pasado casi cinco meses. Si bien al GO se juega desde hace más de 2.500 años, el hombre junta toda la información que puede y mejora en función de esa experiencia. Más aún: mientras yo escribo estas líneas y usted las lee, AlphaGo jugó millones de partidas sin que se le moviera un pelo. Y la gran diferencia es que encima de todo, se acuerda de todo pero en el camino... y esto es lo increíble... ¡aprende!

Esa primera partida, la del 9 de marzo, terminó en forma inesperada para el mundo. Lee perdió después de 188 movimientos. Con el rostro mortificado, Lee pide disculpas... sí, disculpas, y cuando le preguntan qué pronóstico tiene para el día siguiente, su respuesta es muy diferente al día que se firmó el contrato: “50 y 50”. Si bien la máquina sorprendió a Lee (y al resto de los expertos por lo que hizo en la movida 102 de esa primera partida), todavía habría más. El jueves 10 de marzo, ahora con piezas blancas, Lee está dispuesto a dar batalla, pero... algo curioso sucedió en el camino. Cuando AlphaGo hace su movida 37, Lee parece petrificado. Las cámaras lo muestran con la frente transpirada. Se levanta y sale de la sala. Se va hasta un balcón y prende un cigarrillo. Cada jugador tiene dos horas para hacer todos sus movimientos y por lo tanto, cada minuto tiene un peso específico que nadie ignora. Lee vuelve después de un cuarto de hora y juega la mejor partida de su vida (según él mismo), pero... ¡vuelve a perder! Esa movida 37 es un quiebre en la historia para los que juegan al GO. Nunca nadie había jugado así. La probabilidad de que alguien haga esa movida está estimada en una en 10 mil. De hecho, el presidente de la Asociación Norteamericana de Go, Andrew Jackson declara que si alguno de sus maestros hubiera visto que él hacía esa movida, le hubieran dado una palmada en la muñeca diciéndole: “Eso no se hace”. Bueno, uno debería agregar: ¡no se hacía! ¡Ahora sí se hace... y más aún, esas movidas le sirvieron para ganar! Lee acepta la derrota después de 211 movimientos. Y eso es lo extraordinario del relato. Lee había jugado la mejor partida de su vida y sin embargo no le había alcanzado, pero comentó que ese día había aprendido lo que nunca antes había visto. Y de eso se trata.

Dos días más tarde, el sábado 12 juegan por tercera vez. La cantidad de periodistas y reporteros gráficos representa un hito en la historia, solo comparable con quienes se aglomeran el día de alguna conferencia de prensa pre o post final de una Copa del Mundo de fútbol. Ahora Lee necesitaría ganar las siguientes tres si quería aspirar al millón de dólares, pero ni siquiera eso era lo importante. Lee vuelve a perder y cuando declara que siente que ha fallado, parece pedir disculpas por lo "mal que nos ha representado". ¿Representado? Sí, representado a los humanos. Sin embargo, y como era esperable, Lee no perdió contra una máquina ni una computadora. Lee Sedol acababa de perder contra un grupo de veinte personas que juntaron sus mentes para diseñar un programa que pudiera contra el mejor que podemos exhibir nosotros hoy. AlphaGo somos todos nosotros. AlphaGo no llegó desde un universo desconocido y viajando en una suerte de OVNI nos ganó a un juego que inventamos nosotros. Una vez más, AlphaGo somos todos nosotros. AlphaGo es el producto de una construcción colectiva, milenaria también. Sin humanos no hay máquinas, y sin máquinas no hay algoritmos. Sin ciencia, todo esto no existiría.

Gu Li no solo es uno de los dos amigos íntimos de Sidol sino que también es un jugador profesional importante. Esa noche, contratado por la televisión nacional de China ofrece su opinión: “Lee estuvo jugando una batalla solitaria contra un rival invisible”. Ya no habría un millón de dólares para Lee pero sí hubo más partidas. Al día siguiente, el domingo 13 de marzo, Lee juega con blancas otra vez. Curiosamente, AlphaGo comete un error a poco de comenzar la partida y Lee no lo deja pasar. Duda, se lo ve tenso, nervioso. ¿Por qué duda? Es que contra cualquier otro competidor él sabría que esa particular jugada del rival le haría ganar la partida. Pero AlphaGo había demostrado que no era cualquier rival. ¿Y si había algo que no había visto? Después de pensar bastante tiempo, Sedol decide seguir y atacar como hubiera hecho normalmente. El final favorable estaba a la vista. En la jugada 78 hace él también una jugada ingeniosa y creativa, que también tenía una probabilidad de 1 en 10 mil de ser utilizada. Pero a diferencia de lo que había pasado antes, AlphaGo se entrega. El resultado está 3 a 1 ahora. Ya no sería como con Hui. Lee pide jugar la quinta partida usando piezas blancas. Es que su único triunfo y su derrota más cerrada se producen cuando él condujo ese color de piezas. Obviamente, se le concede el pedido. Pero ya no hay mucho más por hacer. Esta vez no hay error de AlphaGo y toda la sabiduría y creatividad de Lee no alcanzaron. Final: AlphaGo 4 - Lee Sedol 1.

El futuro

Esto recién comienza. Sería inapropiado tratar de sacar conclusiones cuando en el futuro está todo y el pasado nos permitió llegar hasta acá. Cuando Deep Blue le ganó a Kasparov, la máquina que había diseñado IBM virtualmente desapareció de la escena. No hubo posibilidades de extrapolar para ninguna otra cosa lo que obviamente sirvió (y sirve) para ganar al ajedrez. Es decir, no hubo maneras de aprovechar (salvo en cosas menores) la potencia de lo que había sucedido. Ahora, con AlphaGo es diferente. Tanto Brin como Page dijeron después del triunfo: “Es claro que no invertimos 650 millones de dólares para ganar al GO. Ese no es el objetivo de Google”. No, claro que no lo es. La expectativa es que ahora, con este tipo de programas en donde las máquinas aprenden y se van mejorando, sirven además para mejorarnos a nosotros. El campeón europeo, Fan Hui, estaba ubicado entre los mejores 650 jugadores del mundo. Hoy, ya está entre los mejores 300 después de haber jugado contra AlphaGo. Por otro lado, las movidas que hizo en su enfrentamiento con Lee Sedol, abrieron un universo de posibilidades que los humanos no sabíamos que existían. Para decirlo de otra forma: la diferencia está en que en los programas anteriores, las computadoras tienen predeterminado qué hacer en cada caso. Acá, AlphaGo aprende mientras juega... y en el camino, nos enseña a nosotros. De hecho, AlphaGo no hubiera podido demostrar toda su potencia de no haber sido porque Lee Sedol la empujó hacia ese lugar y la desafió.

La inteligencia artificial no será replicar la “inteligencia del hombre”, su creatividad. De hecho, los aviones vuelan, pero no tienen alas que muevan, ni plumas ni músculos. El hombre replicó lo que necesitó para obtener el mismo resultado. Ernest Davis, profesor en la universidad de New York escribió: “Usualmente, uno le dice a una computadora lo que tiene que hacer. En cambio, cuando hablamos de aprender, uno le muestra cómo. Me explico. Suponga que usted quiere que una computadora cruce una calle, por ejemplo. Con la programación convencional usted le da un conjunto muy preciso de reglas, diciéndole que tiene que mirar para la derecha, para la izquierda, esperar los autos, estimar sus velocidades, usar las cebras para llegar al otro lado, etc y después, dejarla que lo haga sola. En cambio, con el aprendizaje del que yo le estoy hablando, uno le muestra 10 millones de videos de alguien cruzando una calle en forma correcta, y otros 10 millones de videos de alguien quien al intentar cruzar mal es atropellado por un auto y después la deja a ella sola para que aprenda. ¡Y aprende!”

Como decía al principio, estamos en presencia de algo nuevo, al menos, algo nuevo para mí. El hombre acaba de cruzar una barrera que algunos ni siquiera pensábamos que se podía abordar. Un enorme potencial se acaba de abrir, con todas las implicancias éticas y de tremendo poder para quien posea esta tecnología. La Argentina está en un lugar muy privilegiado. Nuestros científicos, con todos los problemas que aún persisten, con toda la resistencia que genera su inserción en nuestras vidas cotidianas, están a la altura de los mejores del mundo. Nos costó muchísimo llegar hasta acá. Protejámoslos, porque eso marcará la diferencia entre soberanía e independencia.

1. Las del ajedrez se estiman en 10123 mientras que las del Go, llegan a 10360. Es decir, si lo quisiera escribir en un papel, tendría que poner un numero uno seguido de 360 (trescientos sesenta) ceros. Imposible (al menos para mi) en dar un ejemplo que permita imaginar estas magnitudes, sencillamente porque no hay nada ‘visible’ para poder compararlo. Mejor dicho, sí. El número de átomos del universo se calcula en 1080, un uno seguido de ochenta ceros. El ajedrez llegaría a una vez y media a ese número. El Go, sería cuatro veces y media. No sé: creo que a esta altura esos números no dicen más nada ¿no es así?

2. De hecho, Pier Hut, astrofísico en el Instituto de Estudios Avanzados en Princeton declaró en ese momento: “Puede que pasen cien años (sic) hasta que el hombre pueda derrotar al GO, o quizás más” (“It may be a hundred years before a computer beats humans at Go -maybe even longer”). http://www.nytimes.com/2016/04/05/science/google-alphago-artificial-intelligence.html?_r=0 (artículo publicado en The New York Times el 4 de abril del año 2016 y firmado por George Johnson, el periodista especializado en ciencia del diario).

3. Deep Mind = “Mente Profunda” (traducción mía).

4. Si lo miráramos en términos de karate, por ejemplo, el mejor del mundo tiene un nueve (sobre nueve posibles, es decir, el máximo). En ese momento, Hui estaba en un dos.

5. https://www.nature.com/news/the-go-files-ai-computer-clinches-victory-against-go-champion-1.19553 y https://www.nature.com/articles/nature24270; y además este: https://www.nature.com/articles/nature16961.

6. En este documental -https://www.youtube.com/watch?v=WXuK6gekU1Y&ab_channel=DeepMind- es posible seguir toda la historia. Si me permite, se lo recomiendo fuertemente. Si puede, deje de hacer lo que está haciendo ahora, y dedíquele una hora y media a disfrutar esta joya de lo que podemos los humanos.

--------------------------------

Para suscribirte con $ 8.000/mes al Cohete hace click aquí

Para suscribirte con $ 10.000/mes al Cohete hace click aquí

Para suscribirte con $ 15.000/mes al Cohete hace click aquí