Esquema de varias tácticas adoptadas por la IA para vencer en partidas en las que debía capturar la bandera del enemigo y evitar la toma de la propia
Esquema de varias tácticas adoptadas por la IA para vencer en partidas en las que debía capturar la bandera del enemigo y evitar la toma de la propia - DeepMind

La Inteligencia Artificial (IA) coopera para ganar al hombre en los videojuegos de disparos

La compañía DeepMind ha desarrollado una inteligencia artificial que coopera y aprende por sí sola a ganar en el «Quake III Arena» y que vence a jugadores humanos

MADRIDActualizado:

La saga «Terminator», del cineasta James Cameron, recrea un mundo en el que una inteligencia artificial (IA) llamada Skynet se rebela contra los humanos. La máquina aprende que para sobrevivir debe destruir a su creador, así que desata un infierno nuclear que inicia la era de las máquinas.

Por si acaso, los misiles nucleares están protegidos en el fondo de refugios desconectados de internet y controlados por ordenadores obsoletos, pero fiables. Sin embargo, quizás sorprenda que DeepMind, filial de Google, lleve años desarrollando una inteligencia artificial capaz de aprender, sin ingerencia humana, cómo alcanzar sus objetivos.

Ayer mismo, un estudio publicado en « Science» y elaborado por investigadores de la compañía mostró cómo una inteligencia artificial es capaz de vencer a jugadores expertos en un popular videojuego de disparos, el «Quake III Arena», un logro nunca antes alcanzado por una máquina.

Los investigadores han creado un sistema basado en varias IAs, a las que han llamado «agentes». Cada uno aprende de forma independiente cómo jugar y lo conveniente que es cooperar para ganar. Solo necesitan una extensa base de datos con miles de partidas, un algoritmo de aprendizaje por refuerzo positivo y ver los píxeles que ocupa su propio campo visual.

Más «letal» que los jugadores humanos

Su objetivo es ganar cuantas más veces se pueda en una modalidad de juego en la que deben capturar la bandera del enemigo y evitar la captura de la propia. Para ello, las IAs disparan al rival para mandarlo a su base, aprenden a quedarse en el campamento contrario para hostigar a los oponentes o bien se mantienen cerca de sus aliados durante la batalla.

«Estos agentes aprenden tácticas similares a las que usan los humanos y forman equipo tanto con humanos como con otros agentes», ha explicado Max Jaderberg, director del trabajo.

Los investigadores entrenaron a 30 agentes, después de jugar 450.000 partidas. Después, estos lucharon en un torneo en el que participaron 40 contrincantes humanos. Así, observaron que la máquina se impone y logra capturar una media de 16 banderas más que el hombre, incluso cuando se aumentó su tiempo de reacción para ponerlo a la altura de los reflejos humanos.

Hasta ahora, las IAs de DeepMind, AlphaZero y AlphaGo, habían derrotado a los mejores jugadores de ajedrez, go y shogi, después de aprender por sí solas. Pero, dado que estos juegos se desenvuelven en entornos muy estables y con reglas bien establecidas, el próximo paso es introducir complejidad, incertidumbre y multitud de protagonistas.

De momento, otra IA, de nombre AlphaStar, ha derrotado a jugadores profesionales en el videojuego StarCraft II, mucho más dinámico e incierto que los anteriores. Sin embargo, lo cierto es que la máquina solo ha podido vencer sin incorporar el desconocimiento de la niebla de guerra, que le oculta a los jugadores la posición del enemigo. De momento, la máquina solo gana si sabe dónde está el rival.

Cuando la máquina aprende sola

En esta ocasión, los científicos han demostrado el rendimiento de su IA en un entorno poblado por múltiples protagonistas, en el que los agentes han tenido que aprender de forma independiente, pero también cooperar para alcanzar el bien común.

Esto es fundamental, según los investigadores de DeepMind, para que la inteligencia artificial desempeñe tareas cada vez más complejas, sin necesidad de que haya que programar todas y cada una de las posiblidades ante las que se encontrarán.

«Nadie les ha dicho cómo jugar al juego o si han logrado vencer a su enemigo o no», ha dicho Jaderberg. «La belleza de este sistema de aprendizaje por refuerzo es que nunca sabes qué tipos de comportamientos emergerán en los agentes».

Al menos que sepamos, el objetivo de DeepMind no es destruir el mundo, sino desarrollar una inteligencia artificial capaz de lidiar con tareas complejas, como el diseño de medicamentos, materiales y aplicaciones biotecnológicas, para hacerlo un poco mejor. Lo que parece seguro es que el futuro nos traerá cosas que hoy no podemos ni imaginar.