El póker es muy caprichoso y por eso es un reto para las máquinas
El póker es muy caprichoso y por eso es un reto para las máquinas - FOTOLIA

El ordenador que gana al póker usando la intuición

«DeepStack» ha vencido a diez jugadores profesionales y ha sido el primero en aprender de la experiencia para tomar decisiones rápidas

MADRIDActualizado:

El póker es como la vida misma. Es un juego de apuestas, donde hay que valorar pros y contras y tomar decisiones, y también es un juego de adaptación, donde hay que responder a las acciones de los rivales o sencillamente a las cartas que vienen dadas. Sobre el tapete, el azar, la psicología y la información, siempre incompleta, dibujan encrucijadas desafiantes. En el mundo cotidiano, la vida está repleta de situaciones similares en las que cualquiera tiene que adoptar el papel de estratega. En esos casos, la intuición y las tablas suelen ser armas más valiosas que las calculadoras.

Siempre se ha considerado que estas dos, intuición y experiencia, eran terreno vedado para las inteligencias de las máquinas. ¿Cómo se podría trasladar algo tan intangible y subjetivo a los circuitos metálicos de un chip? Pero los expertos andan detrás de ello. Ayer mismo, un equipo internacional de científicos presentó en la prestigiosa revista « Science» los resultados alcanzados por «DeepStack», una inteligencia artificial que ha sido capaz de derrotar a 10 jugadores profesionales de póker en miles de partidas. A diferencia de todo lo que se ha hecho antes, esta máquina tiene algo parecido a una intuición que le permite aprender y adaptarse a cada mano.

Michael Brown, el primer autor del estudio e investigador en la Universidad de Alberta (Canadá), explicó a ABC que siempre se ha sentido fascinado por la idea de llevar hasta la máquina la capacidad humana de aprender de la experiencia para tomar decisiones, un campo que los expertos en inteligencia artificial estudian a través de juegos como el ajedrez o el póker. Aunque reconoció que aún queda un largo camino por recorrer, explicó que «DeepStack» marcará un antes y un después.

El algoritmo que sabe aprender

El secreto está en un algoritmo, al que han llamado «técnica de resolución continua», que le permite al programa decidir en tan solo tres segundos qué decisión tomar en base a la experiencia que ha acumulado. Después de jugar miles de partidas, el sistema extrae conclusiones y las aplica a las situaciones que se van dando, aunque no conozca todas las posibles consecuencias.

Los diez jugadores profesionales derrotados por «DeepStack» acusaron al computador de tener la suerte del principiante. Pero para Brown lo más interesante es que este algoritmo podrá usarse en cualquier campo donde la incertidumbre y la complejidad sean la norma, como ocurre en los ámbitos de la seguridad o el tráfico.

«DeepStack» demostró que es mucho más rápido que «Libratus», el otro ordenador capaz de ganar a una de las variedades de póker más desafiantes, el Texas Holdem sin límite. Además, podría funcionar en un ordenador convencional. El próximo paso es llegar a las partidas de varios jugadores y superar el uno contra uno. Muy atrás queda «DeepBlue», el ordenador que venció a Gary Kasparov en un tablero definido y de reglas equitativas que en el mundo real solo está en los juegos.