Une IA développée par la société britannique DeepMind s’est classée parmi les meilleurs joueurs sur la version en ligne du célèbre jeu de plateau Stratego, en apprenant à bluffer et à sacrifier des pièces importantes pour s’adjuger la victoire.
L’intelligence artificielle DeepNash
S’inspirant des campagnes napoléoniennes, Stratego oppose deux joueurs tentant de capturer le drapeau adverse, caché parmi un ensemble de 40 pièces de jeu. Si celles-ci représentent majoritairement des fonctions ou grades militaires numérotés de 1 à 10 (avec des soldats de rang supérieur battant leurs homologues de rang inférieur), contrairement à la plupart des jeux de plateau, seules les confrontations directes permettent de connaître la nature des pièces de son adversaire.
Dans le cadre de travaux publiés dans la revue Science, Julien Perolat et ses collègues de DeepMind ont mis au point une nouvelle IA baptisée DeepNash, visant à surpasser ses adversaires humains sur ce jeu de stratégie extrêmement complexe (avec 10 535 situations de jeu possibles, soit plus que le jeu de Go, les échecs ou le poker).
Pour ce faire, l’équipe a fait participer son intelligence artificielle à quelque 5,5 milliards de parties simulées, correspondant à des centaines d’années de jeu. À la différence de bon nombre de ses homologues, cette phase d’apprentissage n’a pas impliqué l’analyse de stratégies humaines spécifiques à Stratego, ou de parties l’opposant à de véritables joueurs.
Plutôt que d’essayer de jouer en explorant toutes les situations de jeu possibles, ce qui serait techniquement irréalisable, l’algorithme de DeepNash oriente constamment son comportement vers une stratégie « optimale », garantissant un taux de victoire d’au moins 50 % contre un adversaire ne commettant pas d’erreurs. Ce, en dépit d’informations incomplètes, et du nombre considérable d’actions pouvant être entreprises à chaque tour.
Des performances impressionnantes
DeepNash a atteint un taux de victoire de 84 % lors de 50 matchs classés contre des joueurs humains experts sur la version en ligne du jeu, lui ayant permis d’entrer dans le top 3 sans que ces derniers ne soupçonnent qu’ils affrontaient une machine. L’IA de DeepMind a également remporté 97 % des parties l’ayant opposée aux meilleurs bots jouant à Stratego.
« Les bons joueurs ont tendance à mémoriser les pièces de l’adversaire et à prédire leurs schémas de déploiement », commente Georgios Yannakakis de l’université de Malte. « Si DeepNash dispose d’un avantage évident en ce qui concerne la mémorisation, il fait bien les deux, joue de manière intéressante et imprévisible et n’hésite pas à user du bluff. »
« Le plus surprenant reste sans doute sa capacité à sacrifier des pièces de valeur pour obtenir des informations sur la configuration et la stratégie adverse », conclut Perolat.