Aller au contenu principal

Cette IA révolutionnaire est capable de maîtriser plusieurs jeux, comme les échecs et le poker

Elle est même capable de battre des joueurs humains

— kirill_makarov / Shutterstock.com

L’intelligence artificielle (IA) a toujours été fascinée par les jeux, utilisant des défis comme les échecs ou le poker pour mesurer et améliorer ses capacités. Récemment, une avancée majeure a été réalisée avec le développement de « Student of Games », un algorithme capable de traiter à la fois dans des jeux à information parfaite et imparfaite. Cette innovation, qui marque un tournant dans le domaine de l’IA, a été décrite dans un article publié dans la revue Science Advances.

Une conception polyvalente

Traditionnellement, les programmes d’IA se spécialisent soit dans des jeux à information complète comme les échecs, soit dans des jeux à information partielle comme le poker. Le nouvel algorithme « Student of Games » se distingue par sa polyvalence remarquable. Cet algorithme est capable de maîtriser aussi bien des jeux à information complète, comme les échecs ou le Go, que des jeux à information partielle, comme le poker. 

Les jeux servent depuis longtemps de terrain d’expérimentation pour les progrès de l’IA, avec des moments clés comme la victoire d’AlphaGo sur un joueur de Go professionnel en 2016, ou celle de Libratus sur des joueurs de poker de haut niveau en 2017. Ces succès illustrent l’importance des jeux en tant que références pour l’évolution de l’IA.

Pour atteindre cet exploit, les chercheurs ont combiné des méthodes de recherche guidée, d’apprentissage automatique et de raisonnement théorique. Martin Schmid, PDG d’EquiLibre Technologies et auteur principal de l’étude, souligne que cette innovation ouvre la voie à des algorithmes plus universels, capables de fonctionner dans divers contextes de jeu. La création d’un nouveau formalisme pour concevoir de tels algorithmes est un aspect crucial de cette recherche.

La performance de « Student of Games »

L’une des innovations clés de « Student of Games » réside dans son utilisation d’un algorithme de minimisation des regrets contrefactuels par arbre croissant (GT-CFR), qui lui permet d’apprendre en jouant contre lui-même. Cette approche lui confère la capacité de s’adapter et d’exceller dans des scénarios variés. 

Bien que « Student of Games » ait démontré des compétences impressionnantes dans des jeux tels que les échecs, le Go, le Texas Hold’em et Scotland Yard, il n’a pas encore atteint le niveau des meilleurs algorithmes spécialisés dans ces jeux. Par exemple, face à des adversaires comme AlphaZero, il montre des performances moins élevées, indiquant que, bien qu’il soit polyvalent, il y a toujours de la place pour l’amélioration et la spécialisation.

La performance de « Student of Games » dans des jeux à information imparfaite, comme le poker, où il a surpassé Slumbot, un agent de poker Texas Hold’em de haut niveau, est particulièrement notable. Cela montre que les algorithmes polyvalents peuvent être efficaces même dans des contextes où l’information est incomplète ou cachée. Cependant, il existe des limites à sa capacité à gérer des jeux avec une complexité informationnelle plus élevée, comme Starcraft ou Stratego.

Amélioration des performances

Finbarr Timbers, coauteur de l’étude, indique que des jeux avec une grande quantité d’informations privées, tels que Starcraft ou Stratego, demeurent hors de portée pour « Student of Games ». L’équipe de recherche envisage de poursuivre ses travaux en explorant ces limites et en cherchant à réduire les coûts et la puissance de calcul nécessaires pour faire fonctionner cet algorithme innovant.

Cette réussite représente une percée significative, car elle montre que les algorithmes peuvent être conçus pour gérer une gamme plus large de défis intellectuels. L’équipe de recherche envisage de continuer à explorer les limites de « Student of Games », notamment en ce qui concerne la gestion des jeux avec une grande quantité d’informations cachées. Il existe également un intérêt à réduire les coûts et la puissance de calcul nécessaires pour faire fonctionner cet algorithme innovant.

L’IA continuant à progresser, il est probable que des applications plus larges et plus sophistiquées verront le jour dans les années à venir, non seulement dans le domaine des jeux, mais aussi dans d’autres secteurs nécessitant une prise de décision stratégique et complexe. Par ailleurs, cette IA révolutionnaire est capable de maîtriser plusieurs jeux sans en connaître les règles.

Par Eric Rafidiarimanana, le

Source: Live Science

Étiquettes: ,

Catégories: ,

Partager cet article

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *