
Lors d’un tournoi d’échecs organisé par Google, deux des IA les plus médiatisées du moment se sont affrontées. Loin du choc des titans attendu, la rencontre a tourné à la leçon : le modèle d’OpenAI a écrasé celui d’Elon Musk, révélant des lacunes criantes dans l’approche de xAI. Une défaite symbolique, à un moment stratégique pour le fondateur de Tesla.
OpenAI et xAI s’affrontent dans un tournoi sans filet qui expose leur véritable niveau d’intelligence
Elon Musk et Sam Altman se sont affrontés cet été, par IA interposée, dans un match qui fera date. Lors du tournoi « Kaggle Game Arena AI Chess Exhibition », les modèles o3 d’OpenAI et Grok 4 de xAI ont croisé le fer sur l’échiquier sans assistance ni entraînement spécialisé. L’objectif était clair : tester leur intelligence générale face à un cadre rigide, sans moteur d’échecs.
Mais dès les premières parties, l’écart entre les deux intelligences a sauté aux yeux. Le modèle o3 a écrasé Grok 4 sur un score sans appel de 4 à 0. Un résultat qui ne doit rien au hasard.
Même Magnus Carlsen, présent en tant que commentateur, n’a pas mâché ses mots. Il a comparé les deux IA à des « enfants doués qui ne savent pas comment les pièces bougent ». Une formule sévère, mais qui reflète bien le niveau global du match.
Perte de pièces, erreurs tactiques et déconnexion stratégique : Grok s’effondre face à o3
Grok 4 n’a cessé de multiplier les maladresses. Dès la première partie, l’IA a offert des pièces importantes sans raison stratégique, donnant un avantage immédiat à son adversaire. Ensuite, elle a tenté de capturer un « pion empoisonné », déclenchant la perte de sa reine.
Dans la troisième partie, alors qu’elle tenait une position équilibrée, elle a enchaîné les coups incohérents. Et même dans la quatrième manche, où Grok semblait dominer, elle a perdu pied. Le modèle o3 d’OpenAI a su renverser la situation et conclure proprement.
Hikaru Nakamura, également commentateur, a résumé l’écart avec lucidité : « OpenAI n’a pas commis les erreurs que Grok a faites. » Une simple différence de rigueur… qui a suffi à tout faire basculer.
Le tournoi révèle les failles profondes des IA généralistes face à des règles rigides et codifiées
Au-delà du score, le tournoi a révélé les failles structurelles des modèles de langage dans un environnement aussi rigide que les échecs. De nombreux modèles ont été disqualifiés en phase préliminaire, certains inventant des règles ou ramenant à la vie des pièces capturées.
Même en finale, les IA peinaient à appliquer les bases : respecter les déplacements autorisés, anticiper les fins de partie, construire une stratégie cohérente. Comme l’a noté Carlsen, ces modèles savent « compter les pièces », mais pas forcément comment gagner une partie.
Ce n’est pas la première fois qu’une telle démonstration tourne à la confusion. En début d’année, Levy Rozman avait organisé un tournoi similaire. Là aussi, les IA généralistes avaient brillé… par leur maladresse.
Pour Elon Musk, cette deuxième défaite publique contre OpenAI en 2025 tombe au plus mauvais moment. xAI vient de lever 10 milliards de dollars, et cherche à prouver sa légitimité. Pourtant, cette démonstration révèle encore un gouffre entre ambition marketing et performances réelles.
La leçon ? L’IA peut écrire, discuter, convaincre. Mais face à des règles strictes et un cadre formel, elle doit encore apprendre à penser comme un joueur… et non comme un narrateur.
Par Eric Rafidiarimanana, le
Catégories: Actualités, Robots & IA
Sur un test précis, un tournoi ici, Grok « s’écroule ».
En revanche sur des tests normés, notamment d’écriture de code (IOI benchmark), il ne s’agit pas de marketing mais bien d’une domination sans équivoque de Grok. Mais ça évidemment, on ne le dit surtout pas…
Bonjour Christophe, cet article à surtout relayé un tournois entre deux IA, rien de plus. Nous ne sommes pas en train de dire que Grok est moins bon, mais sur ce test il a perdu. Nous serons ravis de faire un autre articles sur un autre test même si Grok bat OpenAI. Et si vous ne l’avez pas vu, nous avons un article qui parle que GPT-5 a eu aussi des problèmes.