Aller au contenu principal

Des scientifiques dévoilent une IA inspirée du cerveau humain qui surpasse ChatGPT

Les premiers résultats sont spectaculaires et laissent entrevoir une nouvelle voie pour l’avenir de l’IA

Cerveau IA

Des chercheurs ont récemment développé un nouveau modèle d’intelligence artificielle (IA) inspiré du fonctionnement du cerveau humain. Ce système, appelé modèle de raisonnement hiérarchique (HRM), surpasse les performances des grands modèles de langage comme ChatGPT dans des tâches complexes de raisonnement. Conçu pour imiter le traitement des informations par le cerveau, il a obtenu des résultats particulièrement impressionnants lors d’un test de référence réputé difficile à battre.  

Une IA inspirée du fonctionnement cérébral  

Le HRM repose sur un processus hiérarchique et multi-échelle similaire à celui du cerveau humain, où différentes zones intègrent des informations sur des durées variables. Certaines régions se concentrent sur des traitements très rapides, tandis que d’autres élaborent des plans à plus long terme, intégrant des informations sur plusieurs minutes.

Selon les chercheurs de Sapient, une entreprise d’IA basée à Singapour, cette approche rend le modèle non seulement plus performant mais aussi plus efficace. Contrairement aux LLM traditionnels, le HRM nécessite moins de paramètres et d’exemples d’entraînement. L’étude a été publiée sur arXiv, mais n’a pas encore fait l’objet d’une évaluation par les pairs.

Alors que des modèles comme GPT-5 compteraient entre 3 et 5 trillions de paramètres, le HRM n’en utilise que 27 millions. De plus, il a été entraîné avec seulement 1 000 exemples, là où les LLM modernes ingèrent des montagnes de données textuelles. Malgré ces ressources limitées, ses performances rivalisent avec celles des géants.

Des performances impressionnantes  

Lors des tests effectués sur le benchmark ARC-AGI, un outil conçu pour évaluer la capacité des modèles à se rapprocher de l’intelligence artificielle générale (AGI), le HRM a démontré des performances exceptionnelles. Il a obtenu un score de 40,3 % au test ARC-AGI-1, surpassant plusieurs modèles concurrents, tels que l’o3-mini-high d’OpenAI, qui a obtenu un score de 34,5 %, le DeepSeek R1, qui a obtenu un score de 15,8 %, et le Claude 3.7 d’Anthropic, qui a obtenu un score de 21,2 %.

Dans le test ARC-AGI-2, encore plus exigeant, le HRM a également dominé avec un score de 5 %, contre seulement 3 % pour l’o3-mini-high, 1,3 % pour Deepseek R1 et 0,9 % pour Claude 3. En d’autres termes, non seulement le HRM rivalise avec des modèles géants, mais il les surpasse dans des épreuves qui mettent réellement à l’épreuve leur intelligence de raisonnement.

En plus de ces performances, il s’est montré particulièrement efficace dans des tâches complexes telles que la résolution de puzzles Sudoku ou la recherche du chemin optimal dans des labyrinthes. Là où ChatGPT ou Claude peinent à éviter les impasses, le HRM semble progresser avec une logique beaucoup plus proche de celle d’un humain.  

Une nouvelle manière de raisonner 

Contrairement aux systèmes actuels, qui s’appuient sur le raisonnement par chaîne de pensée (Chain of Thought, CoT) pour décomposer des problèmes complexes en plusieurs étapes simples exprimées en langage naturel, HRM adopte une approche radicalement différente. Il effectue les tâches de raisonnement en un seul passage, sans supervision explicite des étapes intermédiaires. 

Sa structure repose sur deux modules principaux : un module de haut niveau, dédié à la planification abstraite et lente, et un module de bas niveau, responsable des calculs rapides et détaillés. Ce fonctionnement s’inspire directement de la manière dont les différentes régions du cerveau humain collaborent pour traiter les informations. En outre, le HRM utilise une technique appelée raffinement itératif, qui consiste à améliorer progressivement une solution initiale en plusieurs étapes. À chaque étape, le modèle évalue s’il doit poursuivre le raisonnement ou fournir une réponse finale à la demande initiale.  

Les organisateurs du benchmark ARC-AGI eux-mêmes ont tenté de reproduire les performances du HRM, puisque l’équipe de chercheurs a mis son modèle en open source sur GitHub. Ils ont confirmé les chiffres annoncés, mais selon eux, l’architecture hiérarchique elle-même n’aurait eu qu’un impact limité. Les gains les plus significatifs viendraient en réalité d’un processus de raffinement appliqué lors de l’entraînement, mais mal documenté dans l’étude originale. Par ailleurs, voici comment se terminera une guerre entre l’intelligence artificielle et l’humanité.

Par Eric Rafidiarimanana, le

Source: Live Science

Étiquettes: , ,

Catégories: ,

Partager cet article

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

  • Vous êtes des amateurs .. vérifiez sur le site de arc… Hrm est dernier…. Pour le test qui n’est pas publique …. Il est facile de faire un modèle qui soit performant pour des tests publiques…. Vérifiez vos sources avant de publier