La capacité des modèles d'IA à raisonner n'est pas aussi bonne que nous le pensions

Récemment, une équipe de chercheurs d’Apple a constaté que la prétendue capacité des modèles d’intelligence artificielle à raisonner n’est pas aussi bonne que nous le pensions. Explications.

Selon une étude des scientifiques d’Apple, les capacités de raisonnement présumées des modèles de langage étendu (LLM) de pointe sont bien plus fragiles que nous le pensions. Pour réaliser leur étude, ils ont analysé le référentiel GSM8K, un ensemble de données utilisé pour mesurer les capacités de raisonnement de l’IA, composé de milliers de problèmes mathématiques. Ils ont découvert qu’une simple modification des problèmes donnés, comme changer un numéro ou le nom d’un personnage, provoque une augmentation massive des erreurs de l’IA.

En d’autres termes, lorsque les chercheurs ont apporté des modifications subtiles aux questions GSM8K qui n’ont pas eu d’impact sur la mécanique du problème, les modèles d’IA de pointe n’ont pas réussi à suivre. « Cela suggère que les modèles d’IA ne raisonnent pas réellement comme les humains, mais s’engagent plutôt dans une recherche de modèles plus avancée basée sur des données d’entraînement existantes », ont expliqué les experts.

Les scientifiques ajoutant : « Nous émettons l’hypothèse que ce déclin est dû au fait que les LLM actuels ne sont pas capables de raisonnement logique authentique. Au lieu de cela, ils tentent de reproduire les étapes de raisonnement observées dans leurs données de formation. »

Les résultats de cette étude remettent donc en question non seulement l’intelligence des modèles d’IA de pointe, mais aussi la précision des méthodes actuelles que nous utilisons pour évaluer et commercialiser ces modèles. « Il est essentiel de comprendre les véritables capacités de raisonnement des LLM pour les déployer dans des scénarios réels où la précision et la cohérence ne sont pas négociables, en particulier dans les domaines de la sécurité de l’IA, de l’alignement, de l’éducation, des soins de santé et des systèmes de prise de décision. Nos conclusions soulignent la nécessité de méthodes d’évaluation plus robustes et plus adaptables », a détaillé Mehrdad Farajtabar, auteur principal de l’étude et chercheur chez Apple.

Par ailleurs, voici comment se terminera une guerre entre l’intelligence artificielle et l’humanité.

Par Cécile Breton, le 25 octobre 2024

Source: Futurism

Étiquettes: intelligence artificielle

Catégories: Robots & IA, Brèves

La capacité des modèles d’IA à raisonner n’est pas aussi bonne que nous le pensions

Laisser un commentaire Annuler la réponse

Arpentez la Rome antique en l’an 360 à travers cette reconstitution impressionnante

Cette start-up va envoyer 250 satellites en orbite à l’aide d’un canon géant

Des chercheurs inventent des hologrammes que l’on peut toucher et manipuler

Cette série avec Tom Hardy et Pierce Brosnan devient la plus regardée de l’histoire de Paramount+

Le télescope spatial James-Webb repère une structure inattendue dans l’Univers primitif

Un canal construit par l’oncle de Jules César perdu depuis 2 000 ans retrouvé en France

Darren Aronofsky déteste la « Method Acting » et s’en prend aux adeptes

James Cameron estime que l’IA peut faire baisser les coûts de production des films

Cette série avec Tom Hardy et Pierce Brosnan devient la plus regardée de l’histoire de Paramount+

La capacité des modèles d’IA à raisonner n’est pas aussi bonne que nous le pensions

Partager cet article

Laisser un commentaire Annuler la réponse