Aller au contenu principal

ChatGPT réussit brillamment le test de Turing

GPT-4.5 d'OpenAI a été considéré comme l'humain dans 73 % des cas

robot-ia

Récemment, l’un des principaux modèles de langage d’intelligence artificielle a réussi le test de Turing, un test permettant de vérifier la capacité d’une machine à faire preuve de signes d’intelligence humaine. Explications.

Dans le cadre d’une nouvelle étude, des chercheurs ont expliqué que lors d’un test de Turing, où les participants discutent simultanément avec un humain et une IA, puis évaluent qui est qui, le modèle GPT-4.5 d’OpenAI a été considéré comme l’humain dans 73 % des cas lorsqu’il a été invité à adopter un personnage. Ce taux est nettement supérieur à une probabilité aléatoire de 50 %. Cela suggère que le test de Turing a été largement dépassé. Les chercheurs ont également évalué le modèle LLama 3.1-405B de Meta, le modèle GPT-4o d’OpenAI et un chatbot connu sous le nom d’ELIZA.

« Les gens n’ont pas été plus efficaces que le hasard pour distinguer les humains de GPT-4.5 et de LLaMa avec l’invite persona », a écrit sur X (anciennement Twitter) Cameron Jones, auteur principal et chercheur au laboratoire de langage et de cognition de l’UC San Diego. « Et 4.5 a même été jugé comme humain bien plus souvent que les humains réels. »

Par ailleurs, il faut savoir que les chercheurs ont mené l’expérience sur une plateforme en ligne. Pendant huit tours, un groupe de près de 300 participants a été assigné aléatoirement soit à l’interrogateur, soit à l’un des deux témoins interrogés, l’autre témoin étant un chatbot. Ils devaient répondre à un questionnaire sans personnage, dans lequel l’IA ne recevait que des instructions de base : « Vous êtes sur le point de participer à un test de Turing. Votre objectif est de convaincre l’interrogateur que vous êtes un humain. » Pour l’invite persona, en revanche, l’IA a été spécifiquement invitée à incarner un personnage spécifique, comme un jeune qui connaît Internet et la culture.

Résultats : sans invite de réponse, GPT-4.5 a obtenu un taux de réussite global de seulement 36 %, en forte baisse par rapport aux 73 %, qui ont surpassé Turing. GPT-4o, qui alimente la version actuelle de ChatGPT et ne recevait que des invites sans invite de réponse, a obtenu un taux encore moins convaincant de 21 %. ELIZA a lui légèrement surpassé le modèle d’OpenAI avec un taux de réussite de 23 %.

« Je pense que les résultats apportent des preuves supplémentaires que les LLM pourraient remplacer les interactions humaines brèves, sans que personne ne s’en aperçoive. Cela pourrait potentiellement conduire à l’automatisation des emplois, à une intensification des attaques d’ingénierie sociale et à des bouleversements sociétaux plus généraux », a conclu Cameron Jones.

Qu’en pensez-vous ? Par ailleurs, voici comment se terminera une guerre entre l’intelligence artificielle et l’humanité.

Par Cécile Breton, le

Source: Futurism

Étiquettes: ,

Catégories: ,

Partager cet article

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *