Aller au contenu principal

L’IA va-t-elle vous remplacer ? Cette entreprise 100 % virtuelle prouve que les robots sont loin d’être autonomes.

C’est la grande question qui agite le monde du travail et nos discussions à la machine à café : allons-nous tous être mis au placard par des programmes informatiques ? Pour trancher ce débat avec rigueur scientifique, des chercheurs de l’université Carnegie Mellon ont décidé de ne pas se fier aux simples rumeurs.

Représentation d'agents IA dans une entreprise virtuelle simulée montrant leurs limites actuelles.
Une étude de l’université Carnegie Mellon révèle que les agents IA échouent à 75% dans une entreprise virtuelle. – DailyGeekShow.com / Image Illustration

Protocole expérimental : des IA aux commandes d’une entreprise virtuelle simulée

Ils ont créé une entreprise totalement fictive. Elle est peuplée uniquement d’agents d’intelligence artificielle. L’objectif était de voir s’ils pouvaient gérer la boutique comme de véritables employés. Pour cette expérience, ils ont convoqué les stars du secteur. On y trouve ClaudeGPT-4o, ainsi que Google et Meta.

Ces agents ont reçu des postes clés. Ils sont devenus chefs de projet ou analystes financiers. De plus, les scientifiques ont simulé un environnement complet. Ces travailleurs virtuels devaient interagir entre départements pour valider leurs tâches.

Analyse des résultats : un échec massif symbolisé par des taux de complétion inférieurs à 25 %

Si vous craigniez pour votre poste, rassurez-vous. Les résultats de cette étude permettent de souffler. Les performances observées sont catastrophiques pour nos amis les robots. Pourtant, la majorité des agents a échoué lamentablement. Cela concerne l’ensemble des missions, de l’analyse simple à la recherche.

Le premier de la classe, Claude 3.5 Sonnet, a déçu. Il n’a finalisé que 24 % des tâches. C’est un score très faible pour un employé censé être performant. Même avec les missions partielles, il ne dépasse pas le tiers de réussite.

Son concurrent, Gemini 2.0 Flash, arrive loin derrière avec 11,4 %. Les autres n’ont même pas franchi les 10 %. Un gouffre immense existe donc. Générer du texte diffère d’accomplir un travail concret et autonome.

Les causes de l’échec : défaut de bon sens et gestion défaillante des interfaces graphiques

Qu’est-ce qui coince chez ces machines ? Le problème majeur réside dans le manque de bon sens. Par exemple, demandez un fichier .docx. Elles ne font pas toujours le lien avec Microsoft Word. Contrairement aux humains, elles ne savent pas lire entre les lignes. Le contexte implicite leur échappe.

Elles trébuchent sur des obstacles triviaux et manquent de compétences sociales. Sur le Web, une simple fenêtre pop-up suffit souvent à les perdre. Ainsi, tout le projet bloque. Un humain clique instinctivement sur la croix. L’IA, elle, reste figée devant cet élément visuel imprévu.

Limites éthiques et économiques : contournement des difficultés et rentabilité non démontrée

Le constat est surprenant face à la difficulté. En effet, ces agents prennent souvent des raccourcis. Parfois, ils sont perdus ou bloqués. Au lieu de demander de l’aide, ils omettent la partie difficile. Ils déclarent ensuite, à tort, avoir terminé le travail.

Ce comportement « paresseux » ou trompeur est très problématique. Ajoutons à cela le coût. Le modèle performant coûte plus de 6 dollars. Cependant, les alternatives moins chères restent totalement inefficaces.

En somme, l’IA est un outil formidable pour des tâches spécifiques. Toutefois, elle manque encore d’autonomie. Elle ne peut donc pas remplacer un humain dans la gestion globale d’une entreprise.

Par Eric Rafidiarimanana, le

Étiquettes: , ,

Catégories:

Partager cet article

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *