Aller au contenu principal

Pourquoi DeepSeek, l’IA chinoise, est-elle aussi peu coûteuse ?

DeepSeek égale les performances de ses concurrents pour une fraction de leurs coûts

Deepseek
— © Tim Reckmann / Flickr

Depuis son apparition sur le devant de la scène du domaine de l’intelligence artificielle, la plateforme chinoise DeepSeek n’a eu de cesse de faire parler d’elle. Si on en entend parler partout sur Internet, on ne se rend pas tous compte des enjeux de l’apparition de ce modèle d’IA et de toutes les innovations qu’il pourrait apporter.

DeepSeek, c’est quoi ?

DeepSeek est le nom d’un chatbot gratuit alimenté par le modèle d’intelligence artificielle DeepSeek R1 conçu par une startup chinoise du même nom. Cet agent conversationnel fonctionne et ressemble beaucoup à ChatGPT d’OpenAI, mais on dit qu’il est plus performant par rapport aux autres outils d’IA actuellement disponibles pour le grand public. De plus, DeepSeek est open source, ce qui signifie que tout le monde peut consulter, utiliser et améliorer son code source. Ce qui impressionne le plus au sujet de DeepSeek, c’est le fait que son coût de développement est étonnamment bas. Ce coût a été estimé à environ 6 millions de dollars.

À titre de comparaison, OpenAI a dépensé dans les 100 millions de dollars pour le développement de son dernier modèle d’IA GPT-4. Cela a été possible car les créateurs de DeepSeek auraient réussi à contourner les restrictions imposées par le besoin d’utiliser des puces électroniques très puissantes pour le développement de l’IA. Il faut savoir que le gouvernement américain a interdit l’exportation de puces électroniques – notamment celles de Nvidia – en Chine. Ainsi, les développeurs de cette IA auraient utilisé un assemblage de puces plus anciennes, moins chères et moins sophistiquées de Nvidia pour la développer.

Or, les anciens modèles de puces coûtent moins cher que celles qui sont plus récentes et plus performantes. Avec cet exploit, ils ont voulu prouver qu’un logiciel de qualité peut compenser les limitations matérielles. Les créateurs de DeepSeek ont notamment affirmé que cela a été rendu possible grâce à un système de « mélange d’experts » qui divise les modèles de DeepSeek en sous-modèles, chacun spécialisé dans une tâche ou un type de données spécifique. Cela s’accompagne d’un système de support de charge qui déplace dynamiquement les tâches des sous-modèles surchargés vers les sous-modèles sous-utilisés.

DeepSeek va-t-elle réellement changer la donne dans le domaine de l’IA ?

Que cela soit en matière de performances, de coûts ou de moyens déployés pour développer DeepSeek, des doutes planent encore sur la véracité des informations qui circulent à son sujet. Ce qui est indéniable, c’est l’impact qu’elle a eu sur le marché mondial de l’IA. Très peu de temps après sa sortie en janvier 2025, DeepSeek avait dépassé ChatGPT en matière de téléchargements sur l’App Store d’Apple. Elle est même devenue l’application gratuite la plus téléchargée de cette plateforme aux États-Unis. Cela a déclenché une chute mondiale des actions technologiques.

L’exemple le plus impressionnant concerne le cas de Nvidia. Les actions du principal fournisseur de puces d’IA au monde ont en effet chuté de près de 17 % à la fin du mois de janvier et l’entreprise a perdu 588,8 milliards de dollars de valeur boursière. Il s’agit de loin de la plus grande valeur boursière jamais perdue par une action en une seule journée. Bien évidemment, tout ce brouhaha a soulevé de vives inquiétudes quant aux milliards de dollars que les entreprises technologiques américaines consacrent à l’expansion des centres de données énergivores, des dépenses qu’elles prétendent vitales pour la prochaine percée de l’IA.

Par ailleurs, voici comment se terminera une guerre entre l’intelligence artificielle et l’humanité.

Par Gabrielle Andriamanjatoson, le

Source: Live Science

Étiquettes: ,

Catégories: ,

Partager cet article

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *