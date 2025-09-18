(Zonebourse avec Reuters) Le développeur chinois d'intelligence artificielle DeepSeek a affirmé avoir dépensé seulement 294.000 dollars pour entraîner son modèle R1, un chiffre bien inférieur aux montants avancés par ses rivaux américains, selon un article scientifique publié mercredi dans la revue Nature.

Publié le 18/09/2025 à 15:12 - Modifié le 18/09/2025 à 15:12

Cette rare mise à jour de l’entreprise basée à Hangzhou, qui dévoile pour la première fois une estimation de ses coûts, devrait relancer le débat sur la place de Pékin dans la course mondiale à l’IA.

Le lancement en janvier de ses systèmes à bas coût avait déjà provoqué un vent de panique sur les marchés technologiques, les investisseurs craignant que ces modèles ne viennent menacer la domination des champions occidentaux, comme Nvidia. Depuis, la société et son fondateur Liang Wenfeng s’étaient faits discrets, à l’exception de quelques mises à jour produits.

L’article de Nature, cosigné par Liang, précise que le modèle R1, spécialisé dans le raisonnement, a nécessité 512 puces Nvidia H800 et 80 heures de calcul. En janvier, une première version de l’étude n’indiquait pas ces données.

À titre de comparaison, Sam Altman, patron d’OpenAI, avait déclaré en 2023 que l’entraînement de modèles "fondamentaux" coûtait "bien plus" de 100 millions de dollars, sans donner davantage de détails.

Les coûts de formation d’un grand modèle de langage (LLM) regroupent les dépenses liées à l’utilisation massive, sur plusieurs semaines ou mois, de grappes de processeurs graphiques capables de traiter d’immenses volumes de texte et de code.

Certains acteurs américains contestent toutefois les affirmations de DeepSeek. Les H800 évoqués par la société sont des versions bridées, conçues par Nvidia pour le marché chinois après les restrictions américaines de 2022 sur l’exportation des plus puissantes H100 et A100.

En juin, des responsables américains avaient indiqué à Reuters que DeepSeek disposait malgré tout de "volumes importants" de H100, obtenus après l’entrée en vigueur de ces contrôles. Nvidia avait alors affirmé que l’entreprise utilisait légalement des H800.

Dans un document annexe à l’article scientifique, DeepSeek reconnaît pour la première fois posséder aussi des puces A100, utilisées lors de phases préparatoires avec des modèles plus petits. Ce n’est qu’ensuite que l’entraînement du modèle R1 a été effectué intégralement sur le cluster de H800.

Reuters avait déjà rapporté que DeepSeek avait su attirer des talents d’élite en Chine notamment grâce à son accès rare à une infrastructure de supercalcul basée sur des A100.