DeepSeek met les deux pieds dans le plat de l'IA 

Les capacités de l'intelligence artificielle progressent rapidement. Le 20 janvier, la start-up chinoise DeepSeek a introduit deux nouveaux modèles de langage, DeepSeek-R1 et DeepSeek-R1-Zero. Ces modèles rivalisent avec les leaders du secteur, tels qu'OpenAI et GPT-4, en matière de raisonnement. Les techniques de formation innovantes de DeepSeek pourraient être adoptées par d'autres développeurs pour améliorer l'efficacité, bien que ces modèles nécessitent encore des investissements importants car ils sont cruciaux pour les agents d'IA. Les progrès réalisés grâce à l'optimisation, plutôt qu'à l'augmentation des ressources de calcul, indiquent que le développement des agents d'IA est encore à ses débuts. 

À long terme, ces avancées devraient accélérer l'adoption de l'IA dans les entreprises, rendant les chatbots et autres agents plus intelligents et moins coûteux. La pénurie de ressources informatiques stimule l'innovation. Des rumeurs indiquent que le développement des modèles R1 ou R1-Zero a coûté 5,6 millions de dollars, comparé à plus d'un milliard pour d'autres modèles de pointe. Cependant, ce montant de 5,6 millions concerne le modèle DeepSeek-V3, formé avec des GPU Nvidia H800 (et selon des rumeurs des H100 aussi), et n'inclut pas d'autres coûts liés à la recherche et au développement (d'après DeepSeek). L'innovation réside donc dans la réduction des coûts de formation et d'inférence, rendant les services d'IA plus accessibles, des voitures aux smartphones. 

Les logiciels profitent de coûts réduits 

Les logiciels bénéficient de capacités accrues à moindre coût, ce qui est un signe positif pour le secteur. Après une période de baisse, la technologie pourrait bien rebondir dans les prochains jours, notamment avec les résultats de Meta Platforms et Microsoft attendus cette semaine. L'innovation de DeepSeek, si elle se confirme, se distingue par des besoins réduits en inférence, ce qui diminue la nécessité en mémoire et en semiconducteurs. De plus, les prix proposés aux clients finaux pourraient être de 50% à 80% inférieurs aux tarifs actuels, selon des analystes de Bank of America

Les progrès dans le développement de modèles devraient bénéficier aux entreprises de logiciels, dont beaucoup ont déjà intégré l'IA dans leurs produits. Ces améliorations permettent de créer des solutions plus performantes et moins coûteuses pour les entreprises. Des systèmes d'exploitation de modèles robustes sont essentiels pour les applications génératrices de revenus, qui en sont encore à leurs débuts. On s'attend à ce que les entreprises commencent à fournir des données quantitatives sur les revenus supplémentaires liés à l'IA au second semestre 2025. 

Les principaux gagnants de l'arrivée de DeepSeek – dans le sens où une plus grande efficacité de l'IA pourrait conduire à une plus grande utilisation de leurs applications – sont : AppLovin, MongoDB, Snowflake, Hubspot, Salesforce, Workday, Datadog, Gitlab, Okta, Cloudflare, Elastic, Zscaler, Samsara, Confluent, Monday.com, Dynatrace, SentinelOne, Crowdstrike, Atlassian, Gartner, Adobe, Instacart

La Chine se positionne à l'échelle internationale dans l'IA 

La Chine est actuellement le seul marché à se concentrer sur l'efficacité des modèles de langage (LLM) en raison des restrictions sur les puces imposées par l'administration Trump. Ces limitations ont incité Pékin à accélérer son innovation. Les entreprises les plus touchées en Asie sont celles impliquées dans la chaîne d'approvisionnement de l'intelligence artificielle, comme les fabricants de GPU, les ODM de serveurs et les producteurs de circuits imprimés. Cette situation pourrait bénéficier aux entreprises internet chinoises, mais pour des raisons différentes de celles des entreprises américaines. Pour les sociétés internet américaines, cela pourrait entraîner une réduction des dépenses d'investissement. En revanche, pour les entreprises chinoises, cela démontre que DeepSeek a réussi à développer un modèle d'IA performant. Les principaux bénéficiaires en Asie incluent Tencent, Alibaba, Kuaishou Technology, Meitu, Sensetime et Beijing Fourth Paradigm Technology