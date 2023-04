Nvidia domine le marché de l'entraînement des modèles d'IA avec d'énormes quantités de données. Mais une fois que ces modèles d'IA sont entraînés, ils sont plus largement utilisés dans ce que l'on appelle "l'inférence" en effectuant des tâches telles que générer des réponses textuelles à des messages-guides et décider si une image contient un chat.

Les analystes estiment que le marché des puces d'inférence pour les centres de données connaîtra une croissance rapide à mesure que les entreprises intégreront les technologies d'IA dans leurs produits, mais des sociétés telles que Google (Alphabet Inc.) étudient déjà les moyens de limiter les coûts supplémentaires que cela entraînera.

L'un de ces coûts importants est l'électricité, et Qualcomm a mis à profit son expérience en matière de conception de puces pour les appareils alimentés par batterie, tels que les smartphones, pour créer une puce appelée Cloud AI 100 qui vise une consommation d'énergie parcimonieuse.

Selon les données de test publiées mercredi par MLCommons, un consortium d'ingénieurs qui gère les tests de référence largement utilisés dans l'industrie des puces d'IA, la puce AI 100 de Qualcomm a battu la puce phare H100 de Nvidia en matière de classification d'images, en se basant sur le nombre de requêtes de serveur de centre de données que chaque puce peut effectuer par watt.

Les puces de Qualcomm ont atteint 197,6 requêtes de serveur par watt contre 108,4 requêtes par watt pour Nvidia. Neuchips, une startup fondée par Youn-Long Lin, un universitaire taïwanais expérimenté dans le domaine des puces, a remporté la première place avec 227 requêtes par watt.

Qualcomm a également battu Nvidia en matière de détection d'objets avec un score de 3,2 requêtes par watt contre 2,4 requêtes par watt pour Nvidia. La détection d'objets peut être utilisée dans des applications telles que l'analyse d'images de magasins de détail pour déterminer les endroits où les clients se rendent le plus souvent.

Nvidia a toutefois remporté la première place en termes de performances absolues et d'efficacité énergétique lors d'un test de traitement du langage naturel, qui est la technologie d'IA la plus largement utilisée dans des systèmes tels que les chatbots. Nvidia a atteint 10,8 échantillons par watt, tandis que Neuchips s'est classé deuxième avec 8,9 échantillons par watt et Qualcomm troisième avec 7,5 échantillons par watt.