Meta Platforms a publié jeudi des versions préliminaires de son dernier grand modèle linguistique, Llama 3, et d'un générateur d'images qui met à jour les images en temps réel pendant que les utilisateurs tapent des messages, afin de rattraper le leader du marché de l'IA générative, OpenAI.

Les modèles seront intégrés dans son assistant virtuel Meta AI, que la société présente comme le plus sophistiqué de ses pairs à usage gratuit, citant des comparaisons de performances sur des sujets tels que le raisonnement, le codage et l'écriture créative par rapport aux offres de rivaux tels que Google d'Alphabet et la startup française Mistral AI.

L'assistant Meta AI mis à jour occupera une place plus importante dans les applications Facebook, Instagram, WhatsApp et Messenger de Meta, ainsi que sur un nouveau site web autonome qui lui permettra de rivaliser plus directement avec ChatGPT, le succès retentissant d'OpenAI soutenu par Microsoft.

La page d'accueil de ce site invite les visiteurs à demander à l'assistant de créer une liste d'emballage pour les vacances, de jouer avec eux à des jeux télévisés sur la musique des années 1990, de les aider à faire leurs devoirs et de peindre des images de l'horizon de la ville de New York.

Meta s'est efforcé de proposer des produits d'IA générative à ses milliards d'utilisateurs afin de contester la position dominante d'OpenAI sur cette technologie, ce qui a impliqué une révision coûteuse de l'infrastructure informatique et la consolidation d'équipes de recherche et de produits auparavant distinctes.

Dans le cadre de ses efforts de rattrapage, le géant des médias sociaux a ouvertement mis à la disposition des développeurs d'applications d'IA ses modèles de lamas, car une option gratuite puissante pourrait contrecarrer les plans de ses rivaux visant à tirer des revenus de leur technologie propriétaire. Cette stratégie a suscité des inquiétudes en matière de sécurité de la part des critiques qui craignent que des acteurs peu scrupuleux n'utilisent le modèle pour créer des applications.

Meta a doté le Llama 3 de nouvelles capacités de codage informatique et l'a alimenté en images ainsi qu'en texte lors de la formation, bien que pour l'instant le modèle ne produise que du texte, a déclaré Chris Cox, chef de produit chez Meta, lors d'une interview.

Des raisonnements plus avancés, comme la capacité à élaborer des plans plus longs en plusieurs étapes, suivront dans les versions ultérieures, a-t-il ajouté. Les versions prévues pour les mois à venir seront également capables de "multimodalité", c'est-à-dire qu'elles pourront générer à la fois du texte et des images, a indiqué Meta dans des articles de blog.

"L'objectif est de vous faciliter la vie, qu'il s'agisse d'interagir avec des entreprises, d'écrire quelque chose ou de planifier un voyage", a déclaré M. Cox.

M. Cox a déclaré que l'inclusion d'images dans la formation du Llama 3 améliorerait la mise à jour des lunettes intelligentes Ray-Ban Meta, un produit fabriqué avec le fabricant de lunettes Essilor Luxoticca, qui permet à Meta AI d'identifier les objets vus par le porteur et de répondre à des questions à leur sujet.

Les actions Meta étaient en hausse de 1,8 % jeudi en fin de journée.

Meta a également annoncé un partenariat avec Google pour inclure ses résultats de recherche en temps réel dans les réponses de l'assistant, en complément d'un accord existant avec le moteur de recherche Bing de Microsoft.

L'assistant Meta AI s'étend à plus d'une douzaine de marchés en dehors des États-Unis avec cette mise à jour, dont l'Australie, le Canada, Singapour, le Nigéria et le Pakistan. Meta "travaille encore sur la bonne manière de procéder en Europe", a déclaré M. Cox, où les règles de confidentialité sont plus strictes et où la prochaine loi sur l'IA est sur le point d'imposer des exigences telles que la divulgation des données d'entraînement des modèles.

Le besoin vorace de données des modèles d'IA générative est apparu comme une source majeure de tension dans le développement de la technologie.

Mark Zuckerberg, PDG de Meta, a fait un clin d'œil à la concurrence avec OpenAI dans une vidéo accompagnant l'annonce, dans laquelle il qualifie Meta AI d'"assistant d'IA le plus intelligent que vous puissiez utiliser librement".

M. Zuckerberg a déclaré que les deux versions plus petites de Llama 3, avec 8 milliards de paramètres et 70 milliards de paramètres, ont obtenu des résultats favorables par rapport à d'autres modèles gratuits sur des critères de performance couramment utilisés pour évaluer la qualité d'un modèle. La plus grande version de Llama 3, qui compte 400 milliards de paramètres, est encore en cours d'apprentissage.

Selon Nathan Benaich, fondateur de la société de capital-risque Air Street Capital spécialisée dans l'IA, ces résultats sont "incontestablement impressionnants", mais ils témoignent également d'un écart de performance croissant entre les modèles gratuits et les modèles propriétaires.

Les développeurs se sont plaints que la version précédente du modèle Llama 2 ne comprenait pas le contexte de base, confondant les requêtes sur la façon de "tuer" un programme informatique avec les demandes d'instructions sur la façon de commettre un meurtre. Son rival Google a rencontré des problèmes similaires et a récemment suspendu l'utilisation de son outil de génération d'images Gemini AI après avoir été critiqué pour avoir produit des représentations inexactes de personnages historiques.

Meta a déclaré avoir réduit ces problèmes dans Llama 3 en utilisant des "données de haute qualité" pour que le modèle reconnaisse les nuances. La société n'a pas donné de détails sur les ensembles de données utilisés, bien qu'elle ait déclaré avoir introduit sept fois plus de données dans Llama 3 que dans Llama 2. (Article rédigé par Katie Paul à New York, complété par Jeffrey Dastin à San Francisco et révisé par Nick Zieminski et Matthew Lewis)