Baidu, Inc. a présenté ERNIE Bot, un produit d'IA générative et de modèle de langage étendu (LLM) de nouvelle génération. ERNIE Bot excelle dans toute une série de domaines, notamment la compréhension de la langue et de la culture chinoises, la production d'écrits littéraires et commerciaux, l'exécution de calculs mathématiques complexes et la production de contenus multimodaux. Le produit d'IA peut comprendre les intentions humaines et fournir des réponses précises, logiques et fluides qui se rapprochent du niveau humain.

À partir du 16 mars 2023, ERNIE Bot sera ouvert à un premier groupe d'utilisateurs munis de codes d'invitation et sera bientôt mis à la disposition d'un plus grand nombre d'utilisateurs. Baidu propose également un accès à l'API d'ERNIE Bot via Baidu AI Cloud, permettant aux entreprises clientes de demander et d'exploiter les capacités linguistiques avancées de la plateforme. Depuis février, plus de 650 entreprises ont rejoint l'écosystème d'ERNIE Bot.

Lors de la conférence de presse dévoilant ERNIE Bot à Pékin, Robin Li a présenté ses performances dans cinq scénarios : création littéraire, rédaction commerciale, calcul mathématique, compréhension de la langue chinoise et génération multimodale. Création littéraire : ERNIE Bot a résumé le contenu essentiel du roman de science-fiction chinois populaire, Le problème à trois corps. Il a proposé cinq angles d'expansion potentielle de l'histoire sur la base de requêtes de dialogue, démontrant son expertise complète en matière de dialogue, d'analyse et de génération de contenu, ainsi que sa factualité et son raisonnement soutenus par des graphes de connaissances inhérents.

Rédaction commerciale : Capable de servir de rédacteur commercial polyvalent, ERNIE Bot a démontré sa capacité à construire une marque à partir de zéro, ce qui englobe des tâches telles que la conception d'un nom pour une entreprise, l'élaboration d'un slogan de marque attrayant et la rédaction de communiqués de presse. Cette capacité créative de haut niveau est possible parce qu'ERNIE Bot est entraîné sur des trillions de pages web, des dizaines de milliards de données de recherche et d'images, des centaines de milliards de données vocales quotidiennes et un graphe de connaissances de 550 milliards de faits. Calculs mathématiques : ERNIE Bot possède également un niveau de capacité cognitive qui lui permet de maîtriser des tâches relativement complexes telles que la dérivation mathématique et le raisonnement logique.

Lorsqu'il est confronté à des énigmes classiques telles que le problème du "lapin et de la poule dans la même cage", qui met à l'épreuve la pensée logique humaine, ERNIE Bot peut comprendre le sens de la question, développer une approche correcte de la résolution du problème et suivre les étapes appropriées pour parvenir à la bonne réponse. Compréhension de la langue chinoise : ERNIE Bot démontre des capacités inégalées de traitement du langage naturel (NLP) en chinois, ce qui se reflète dans sa compréhension de la langue chinoise et des nuances culturelles. Dans une démonstration, ERNIE Bot a expliqué la signification de l'expression "Le papier est cher à Luoyang", qui fait allusion à la forte demande de papier due à la popularité de la poésie.

ERNIE Bot a expliqué la théorie économique qui sous-tend l'idiome - la loi de l'offre et de la demande - et a créé un poème incorporant les quatre caractères chinois de l'idiome comme premier mot de chaque ligne. Génération multimodale : ERNIE Bot peut produire du texte, des images, du son et de la vidéo à partir d'une invite textuelle, et est même capable de parler dans plusieurs dialectes locaux tels que le dialecte du Sichuan. Les fonctions de génération vidéo d'ERNIE Bot ne sont pas encore accessibles à tous les utilisateurs en raison de leur coût relativement élevé.