Renesas Electronics Corporation a annoncé le développement d'une technologie de processeur intégré qui permet d'augmenter la vitesse et de réduire la consommation d'énergie dans les unités de microprocesseur (MPU) qui réalisent une vision avancée de l'IA. Les technologies nouvellement développées sont les suivantes : (1) un accélérateur d'IA basé sur un processeur reconfigurable dynamiquement (DRP) qui traite efficacement des modèles d'IA légers et (2) une technologie d'architecture hétérogène qui permet un traitement en temps réel en faisant fonctionner de manière coopérative des IP de processeurs, tels que le CPU. Renesas a produit un prototype d'AI-MPU intégré avec ces technologies et a confirmé son fonctionnement à grande vitesse et à faible consommation d'énergie.

Il a permis un traitement jusqu'à 16 fois plus rapide (130 TOPS) qu'avant l'introduction de ces nouvelles technologies, et une efficacité énergétique de classe mondiale (jusqu'à 23,9 TOPS/W à une alimentation de 0,8 V). Avec l'expansion récente des robots dans les usines, la logistique, les services médicaux et les magasins, il existe un besoin croissant de systèmes capables de fonctionner de manière autonome en temps réel en détectant l'environnement à l'aide d'une IA de vision avancée. Étant donné que la production de chaleur est soumise à de sévères restrictions, en particulier pour les dispositifs embarqués, les puces d'IA doivent être à la fois plus performantes et moins gourmandes en énergie.

Renesas a développé de nouvelles technologies pour répondre à ces exigences et a présenté ces réalisations le 21 février, lors de l'International Solid-State Circuits Conference 2024 (ISSCC 2024), qui s'est tenue du 18 au 22 février 2024 à San Francisco. Les technologies développées par Renesas sont les suivantes : (1) Un accélérateur d'IA qui traite efficacement les modèles d'IA légers - En tant que technologie typique pour améliorer l'efficacité du traitement de l'IA, l'élagage est disponible pour omettre les calculs qui n'affectent pas de manière significative la précision de la reconnaissance. Cependant, il est courant que des calculs n'affectant pas la précision de la reconnaissance existent de manière aléatoire dans les modèles d'IA.

Il en résulte une différence entre le parallélisme du traitement matériel et le caractère aléatoire de l'élagage, ce qui rend le traitement inefficace. Pour résoudre ce problème, Renesas a optimisé son accélérateur d'IA basé sur le DRP (DRP-AI) pour l'élagage. En analysant la manière dont les caractéristiques du modèle d'élagage et une méthode d'élagage sont liées à la précision de la reconnaissance dans les modèles d'IA de reconnaissance d'images typiques (modèles CNN), Renesas a identifié la structure matérielle d'un accélérateur d'IA qui peut atteindre à la fois une précision de reconnaissance élevée et un taux d'élagage efficace, et l'a appliquée à la conception de l'accélérateur DRP-AI.

En outre, un logiciel a été développé pour réduire le poids des modèles d'IA optimisés pour cette DRP-AI. Ce logiciel convertit la configuration du modèle d'élagage aléatoire en calcul parallèle très efficace, ce qui permet un traitement de l'IA à plus grande vitesse. En particulier, la technologie de support d'élagage très flexible de Renesas (technologie d'élagage N:M flexible), qui peut changer dynamiquement le nombre de cycles en réponse aux changements du taux d'élagage local dans les modèles d'IA, permet un contrôle fin du taux d'élagage en fonction de la consommation d'énergie, de la vitesse de fonctionnement et de la précision de reconnaissance exigées par les utilisateurs.

Cette technologie réduit le nombre de cycles de traitement des modèles d'IA à un seizième de l'élagage des modèles incompatibles et consomme moins d'un huitième de l'énergie. (2) Technologie d'architecture hétérogène permettant un traitement en temps réel pour le contrôle des robots - Les applications robotiques nécessitent un traitement IA de vision avancé pour la reconnaissance de l'environnement. Parallèlement, l'évaluation et le contrôle des mouvements du robot nécessitent une programmation détaillée des conditions en réponse aux changements de l'environnement, de sorte que le traitement logiciel basé sur l'unité centrale est plus approprié que le traitement basé sur l'intelligence artificielle.

La difficulté réside dans le fait que les processeurs intégrés actuels ne sont pas totalement capables de contrôler les robots en temps réel. C'est pourquoi Renesas a introduit un processeur reconfigurable dynamiquement (DRP), qui gère le traitement complexe, en plus de l'unité centrale et de l'accélérateur d'intelligence artificielle (DRP-AI). Cela a conduit au développement d'une technologie d'architecture hétérogène qui permet des vitesses plus élevées et une consommation d'énergie plus faible dans les AI-MPU en distribuant et en parallélisant les processus de manière appropriée.

Un DRP exécute une application tout en modifiant dynamiquement la configuration de la connexion des circuits entre les unités arithmétiques à l'intérieur de la puce pour chaque horloge d'opération en fonction des détails du traitement. Comme seuls les circuits arithmétiques nécessaires fonctionnent, même pour un traitement complexe, il est possible de réduire la consommation d'énergie et d'augmenter la vitesse. Par exemple, le SLAM (Simultaneously Localization and Mapping), l'une des applications typiques des robots, est une configuration complexe qui nécessite plusieurs processus de programmation pour la reconnaissance de la position du robot en parallèle avec la reconnaissance de l'environnement par le traitement de l'IA de la vision.

Renesas a démontré le fonctionnement de ce SLAM par le biais d'une commutation instantanée de programme avec le DRP et le fonctionnement parallèle de l'accélérateur d'IA et du CPU, ce qui permet d'obtenir des vitesses de fonctionnement environ 17 fois plus rapides et une efficacité énergétique environ 12 fois supérieure à celle du CPU intégré seul. Vérification du fonctionnement - Renesas a créé un prototype de puce d'essai avec ces technologies et a confirmé qu'il atteignait un rendement énergétique de 23,9 TOPS par watt à une tension normale de 0,8 V pour l'accélérateur d'IA et un rendement énergétique de 10 TOPS par watt pour les principaux modèles d'IA. L'étude a également prouvé que le traitement de l'IA est possible sans ventilateur ni dissipateur thermique.

L'utilisation de ces résultats permet de résoudre le problème de la production de chaleur due à l'augmentation de la consommation d'énergie, qui a été l'un des défis associés à la mise en œuvre de puces d'IA dans une variété de dispositifs embarqués tels que les robots de service et les véhicules guidés automatisés. La réduction significative de la production de chaleur contribuera à la diffusion de l'automatisation dans diverses industries, telles que les marchés de la robotique et des technologies intelligentes. Ces technologies seront appliquées aux MPU de la série RZ/V de Renesas ?

RZ/V de Renesas pour les applications d'intelligence artificielle.