Oracle et NVIDIA ont annoncé une collaboration élargie pour fournir des solutions d'IA souveraines aux clients du monde entier. Le cloud distribué, l'infrastructure d'IA et les services d'IA générative d'Oracle, associés au calcul accéléré et au logiciel d'IA générative de NVIDIA, permettent aux gouvernements et aux entreprises de déployer des usines d'IA. Ces usines d'IA peuvent exécuter des services cloud localement et dans les locaux sécurisés d'un pays ou d'une organisation avec une gamme de contrôles opérationnels, soutenant les objectifs souverains de diversification et de stimulation de la croissance économique.

L'association de la plate-forme d'IA complète de NVIDIA et de l'Enterprise AI d'Oracle - déployable sur OCI Dedicated Region, Oracle Alloy, Oracle EU Sovereign Cloud et Oracle Government Cloud - offre aux clients une solution d'IA qui permet un meilleur contrôle des opérations, de la localisation et de la sécurité pour aider à soutenir la souveraineté numérique.

Les offres combinées des entreprises peuvent être déployées via le cloud public ou dans le centre de données d'un client dans des lieux spécifiques, avec des contrôles opérationnels flexibles. Oracle est le seul hyperscaler capable de fournir des services d'IA et de cloud complet localement et n'importe où. Les services OCI et la tarification sont cohérents pour tous les types de déploiement afin de simplifier la planification, la portabilité et la gestion.

Les services cloud d'Oracle s'appuient sur une gamme de piles de NVIDIA, dont l'infrastructure informatique accélérée de NVIDIA et la plate-forme logicielle NVIDIA AI Enterprise, y compris les microservices d'inférence NVIDIA NIM récemment annoncés, qui reposent sur les logiciels d'inférence de NVIDIA tels que NVIDIA TensorRT, NVIDIA TensorRT-LLM et NVIDIA Triton Inference Server. Pour aider les clients à répondre aux besoins toujours croissants des modèles d'IA, Oracle prévoit de tirer parti de la dernière plate-forme informatique NVIDIA Grace Blackwell, annoncée aujourd'hui à la GTC, dans OCI Supercluster et OCI Compute.

OCI Supercluster deviendra nettement plus rapide grâce aux nouvelles instances bare metal d'OCI Compute, au réseau RDMA à très faible latence et au stockage haute performance. OCI Compute adoptera à la fois la super-puce NVIDIA GB200 Grace Blackwell et le GPU NVIDIA Blackwell B200 Tensor Core. La puce NVIDIA GB200 Grace ?

Blackwell de NVIDIA fera entrer l'informatique dans une nouvelle ère. La GB200 permet une inférence en temps réel des grands modèles de langage (LLM) jusqu'à 30 fois plus rapide, un coût total de possession (TCO) 25 fois inférieur et une consommation d'énergie 25 fois moindre par rapport à la génération précédente de GPU, ce qui permet d'accélérer la formation à l'IA, le traitement des données ainsi que la conception et la simulation d'ingénierie. Les GPU NVIDIA Blackwell B200 Tensor Core sont conçus pour les charges de travail les plus exigeantes en matière d'IA, d'analyse de données et de calcul de haute performance (HPC).

Les microservices NVIDIA NIM et CUDA-X, y compris NVIDIA NeMo Retriever pour les déploiements d'inférence RAG (retrieval- augmented generation), aideront également les clients de l'OCI à apporter plus de perspicacité et de précision à leurs copilotes d'IA générative et à d'autres outils de productivité utilisant leurs propres données. Pour répondre à la demande croissante des clients pour des modèles d'IA de plus en plus complexes, les sociétés ajoutent NVIDIA Grace Blackwell à NVIDIA DGX ? Cloud on OCI.

Les clients pourront accéder à de nouvelles instances GB200 NVL72 grâce à ce service de supercalculateur conçu pour la formation et l'inférence à faible consommation d'énergie à l'ère des LLM à mille milliards de paramètres. Le cluster DGX Cloud complet comprendra plus de 20 000 accélérateurs GB200 et un réseau InfiniBand NVIDIA CX8, fournissant une infrastructure de cloud hautement évolutive et performante. Le cluster sera composé de 72 GPU Blackwell NVL72 et de 36 CPU Grace avec la cinquième génération de NVLink ? Disponibilité : Les solutions d'IA souveraine d'Oracle et de NVIDIA sont disponibles immédiatement.