« Grace » : le processeur ARM de Nvidia aussi avec 144 cœurs CPU

Nvidia lance le processeur ARM Grace qu’elle a développé elle-même dans une variante qui combine deux puces CPU dans un boîtier et atteint ainsi 144 cœurs de calcul. Lors de la présentation du GTC, le chef de Nvidia Jensen Huang a lancé des superlatifs : pour le lancement de la livraison au premier semestre 2023, la « superpuce Grace » doit devenir le processeur le plus rapide pour les superordinateurs et atteindre la meilleure performance par watt.

Un tel réseau de deux processeurs se comporte comme un seul processeur. Les deux CPU communiquent via une variante de NVLink 4 de Nvidia adaptée à cet effet, appelée NVLink Chip-to-Chip (NVLink-C2C). Cette interconnexion doit permettre de faire circuler des données entre les processeurs à une vitesse de 900 Go/s. Les données sont transmises par le biais d’un câble de communication.

Les cœurs de CPU utilisés sont des cœurs ARMv9 standard – on pourrait imaginer des ARM Neoverse N2. L’ensemble des puces a recours à 960 Go de RAM LPDDR5X sous forme de 16 modules de mémoire, qui sont également placés sur le module porteur.

Nvidia indique que le taux de transfert de la mémoire est d’environ 1 TByte/s. D’un point de vue mathématique, cela serait possible avec une RAM LPDDR5X-8000 sur 1024 lignes de données – mais selon les arrondis, la fréquence d’horloge pourrait être plus ou moins élevée. Une mémoire LPDDR5X aussi rapide n’existe pas encore, mais la spécification prévoit à l’avenir jusqu’à LPDDR5X-8500.

Un module Grace avec deux puces CPU et 960 gigaoctets de RAM LPDDR5X consomme jusqu’à 500 watts.

Nvidia s’attend à ce que le noyau 144 obtienne 740 points dans le benchmark serveur SPECrate2017_int_base et fonctionne environ 50 pour cent plus vite que les processeurs des systèmes DGX100 actuels. Ces derniers abritent encore deux anciens cœurs Epyc-64 de la génération Rome Zen 2 d’AMD, sortis en 2019.

En attendant qu’Intel présente ses processeurs Rapids Sapphire, c’est Nvidia qui doit le plus se comparer aux processeurs pour serveurs d’AMD. Un seul noyau 64 comme l’Epyc 7763 obtient, selon le degré d’optimisation, 400 à 465 points dans le benchmark SPECrate2017_int_base. Un serveur à double socket atteint plus de 800 points. Deux Epyc 7763 ont une consommation d’énergie commune de 560 watts – la mémoire vient s’ajouter à cela.

Nvidia veut vendre ses propres processeurs Grace surtout avec des accélérateurs Hopper supplémentaires.

(Image : Nvidia)

Cette année, le successeur Genoa avec l’architecture Zen-4 apparaît toutefois. En outre, la famille sœur Bergamo suivra en 2023 avec jusqu’à 128 cœurs de calcul Zen-4c allégés, qui s’engage dans une voie similaire avec des optimisations d’efficacité et avec laquelle Nvidia devra par conséquent se mesurer. La concurrence multicœur d’Intel, sous la forme de Sierra Forest, arrivera en 2024.

Lire aussi

Grace devrait toutefois continuer à se sentir à l’aise dans une niche : L’accélération de l’IA. Un seul noyau de 72 cœurs doit être 10 fois plus rapide que les processeurs actuels d’AMD et d’Intel – il s’agit probablement du traitement de données BFloat16 ou INT8. Les 198 Mo de cache par CPU (396 Mo pour un grace à 144 cœurs) profitent à de tels formats de données. Nvidia devrait en outre s’efforcer de fournir des serveurs complets d’une seule source, sans devoir acheter des CPU à AMD ou Intel.