AccueilActualités informatiqueApple Silicon M1 Max : Apple veut s'attaquer à la GeForce RTX...

Apple Silicon M1 Max : Apple veut s’attaquer à la GeForce RTX 3080 de Nvidia

Avec les nouveaux processeurs « Apple Silicon » M1 Pro et M1 Max, le fabricant s’avance à grands pas sur le territoire des développeurs de puces établis : si le processeur ARM M1 d’Apple s’est attaqué aux processeurs pour ordinateurs portables d’AMD et d’Intel, l’entreprise envoie maintenant une déclaration de guerre avec les successeurs non seulement des équipes de CPU de la concurrence, mais aussi des puces graphiques indépendantes d’AMD et de Nvidia. Le M1 Max est censé être capable de se mesurer au GPU mobile le plus rapide, le GeForce RTX 3080.

À cette fin, Apple ne se contente plus de flasher une unité graphique modérée sur un CPU pour prendre en charge les tâches les plus nécessaires à la production d’images. Dans le M1 Max, les dix cœurs du CPU ARM sont, en comparaison de taille, plutôt un accessoire du GPU, qui se compose de 32 cœurs avec 4096 unités arithmétiques de shader, une puissance de calcul FP32 de 10,4 TeraFlops et un puissant moteur multimédia pour les flux vidéo. Ce dernier accélère les formats ProRes et ProRes RAW propres à Apple ainsi que les formats H.264 et H.265.

Sommaire

Dans plusieurs graphiques, Apple illustre l’efficacité du M1 Max et du M1 Pro avec la moitié du GPU (16 cœurs, 2048 shaders). Le modèle supérieur serait aussi rapide qu’une GeForce RTX 3080 mobile dans une configuration de 95 watts – ce qui correspond à peu près à une GeForce RTX-3060 de bureau – avec une consommation d’énergie de moins de 60 watts. Si la GeForce RTX 3080 mobile est autorisée à consommer environ 160 watts, le M1 Max ne peut pas tout à fait suivre, mais il a alors un net avantage en termes d’efficacité. Sur le papier, le M1 Max pourrait même s’attaquer aux processeurs combinés d’AMD des consoles de jeux actuelles Playstation 5 et Xbox Series X.

Bancs d’essai d’Apple sur le M1 Max et le M1 Pro (10 images)

Comparé à la GeForce RTX 3050 Ti mobile de Nvidia, le GPU du M1 Pro serait tout aussi rapide, mais consommerait 70 % d’énergie électrique en moins. Toutefois, la comparaison n’est juste que dans une certaine mesure, puisque le GPU GeForce de l’ordinateur portable Lenovo testé fonctionne avec 105 watts de plus que le point idéal.
(Image : Apple)

Ces chiffres sont toutefois à prendre avec des pincettes : Apple ne donne aucun détail sur les benchmarks utilisés. En cas de doute, on a utilisé un logiciel qui convient particulièrement bien aux MacBooks. Apple se concentre sur les applications de produits et non sur les jeux en 3D.

Dans le cas du processeur, Apple a essentiellement doublé le nombre de cœurs de performance, qui est passé de quatre à huit, et a en contrepartie réduit de moitié le nombre de cœurs d’efficacité, qui est passé à deux. Dans les applications multicœurs optimisées, la puissance de calcul augmenterait de 70 % par rapport au M1. La configuration à 10 cœurs serait également plus puissante, dans chaque classe de puissance, que les séries Tiger Lake U (15-28 watts) et H (45+ watts) à quatre et huit cœurs d’Intel.

Pour les performances, Apple investit massivement dans le silicium. Le M1 Max et le M1 Pro sont deux systèmes sur puce (SoC) différents qui comptent respectivement 57 milliards et 33,7 milliards de transistors, fabriqués par le fabricant de puces sous contrat TSMC à l’aide de la technologie 5 nanomètres. Même le GPU GA100 de 7 nm le plus complexe de Nvidia pour les centres de données compte moins de transistors que le M1 Max, soit 54 milliards. Le GPU Navi-21 d’AMD dans la Radeon RX 6900 XT compte 26,8 milliards de transistors. Toutefois, la comparaison avec d’autres processeurs combinés est plus juste : le SoC de la série Xbox a une structure beaucoup plus simple avec 15,3 milliards de transistors et, avec une surface de puce de 350 mm², il est beaucoup moins cher à produire dans le processus TSMC 7-nm que les nouvelles variantes M1.

Le site web Andandtech Les estimations des photos montrent que le M1 Max mesure 432 mm² et le M1 Pro environ 246 mm². Les diagrammes révèlent qu’Apple met à l’échelle des blocs CPU et GPU existants et les connecte à une matrice.

M1 Max et M1 Pro (11 photos)

À gauche, le précédent M1 de 2020 avec une surface de puce d’environ 120 mm². Si toutes les puces sont représentées à la même échelle, le M1 Pro a une surface de puce d’environ 256 mm² et le M1 Max d’environ 432 mm².
(Image : Apple)

La puissance de calcul varie en fonction du débit de données disponible. En ce qui concerne le système de mémoire, Apple adopte une approche inhabituelle : alors qu’AMD et Nvidia misent sur la DRAM GDDR6 dans la classe de performance du GPU M1 Max, qui est taillée pour un taux de transfert élevé avec des fréquences d’horloge rapides, Apple utilise des composants LPDDR5 plus efficaces, à faible latence mais plus lents. Pour compenser la faible horloge mémoire, la société élargit l’interface mémoire à 512 bits dans le cas du M1 Max. On parle de 400 GByte/s – une mémoire LPDDR5-6400 avec 409,6 GByte/s non arrondis serait concevable. Le M1 Pro arrive à la moitié de ce chiffre avec 256 bits.

Apple embarque jusqu’à quatre dispositifs LPDDR5 d’une capacité de 64 Go directement à côté du SoC sur le support. Cela permet de raccourcir les trajets des signaux et d’économiser de l’énergie, ce qui augmente l’efficacité. L’inconvénient : la mémoire vive ne peut pas être remplacée – ce qui, toutefois, n’est pas un problème pour Apple et de nombreux ultrabooks depuis des années.

Parallèlement, pour accélérer le processeur combiné, Apple utilise une mémoire cache rapide au niveau du système, composée de cellules SRAM, qui fonctionne de manière similaire à l’Infinity Cache d’AMD sur les cartes graphiques Radeon RX 6000. Ce cache se situe entre les cœurs de traitement et la mémoire vive LPDDR5 et contient des données importantes pour accélérer l’accès. Les clichés de la matrice suggèrent une augmentation significative, peut-être jusqu’à 64 MByte.

Le silicium d’Apple en comparaison

SoC

M1 Max

M1 Pro

M1

Fabrication

TSMC 5 nm

TSMC 5 nm

TSMC 5 nm

Taille

~432 mm²

~246 mm²

~120 mm²

CPU

Cœurs de performance

8

8

4

P cœurs cache L2

24 MByte

24 MByte

12 MByte

Horloge P-Cores

?

?

3,2 GHz

Cœurs d’efficacité

2

2

4

Cache L2 des E-cores

4 MByte

4 MByte

4 MByte

Horloge E-cores

?

?

2,06 GHz

GPU

Cœurs

32

16

8

Shader

4096

2048

1024

Puissance de calcul FP32

10,4 TFlops

5,2 TFlops

2,6 TFlops

Mémoire

Type de RAM

LPDDR5

LPDDR5

LPDDR4X-4266

Interface

512 bits

256 bits

128 bits

Taux de transmission

environ 400 GByte/s

environ 200 GByte/s

68 GByte/s

Cache au niveau du système

Éventuellement 64 MByte

Éventuellement 32 MByte

16 MByte

Plus d'articles