Plongée dans l'architecture AMD RDNA 4 : Une conception monolithique de 64 unités de calcul avec des améliorations globales pour le calcul, le codage-décodage des médias, le ray tracing et l'IA

AMD a offert un aperçu rDNA 4 au CES 2025 et a confirmé l'arrivée des Radeon RX 9070 XT et RX 9070, mais n'a même pas fait une remarque sur la nouvelle architecture lors de la keynote proprement dite.
Cependant, la société a maintenu que plus d'informations sur RDNA 4 et les nouveaux GPU Radeon suivraient bientôt, et c'est ce que nous faisons.
Aujourd'hui, AMD dévoile RDNA 4 et les nouveaux GPU de la série Radeon RX 9070. La série RX 9070 sera officiellement disponible dans les magasins à partir du 6 mars et les tests de performance seront publiés la veille.
AMD RDNA 4 : retour à une conception monolithique
RDNA 4 s'appuie sur les objectifs qu'AMD s'était fixés avec RDNA 3. Selon AMD, RDNA 4 est conçu pour répondre à des charges de travail de jeu plus lourdes, en mettant l'accent sur l'amélioration des performances et de l'efficacité de la trame.
Il y a également les améliorations habituelles apportées aux pipelines de ray tracing, ainsi qu'une attention renouvelée aux capacités de l'IA et à l'encodage/décodage des médias.
Top 10
» Le Top 10 des PC portables multimédia
» Le Top 10 des PC portables de jeu
» Le Top 10 des PC portables de jeu légers
» Le Top 10 des ordinateurs portables bureautiques
» Le Top 10 des PC portables bureautiques premium/professionnels
» Le Top 10 des Stations de travail mobiles
» Le Top 10 des Ultraportables
» Le Top 10 des Ultrabooks
» Le Top 10 des Convertibles
» Le Top 10 des Tablettes
» Le Top 10 des Tablettes Windows
» Le Top 10 des Smartphones
» Le Top 10 des PC Portables á moins de 300 euros
» Le Top 10 des PC Portables á moins de 500 euros
» Le Top 25 des meilleurs écrans d'ordinateurs
RDNA 3 a vu l'avènement d'un design chiplet pour les GPU, inspiré des processeurs Ryzen. Ici, nous avons vu la séparation des matrices de cache mémoire (MCD) de la matrice de calcul graphique (GCD).
Avec RDNA 4, cependant, AMD revient à la conception monolithique traditionnelle. Les composants sont essentiellement les mêmes, mais il n'y a pas d'interconnexions MCD-GCD car la mémoire et le calcul sont désormais directement interfacés par l'Infinity Cache.
Le GPU RDNA 4, la Radeon RX 9070 XT dans ce cas, comprend quatre moteurs de shaders avec huit processeurs de groupe de travail (WGP) chacun. Chaque WGP comprend un total de huit unités de calcul (CU) pour un total de 64 CU.
AMD affirme que les nouvelles unités de calcul sont plus performantes que jamais et permettent d'améliorer le ray tracing, de doubler le débit maximal, de prendre en charge les dernières capacités d'accélération matricielle et d'élargir la prise en charge des formats numériques.
La nouveauté de l'unité de calcul RDNA 4, que nous avons déjà vue avec les cœurs Tensor de l'architecture Ampere de Nvidia, est la prise en charge de la sparsité structurée, qui permet d'accélérer les opérations matricielles, en particulier dans les cas où de nombreux poids sont nuls.
Des améliorations sont également apportées au sous-système de mémoire. Le cache L2 passe de 6 Mo dans le RDNA 3 à 8 Mo dans le RDNA 4, tandis que le cache Infinity passe à la 3e génération, mais passe de 96 Mo dans le RDNA 3 à 64 Mo.
AMD continue de s'appuyer sur la mémoire GDDR6 avec la nouvelle génération. La RX 9070 XT et la RX 9070 offrent toutes deux une interface mémoire GDDR6 384 bits de 16 Go cadencée à 20 Gbps pour une bande passante effective de 640 Go/s. Ce chiffre est bien inférieur à celui de la RX 9070 XT. C'est beaucoup moins que la bande passante de 960 Go/s offerte par RDNA 3, mais AMD affirme que les spécifications de la mémoire vidéo de RDNA 4 ont été choisies avec soin pour prendre en charge les titres actuels et futurs.
Amélioration du moteur de média et de la prise en charge de la mesure de l'inversion matérielle
L'encodage vidéo était l'un des principaux problèmes du RDNA 3, et AMD promet des améliorations significatives à cet égard. La société promet des améliorations majeures dans l'encodage H.264 et AV1 et moins d'artefacts de blocage pour la même quantité de données.
Les améliorations s'étendent également au décodage vidéo, avec une consommation d'énergie réduite et des performances accrues lors du décodage de formats tels que AV1 et VP9.
Le moteur d'affichage Radiance consomme désormais beaucoup moins d'énergie dans les configurations FreeSync à deux moniteurs. Autre nouveauté : la prise en charge de la file d'attente matérielle dans le modèle de pilote d'affichage Windows (WDDM) 3.0 pour la lecture vidéo.
Cela permet de libérer les ressources du processeur en déchargeant le GPU de la planification des images. La technologie MFG (multi-frame generation) des GPU Nvidia Blackwell s'appuie également sur le hardware flip metering.
Aperçu de l'unité de calcul RDNA 4
Au départ, la structure d'une CU RDNA 4 n'est pas très différente de celle de RDNA 3. Cependant, les performances et l'efficacité de chacun des composants de la CU ont été améliorées.
Les opérations WMMA (Wave Matrix Multiply Accumulate) ont été améliorées pour répondre aux exigences du nouveau matériel. Les unités de mise à l'échelle sont mises à niveau pour traiter les opérations Float32. L'ordonnanceur peut diviser et traiter une charge de travail de calcul importante en barrières divisées et nommées.
AMD indique que RDNA 4 est conçu pour répondre aux nouvelles techniques de rendu que les développeurs utilisent dans les jeux d'aujourd'hui. Alors que l'upscaling est en vogue, l'efficacité du path tracing nécessite l'accélération ML dans le cadre du processus de rendu lui-même et non pas après coup.
Accélérateurs de rayons dans RDNA 4
RDNA 4 offre 64 accélérateurs de rayons de troisième génération dans le RX 9070 XT. La structure d'un accélérateur de rayons dans RDNA 4 est similaire à celle de RDNA 3, mais comprend un moteur d'intersection supplémentaire permettant de multiplier par deux le nombre d'unités de boîtes de rayons et de triangles de rayons.
Il y a également un transformateur de rayon matériel dédié qui évite d'utiliser les instructions du shader pour faire le travail, minimisant ainsi la surcharge de la traversée des rayons. Une mémoire de 128 Ko dans chaque unité de calcul double permet de contenir la pile de rayons pour des opérations de poussée et de tri efficaces.
RDNA 4 introduit le concept de boîtes de délimitation orientées (OBB) qui aligne les boîtes de délimitation BVH sur la géométrie, minimisant ainsi les interactions faussement positives des rayons dans ce qui n'est sinon qu'un espace vide dans une boîte. AMD affirme que cette approche peut améliorer les performances de traversée des rayons jusqu'à 10 %.
Autre nouveauté, la prise en charge des demandes de mémoire hors ordre, qui réduit efficacement le temps d'attente pour les ondes qui n'ont pas atteint le cache de haut niveau plus tôt. Cela améliore non seulement le traçage de rayons, mais aussi d'autres charges de travail.
Dans RDNA 4, les shaders peuvent allouer dynamiquement des registres qui permettent d'accueillir plus de vagues en vol avec une latence mémoire améliorée.
Traçage du chemin avec RDNA 4
Les cartes AMD ont eu du mal avec le ray tracing en général, donc le path tracing semblait hors de l'équation, même avec les cartes RDNA 3 haut de gamme. RDNA 4 vise à changer cela avec la prise en charge de la mise en cache de la radiance neuronale ainsi qu'un nouveau modèle de suréchantillonnage et de débruitage neuronal.
AMD n'a pas fourni de chiffres de performances exacts pour les titres compatibles avec le path tracing, mais nous devrions en avoir une idée lors de l'examen de ces cartes.
Capacités d'IA basées sur Radeon et Instinct
AMD a déclaré que RDNA 4 comporte des pipelines mathématiques dédiés à l'accélération ML, axés sur la haute performance avec des types de données plus étroits. La nouveauté de RDNA 4 est la prise en charge de FP8 et BF8 pour une inférence de haute performance et de haute précision.
Lors de la démonstration de la génération d'images SDXL 1.5, AMD a montré comment la Radeon RX 9070 XT basée sur RDNA 4 offre deux fois plus de performances FP16 par unité centrale que la RX 7900 XT basée sur RDNA 3.
FSR 4, qui est un pipeline de bout en bout formé sur les GPU AMD, exploite les nouvelles capacités d'IA de RDNA 4. FSR 4 utilise FP8 pour une utilisation optimale de la bande passante, des performances et de la puissance.
AMD a montré des améliorations allant jusqu'à 3,7 fois le nombre d'images par seconde avec FSR 4 lorsqu'il est associé à l'interpolation d'images et à Radeon Anti-Lag, tout en conservant une qualité d'image élevée.
Source(s)
Communiqué de presse AMD